隱私計算,“以數(shù)易數(shù)”打響數(shù)據(jù)安全保衛(wèi)戰(zhàn)
- 來源:智能制造縱橫 smarty:if $article.tag?>
- 關(guān)鍵字:隱私,計算,數(shù)據(jù)安全保衛(wèi)戰(zhàn) smarty:/if?>
- 發(fā)布時間:2022-04-29 20:39
新冠疫情肆虐全球,催化各行業(yè)加速數(shù)字化轉(zhuǎn)型,數(shù)據(jù)的價值在進一步凸顯。
數(shù)據(jù)安全保衛(wèi)戰(zhàn)拉開新序幕
伴隨著數(shù)據(jù)的大量爆發(fā),數(shù)據(jù)泄露成為最大的潛在安全隱患,事故頻發(fā)。今年央視3•15晚會再次聚焦APP合規(guī)話題,APP過度索權(quán)、數(shù)據(jù)泄露等都是目前危害信息安全的常見問題。晚會首次設立了“3•15信息安全實驗室”,這標志著數(shù)據(jù)合規(guī)工作不再僅限于手機APP,已經(jīng)從手機端拓展到智能手表、智能家電、IoT設備等方面。
數(shù)據(jù)流通是釋放數(shù)據(jù)價值的關(guān)鍵環(huán)節(jié),既要應用數(shù)據(jù),又要保護數(shù)據(jù)安全。因此如何兼顧發(fā)展和安全,平衡效率和風險,在保障安全的前提下發(fā)揮數(shù)據(jù)價值,是當前面臨的重要課題。隱私計算在此背景下應運而生,為數(shù)據(jù)流通提供了解決方案。
隱私計算以多方安全計算、聯(lián)邦學習、可信執(zhí)行技術(shù)等為基礎(chǔ),為流通過程中數(shù)據(jù)的“可用不可見”提供了解決方案,確保原始數(shù)據(jù)在計算和分析時的安全性和私密性,目前已在醫(yī)療、政務、金融、酒店、民航、招聘等領(lǐng)域開始推廣應用。隱私計算市場正以前所未有的速度增長,根據(jù)CIC灼識咨詢的測算,2020年中國隱私計算市場規(guī)模接近4億元,到2025年將達到120億元,2020年-2025年年復合增長率近100%。隨著金融、醫(yī)療、政務等各個場景落地,隱私計算將在2030年有望達千億市場規(guī)模。
“可用不可見”
隱私計算是指在保護數(shù)據(jù)本身不對外泄露的前提下實現(xiàn)數(shù)據(jù)分析計算的一類信息技術(shù),是數(shù)據(jù)科學、密碼學、人工智能等眾多技術(shù)體系的交叉融合。從技術(shù)角度解釋,目前的“隱私計算”是指使用可信執(zhí)行環(huán)境、安全多方計算、同態(tài)加密、零知識證明、差分隱私、聯(lián)邦學習等系統(tǒng)安全和加密技術(shù)。
隱私計算目前有三種主流技術(shù):以密碼學技術(shù)為主的多方安全計算;以可信硬件領(lǐng)域為主的可信執(zhí)行技術(shù);基于以上兩種技術(shù)路徑衍生出的聯(lián)邦學習。
1、多方安全計算
多方安全計算的核心是根據(jù)加密原理設計特殊的加密算法和協(xié)議,確保輸入數(shù)據(jù)的獨立性、傳遞數(shù)據(jù)的準確性、計算過程的正確性,同時不能將個人的隱私數(shù)據(jù)泄露給其他參與者,每個參與者不能從其他參與者那里得到任何輸入的信息,只能得到計算結(jié)果。技術(shù)原理:多方安全計算的實現(xiàn)包含多個關(guān)鍵的底層密碼學協(xié)議或框架,被分為不經(jīng)意傳輸、混淆電路、秘密分享。
多方安全計算具有較高的安全性,要求敏感的中間計算結(jié)果不被泄露,其可信性和性能在各種研究中不斷提高,可在基金、征信、供應鏈金融等場景中實際應用。
2.可信執(zhí)行環(huán)境
可信執(zhí)行環(huán)境(TEE)的核心是通過軟硬件方法在中央處理器中構(gòu)建一個安全區(qū)域,保證其內(nèi)部加載的程序和數(shù)據(jù)在機密性和完整性上得到保護。數(shù)據(jù)計算只在這種安全的環(huán)境中進行,這是通過依賴可信的硬件來保證數(shù)據(jù)安全??尚艌?zhí)行環(huán)境最基本的屬性是隔離,它通過芯片等硬件技術(shù)保護數(shù)據(jù),并與上層軟件協(xié)作,同時保持與系統(tǒng)運行環(huán)境的計算能力共享。
技術(shù)原理:將系統(tǒng)的硬件和軟件資源分為可信執(zhí)行環(huán)境和普通執(zhí)行環(huán)境,并使兩種環(huán)境安全隔離,且具有獨立的內(nèi)部數(shù)據(jù)路徑和計算所需的存儲空間。公共執(zhí)行環(huán)境中的應用程序無法訪問可信執(zhí)行環(huán)境。即使在可信執(zhí)行環(huán)境中,多個應用程序彼此獨立運行,未經(jīng)授權(quán)也不能相互訪問。
可信執(zhí)行環(huán)境的通用性高,開發(fā)難度低,在通用計算和復雜算法的實現(xiàn)上更加靈活,適用于數(shù)據(jù)保護要求不是特別嚴格的場景,如區(qū)塊鏈、公司安全等。
3.聯(lián)邦學習
聯(lián)邦學習的核心是分布式機器學習,通過中間加密數(shù)據(jù)的循環(huán)和處理來實現(xiàn)多方聯(lián)合機器學習訓練,而不需要將本地原始數(shù)據(jù)存儲在數(shù)據(jù)庫中。保障大數(shù)據(jù)交換時的信息安全、保護終端數(shù)據(jù)和個人數(shù)據(jù)隱私、保證合法合規(guī)的前提下,在多參與方或多計算結(jié)點之間開展高效率的機器學習。
技術(shù)原理:聯(lián)合學習的目標是實現(xiàn)聯(lián)合建模,在不聚合參與者原始數(shù)據(jù)的情況下保護終端數(shù)據(jù)的隱私。根據(jù)數(shù)據(jù)集類型的不同,聯(lián)邦學習分為橫向聯(lián)邦學習、縱向聯(lián)邦學習與聯(lián)邦遷移學習。
聯(lián)邦學習實際上是一種加密的分布式機器學習技術(shù),所有相關(guān)方都可以一起構(gòu)建模型,而無需公開底層數(shù)據(jù)和底層數(shù)據(jù)的加密(混淆)形式。它可以實現(xiàn)在不違反數(shù)據(jù)隱私規(guī)則的情況下建立虛擬共享模型,適用于小微企業(yè)的金融服務、醫(yī)療、零售等場景。
以上三種是隱私計算的主要實現(xiàn)途徑和技術(shù),其中多方安全計算具備較高的安全性,但是僅支持一些相對簡單的運算邏輯;可信執(zhí)行環(huán)境技術(shù)具備更好的性能和算法適用性,但是對硬件有一定依賴性;聯(lián)邦學習技術(shù)則可以解決復雜的算法建模問題,但是性能存在一定瓶頸。
隱私計算行業(yè)格局初現(xiàn)
近年來,隱私計算已從小眾“圈子”發(fā)展成亮眼的新興行業(yè),更成為商業(yè)世界和資本競逐的熱門賽道,國際知名企業(yè)開發(fā)了許多相關(guān)的平臺。從目前國外影響力較強的隱私計算開源項目來看,主要有OPEN MIND、Google、Facebook、Intel等玩家。
•OPEN MIND:OPEN MIND在2017年作為全球首家開發(fā)隱私計算系統(tǒng)(PySyft)的玩家,主要運用于多方位計算、聯(lián)邦學習。PySyft是一個靈活、易用的庫,能夠?qū)ι疃葘W習模型進行私有和安全計算,用于安全和隱私深度學習的Python庫,它在主流深度學習框架(例如PyTorch和TensorFlow)中使用聯(lián)邦學習,差分隱私和加密計算(例如多方計算(MPC)和同態(tài)加密(HE))將隱私數(shù)據(jù)與模型訓練分離。能夠應用到移動終端機器學習、人工智能、數(shù)據(jù)中心、消費電子、內(nèi)存安全等場景。
•Google:Google在2018年發(fā)布了保密計算開源框架Asylo,支持在可行執(zhí)行環(huán)境(TEE)中開發(fā)高安全性的云端和容器應用。2019年陸續(xù)開發(fā)了TFF(TensorFlow Federated),用于聯(lián)邦機器學習和多源數(shù)據(jù)聯(lián)合計算的開源框架。
TFF提供了一個靈活的、開放的框架,以及兩個不同層次的API,即聯(lián)邦學習(FL)API和聯(lián)邦核心(FC)API。通過FL API,用戶可以對現(xiàn)有的TensorFlow模型進行FL或評估,而無需研究FL算法的細節(jié)。但是,目前發(fā)布的最新版本的TFF只支持橫向FL,沒有底層的隱私技術(shù)(如HE、MPC和DP)來保護數(shù)據(jù)安全。因此,TFF只適合實驗測試和模擬,無法在真實環(huán)境中部署。此外,TFF只支持單機模擬多機訓練模型,而不能支持集群部署。•Facebook:CrypTen是Facebook在2019年10月推出的隱私計算框架,用于多方安全計的框架。其底層依賴于深度學習框架PyTorch。CrypTen目前實現(xiàn)了安全的多方計算,并將在未來增加對同態(tài)加密和安全區(qū)域的支持。它允許對加密數(shù)據(jù)進行計算,同時保護隱私。CrypTen將PyTorch平臺與能夠有效處理加密數(shù)據(jù)的算法和系統(tǒng)的長期學術(shù)研究聯(lián)系起來。目前能夠應用到通訊軟件、移動支付、人工智能、數(shù)據(jù)中心、消費電子等場景。
•Intel:2013年,Intel推出SGX(Software Guard Extensions)可信執(zhí)行環(huán)境隱私計算技術(shù)。
SGX是一組用于增強應用程序代碼和數(shù)據(jù)安全性的指令,開發(fā)者使用SGX技術(shù)可以把應用程序的安全操作封裝在一個被稱之為Enclave的容器內(nèi),保障用戶關(guān)鍵代碼和數(shù)據(jù)的機密性和完整性。SGX最關(guān)鍵的優(yōu)勢在于將應用程序以外的軟件棧如OS和BIOS都排除在了Trusted Computing Base(TCB)以外,一旦軟件和數(shù)據(jù)位于Encalve中,即便是操作系統(tǒng)和VMM(Hypervisor)也無法影響Enclave里面的代碼和數(shù)據(jù),Enclave的安全邊界只包含CPU和它本身。能夠廣泛應用到人工智能、數(shù)據(jù)中心、消費電子、通訊網(wǎng)絡、物聯(lián)網(wǎng)、智能汽車、內(nèi)存安全等場景。
目前,隱私計算正處于發(fā)展早期,但已然成為數(shù)據(jù)安全新藍海。在元宇宙、物聯(lián)網(wǎng)等數(shù)據(jù)爆發(fā)的背景下,產(chǎn)生巨量數(shù)據(jù)處理需求,隱私計算技術(shù)的商業(yè)市場令人期待,并且,在隱私計算市場逐漸成熟后,人工智能、分布式賬本、邊緣計算等新技術(shù)將與其融合發(fā)展,隱私計算賽道的潛力不言而喻。
