數位發展部部長唐鳳致詞時指出,「信任科技(Trusted Technology)在今日是非常重要的議題,因為現在很多資料量龐大的AI模型,裡面的資料多可以用來進行多元創新,但必須確保這些資料是非個資數據(non-personal data),才能保證隱私安全。而要做到隱私強化,法規面、技術面都要建立機制,其中隱私強化技術的概念,就是透過技術方法,降低直接利用原始資料所衍生的風險,同時保有數據可用性。如此一來,不論是在商業、科學、醫療、程式規劃中,一旦確保資料沒有隱私上的風險,就可以發揮它的價值,對個人和世界都有貢獻,

以PETs彌補信任的缺口

談起PETs,A*STAR新加坡科學研究局首席科學家Jin Chao在主題演講中提到,數據在傳輸、儲存與運算的不同階段,都有其相對應的風險。過往,大家會使用傳統的進階加密標準(AES)來對儲存的數據進行加密,以及利用安全通訊技術SSL/TLS來對傳輸數據進行保護,如今要達到更大的安全,還會使用到各種PETs,像是以密碼學方法形成的加密技術,如同態加密(HE)與安全多方運算(MPC);或是在硬體上面下功夫,如可信執行環境(Trusted Execution Environment,TEE)技術,就是在不可信的運算服務器上,形成一個隔離區域。還有統計的方法,如差分隱私技術,即在數據上添加雜訊,來隱藏原始資訊,達到資安的目的。

以色列加密演算法新創Chain Reaction技術長Oren Yokev也從技術層面來論述,「信任的缺口」如何被補全。他表示,各種機構必須在使用數據與隱私方面做一個取捨,但取捨有困難,所以最好的方法利用一些PET技術來彌補缺口。對此,Chain Reaction希望透過零信任的隱私保護,讓信任議題不需要存在。

Oren Yokev認為,雖然今日的加密法在保護靜態數據與傳輸數據已經做得不錯,但是隨著AI、機器學習、深度學習、LLM等技術使用的數據越來越多,很難分辨哪些事私人數據那些不是,所以需要更強大的隱私保護技術,像是零知識證明(ZKP)、安全多方運算(SMPC)、完全同態加密(FHE)等。這些技術需要更強大的運算能力,是以Chain Reaction研發一個隱私處理器3PU(Privacy Preserving Processing Unit),如果以CPU處理速度是1個X來計算,3PU處理速度是10萬X甚至超過,也遠高於GPU的100X或200X。

PETs在新加坡、日本的應用趨勢

就PETs的應用趨勢而言,Jin Chao提到,聚焦隱私保護運算與數位信任議題,A*STAR最近推出的數位信任計畫,目標是要在醫療組織與一般公司企業之間,以數位信任技術來實現可信的數據協作。其中一項安全雲端運算的創新應用,採取HE方式將數據加密,再將數據傳輸到雲端進行AI推論,得出一個被加密的推論結果,再傳輸回使用者,由使用者解密以取得最後結果,如此可對醫療數據進行有效的隱私保護。

日本明治大學數學科學學院教授兼副院長Hiroaki Kikuchi呼應Jin Chao談到的醫療應用指出,PETs技術在日本的商業應用上相當廣泛,尤其在醫療領域。目前,日本處理匿名化個資的公司有300家,其中很多是處理醫院與健康保險領域的個人資訊,例如,住友生命保險sumitomo透過這些公司取得使用者資訊,可了解用戶健康狀況,作為保險費折扣的依據。

Hiroaki Kikuchi另外提到,日本也有個資情報銀行(Personal Data Trust Bank),為資料需求者與提供者提供交換機制的服務,還有日本政府於2018年推出的次世代醫療基盤法,已經加入的三家機構包括LDI(Life Data Initiative)、J-MIMO(Japan Medical Association)與FAST-HDJ(Anonymized Scandalized Health Data)專門為醫療體系提供匿名個資。

深論PETs—差分隱私、全同態加密

下午場次的接續登場的「技術創新」論壇中,多位專家深入談論PETs。首先,陽明交通大學電機工程學系副教授游家牧 提到,由深度神經網絡作成的AI需要非常多有價值的資料,才能訓練出非常有用的AI模型,但價值資料可能跟人有關,受限於個資法、GDPR保護,要將這些隱私資料合法釋出,得有好的方法,其中一種「差分隱私(Differential Privacy),是在原始想隱藏的資料合成其他資訊,然後賦予新的性質,即可達到隱私保護,現在美國政府與Facebook都已經這樣運用。

國立臺灣師範大學資訊工程學系副教授紀博文則談到「同態加密」技術,他表示,當人們使用雲端服務簽署合約時,就代表同意把資料交給其他人進行運算,因而有個資外洩的疑慮,這時需要對資料進行加密,過往一般加密技術容易被解密,因此現在大家試圖使用全同態加密技術,來兼顧加值服務的便利性與使用者隱私的安全性。

國立中山大學資訊工程學系助理教授徐瑞壕則提到「聯合學習」。他指出,透過不只使用單一技術來進行隱私保護的「聯合學習」,可以實現更好的數據共享與跨域協作。另外,帝潤智慧科技產品經理吳杰翰提到該公司的人臉辨識系統DeCloakFace,該系統具有去識別化特性且導入差分隱私技術,可以保有很好的辨識率同時,加強隱私強化。

在隱私安全中加速發展多元應用

在運用PETs進行多元創新應用上,目前在醫療領域的創新,受到的矚目最大。徐瑞壕舉例,「聯合學習」在醫療領域的應用已非常多,例如,國際大廠NVIDIA與跨國20間醫院共同進行聯合式學習,訓練醫療相關的模型。

電信技術中心資通安全組副主任嚴貽忠也提到,目前「聯合學習」較多應用在醫療領域,因為醫療數據不能流出醫院,所以要在醫院裡做本地機器學習,而透過聯合學習匯整成大的模型,可增加機器學習的可用性。

臺北榮民總醫院醫療人工智慧發展中心副主任楊智傑也表示,在共享資料庫上大家都期待可以跟其他學研單位或醫院,甚至是與國際單位做聯邦學習的合作。只是聯邦學習固然可以透過不同醫院的資料集,建立一個聯邦學習模型,但是聯邦學習模型訓練還有很多問題要克服,例如相較於把資料全部集中在一起分析,聯邦學習模型的訓練,是否可以做的一樣好、甚至更好。

醫療領域之外,國家資通安全研究院資料架構總顧問方怡婷提到的車聯網應用,例如,透過聯邦式學習做成資料協作,可以讓車流預測更精準,或是使用安全多方運算或同態加密技術達到多方協作,在保護隱私安全之下創新智慧交通應用。

總的來看,要將數據運作於更多領域,台灣必須在加強PETs應用多所努力,確保達到多元創新的同時又保障隱私,如此才能讓個人或相關資料持有者,都更願意把數據捐獻出來,達成社會共好,一同為台灣邁向數位國家而努力。