競賽

結束

資料去識別化與重新識別攻防競賽 2023

由於開放資料與深度學習的興起,產官學等各領域對資料需求甚多,但是有價值的資料通常伴隨著敏感訊息;譬如健保署的健保資料庫即是最廣為人知的例子。因此,在個資法的限制之下,有非常多的資料庫只能束之高閣而不能為大眾所用。資料去識別化是一類將資料去除個人隱私訊息的資訊工具,其旨在於移除資料中的個人敏感資訊但是又盡可能不損傷到資料本身所帶有的資訊內容 (或又稱為資料可用性)。經去識別化後的資料將可擺脫個資法的限制而能在大眾之間流通。而資料去識別化技術目前與加解密技術不同的是尚未有類似AES、RSA等通用演算法面世,因此雖然在學術領域已經有多項具前景的技術被提出,仍有待實務上的檢驗。最有效力的檢驗莫過於直接對已經去識別化後的資料進行重新再識別,試圖藉由蛛絲馬跡來還原出去識別化前存在於資料內的敏感資訊。因此,本競賽將讓各隊參賽隊伍進行資料去識別化與重新識別的攻防。更具體來說,將讓各隊伍去識別化同一份資料,並讓每個隊伍都試圖對其他各隊已經去識別化後的資料進行重新識別。最終本競賽將以 (a) 去識別化後資料的資料可用性以及 (b) 去識別化後資料被重新識別的隱私性來做評判名次,獲獎隊伍將安排於 TANET 2023 研討會進行頒獎典禮及競賽心得發表。  

2023-09-17T16:00:00+00:00 ~ 2023-10-11T15:00:00+00:00