26

參加人數

議題提供單位

「資訊科技創新研究中心」(Research Center for Information Technology Innovation, 簡稱 CITI) 的設立在於推展資訊科技的創新及應用,著重於關鍵性的資訊通訊技術之研發,以及跨領域的資訊科技之整合、未來資通訊科技技術及政策的研究,以求對現今知識經濟及服務經濟體系裡的發展有進一步提升的作用,同時也致力於創意發展,為人力資源儲備能量,維繫並提升我國總體的國際競爭力。

簡介

由於開放資料與深度學習的興起,產官學等各領域對資料需求甚多,但是有價值的資料通常伴隨著敏感訊息;譬如健保署的健保資料庫即是最廣為人知的例子。因此,在個資法的限制之下,有非常多的資料庫只能束之高閣而不能為大眾所用。資料去識別化是一類將資料去除個人隱私訊息的資訊工具,其旨在於移除資料中的個人敏感資訊但是又盡可能不損傷到資料本身所帶有的資訊內容 (或又稱為資料可用性)。經去識別化後的資料將可擺脫個資法的限制而能在大眾之間流通。而資料去識別化技術目前與加解密技術不同的是尚未有類似AES、RSA等通用演算法面世,因此雖然在學術領域已經有多項具前景的技術被提出,仍有待實務上的檢驗。最有效力的檢驗莫過於直接對已經去識別化後的資料進行重新再識別,試圖藉由蛛絲馬跡來還原出去識別化前存在於資料內的敏感資訊。

因此,本競賽將讓各隊參賽隊伍進行資料去識別化與重新識別的攻防。更具體來說,將讓各隊伍去識別化同一份資料,並讓每個隊伍都試圖對其他各隊已經去識別化後的資料進行重新識別。

最終本競賽將以 (a) 去識別化後資料的資料可用性以及 (b) 去識別化後資料被重新識別的隱私性來做評判名次,獲獎隊伍將安排於 TANET 2023 研討會進行頒獎典禮及競賽心得發表。

 

 

獎項

  • 第一名 獎金5萬元
  • 第二名 獎金3萬元
  • 第三名 獎金1萬元

 

 

活動時間

TimeEvent

即日起 - 2023.09.28

  • 活動報名

2023.09.29 - 10.01

  • 競賽規則及注意事項 E-mail 通知

第一階段

2023.10.02 08:00 - 10.05 23:59

  • 執行資料下載程式,取得資料集B.csv

2023.10.02 08:00 - 10.05 23:59

  • 上傳去識別化資料集D.csv

第二階段

2023.10.06 12:00 - 10.11 10:00

  • 下載被攻擊資料集C.csv

2023.10.06 12:00 - 10.11 10:00

  • 上傳攻擊結果資料E.csv

2023.10.11 16:00前

  • 公布成績

成果發表

2023.11.01 14:00 - 16:00

  • 競賽頒獎及心得發表

 

註:主辦單位保留變更活動內容及時程的權利

 

評估標準

第一階段:計算資料集D的【可用性評估】

第二階段:計算資料集C被攻擊後的【隱私性分數】

請參閱附件 〝資料去識別化與重新識別攻防競賽規則_2023.pdf〞

 

規則

  • 本競賽公開報名,參賽資格以就讀國內大專院校在學學生為限。

  • 參賽人數:每個團隊最多可以包含3名團隊成員。(請填寫表格報名上傳,請參閱附件〝資料去識別化與重新識別攻防競賽規則_2023.pdf〞)

  • 本競賽不允許團隊合併。

  • 第一階段成績與排行榜為即時公開。第二階段成績在競賽結束後公布成績。兩階段成績總和為最終成績。

  • 第一階段截止日期前允許多份提交,但每日最大允許提交次數為2次。系統將以最後一份為最終評分。

  • 第二階段截止日期前允許重複提交不限次數,系統最後一份為最終評分。

  • 獲獎參賽隊伍需出席頒獎典禮及心得發表。

  • 參賽作品所使用之資料、技術與程式碼,均屬參賽者之原創或已取得合法授權,若有任何第三者主張侵害智慧財產權或其他違法情事,均由參賽者自行出面處理;若有侵害他人智慧財產權之情事者,主辦單位將取消競賽及得獎資格,參賽者應自行負擔相關法律責任。

  • 參賽成果之智慧財產權歸屬參賽者擁有,其著作授權、專利申請、技術移轉及權益分配等相關事宜,應依相關法令辦理。

  • 主辦單位有權對參賽者進行成績查驗相關措施。

  • 不同帳號禁止交流答案,違者視同舞弊。若活動發生舞弊行為,則舞弊之參賽者將被取消參加資格,依排名遞補。

  • 禁止使用任何人工方式作答。

  • 未來如有任何爭議,主辦單位將保留最終決定權。

  • 主辦單位有權因需要調整賽程及相關規定。

  • 參賽隊伍報名表、比賽進行及計分方式請參閱附件〝資料去識別化與重新識別攻防競賽規則_2023.pdf〞。