participants / team
IKMLab,智慧型知識管理實驗室 (Intelligent Knowledge Management Lab),成立於 2004 年,指導教授為高宏宇教授,目前有 7 位博士生,以及 14 位碩士生。實驗室研究方向以自然語言處理 (Natural Language Processing),資料探勘 (Data Mining) 以及機器學習 (Machine Learning) 為主,利用智慧運算方法進行非結構化資料的分析與理解,使文字與語言應用能夠更智慧化更實用化。
主要研究議題包含自然語言處理與理解,醫學資訊分析,使用者生成資料分析,情緒分析與意見探勘,對話機器人以及假資訊偵測等。
國立成功大學創校於西元1931年,原名為「臺南高等工業學校」,在1971年8月,改制為「國立成功大學」。成功大學共有9個學院,由相互緊鄰的八大校區組成,同時擁有安南校區、歸仁校區與斗六校區,其中共有40個學系、82個研究所、1所教育中心及54個獨立研究中心,是高等教育中歷年全國學術排名頂尖的大學之一,在理工、醫學及規劃設計領域上最為出眾,培育出眾多頂尖的學者與優秀人才,是台灣最具有影響力的學校之一。
成大資訊工程學系是南台灣第一個純以資訊及計算機工程為重心的高級學術單位,於1987年成立碩士班、1992年成立博士班、並在1997年成立大學部,擁有醫學資訊研究所和製造資訊與系統研究所,以一系三所的模式成長。
本系致力提升南台灣地區資訊人才質與量的競爭力,結合國內產官學研之各項資源,將本系與國際接軌,目前已有多位教授獲得學術榮譽如國科會傑出研究獎等獎項,預計在五年內學生總數將達到一千名,師資將增至四十名以上,並擴建教學教室、實驗室等空間,建立南台灣最佳及最具規模的資訊工程教育環境。
各位好,主辦方在此提醒各組參賽者一件事情: 此次競賽的後測表單出爐,請各組參賽者們協助填寫,供主辦方了解各位的學習狀況。 後測表單:https://reurl.cc/5q0Qzv
各位好,主辦方在此提醒各組參賽者: 報告上傳截止時間為 12:31 (四) 23:59,需要上傳完成才會有完賽證明,請各組參賽者務必準時上傳。
各位好,這裡是主辦方: 關於之前上傳資料期限延後一週,主因是由於 AI Cup 競賽時程會盡量配合學校的學期時程,由於因應老師教學上的期望,以及眾多隊伍的需求,主辦方也在徵求計畫辦公室的同意下將上傳日期延後一週, 報告上傳時間照舊,因此若造成參賽隊伍的不便,主辦方在此致歉,也請各位參賽者多多見諒。
各位好,主辦方在此提醒各組參賽者: 由於因應眾多隊伍需求,以及配合大多學校的課程,此次競賽上傳時間將有異動如下: 最後上傳時間由 12/21(一) 延後至 12/28(一) 公布系統分數由 12/25(五) 延後至 12/30(三) 報告上船截止時間照舊為 12/31(四) 請各位參賽者注意,謝謝。
各位好,主辦方在此提醒各組參賽者幾件事情: 1. 主辦方會在 12/14(一)10:00 釋出測試集並開放上傳功能 2. 12/13(日) 23:59 報名及組隊將停止,屆時也將清空排行榜
各位好,主辦方在此提醒各組參賽者一件事情: 關於最終報告上傳,需要繳交的內容大致如下 1. 隊名、隊員(學校/科系)、指導教授(學校/科系) 2. 演算法說明 3. 工具說明 4. 流程說明 5. 組態說明 (e.g.環境設定、參數設定) 6. 外部資源與參考文獻
各位好,主辦方在此提供各位參賽者巡迴課程的資料 內含:三份簡報以及上課影片,提供給未參加的參賽者們參考 課程影片:https://youtu.be/jIEKUtI32OM 連結網址:https://reurl.cc/GrYn2y
各位好,主辦方在此提醒各組參賽者幾件事情: 1. 主辦方會在 11/10(二) 釋出第二波訓練集及建構集,第二波釋出均包含之前所釋出的資料 2. 排行榜計分會運作至 11/9(一) 23:59,此時將暫停算分至隔日釋出新的資料,屆時也將清空排行榜 3. 從 11/10(二) 開始,排行榜將會是第二波建構集的計分,請大家踴躍上傳
各位好,主辦方在此提醒各組參賽者一件事情: 此次競賽的前測表單出爐,請各組參賽者們協助填寫,供主辦方了解各位的學習狀況。 前測表單:https://reurl.cc/r8X1RZ
各位好,主辦方在此提醒各組參賽者幾件事情: 我們發現當「答案全錯」或「答案結果不合理」會出現無法上傳的狀況,預計會於下周一修正完畢,屆時可正常上傳。
各位好,主辦方在此提醒各組參賽者幾件事情: 1. 主辦方並不會參與任何排行榜,因此排行榜上的均為其他參賽隊伍 2. 政大場巡迴課程即將開始,報名表單:https://reurl.cc/9Xn45Y,歡迎踴躍報名
各位好,主辦方在此提醒各組參賽者幾件事情: 1. 最終若有同分狀況,會由評審委員根據答案內容以及報告進行決議 2. 上傳格式說明有誤,end_position 正確為「標記結果的最後一個字 + 1」的位置,主辦方會於稍後更正格式說明文件
根據 Health Insurance Portability and Accountability Act (HIPAA) 規定,在臨床醫療端的文字紀錄中,有關病人隱私資料的內容 (Protected Health Information, PHI) 都要被清除掉或是修改掉。而在門診醫病對話資料中,含有許多求診民眾的隱私內容,如此大量的資料,需要有自動化的方式去辨識出這些隱私內容,方便醫療人員的作業也加速醫療大數據的建立。
本競賽提供從成大醫院合作之門診所收錄而來的門診對話及相關訪談的看診對話資料,由人工標註出對話資料中的隱私內容及其類型。並將資料分為訓練集、建構集(開發集) 與測試集。
本競賽主要目標為從醫生與看診民眾對話中辨識和提取含有隱私資訊的內容,並分類出該內容屬於何種隱私類型。以 F1-Score 評估參賽者在測試語料集上預測結果的正確率。
本競賽要識別出的隱私類型有:
相關問題諮詢,請洽:ikm.ncku@gmail.com
全國各大專院校在學生(含研究生),業界亦可參加,但不列入敘獎排名。
本競賽「醫病訊息決策與對話語料分析競賽 - 秋季賽:醫病資料去識別化」係依據主辦單位所提供之語料集,並經由主辦單位聘僱之生物及醫學領域專家所標註的結果,以 F1-Score 來評比各參賽隊伍的系統效能和名次,詳細辦法說明如下:本競賽有三種語料集,分別為訓練集(Training Data)、開發集(Development Data)及測試集(Test Data)。
敘獎對象須為報名時具中華民國各大專校院之在學生,敘獎時需檢附相關證明。
在「醫病訊息決策與對話語料分析競賽 - 秋季賽」項目前 15 名的優勝隊伍將分別獲得競賽獎金,秋季賽獎金共 30 萬:
名次 | 獎金 |
---|---|
第一名 | 8 萬元 |
第二名 | 5 萬元 |
第三名 | 3 萬元 |
優等兩名 | 各 2 萬元 |
佳作十名 | 各 1 萬元 |
活動開始於台灣時間(UTC+8小時)2020/09/03,結束於 2020/12/31 午夜 11 時 59 分,於 2021/01/08 公布結果。。
醫病資料之去識別化系統 - 秋季賽 | |
---|---|
時間 | 事件 |
2020/09/03 | 開放報名及組隊(提供 Sample data) |
2020/09/10 | 公布訓練集資料 Part 1,開放下載 |
2020/09/15 | 公布 Baseline 與演算法等參數 |
2020/10/05 | 公布建構集資料 Part 1,開放下載及上傳檔案 |
2020/10/12-10/23 | 校園巡迴講座(確切時間待公布) |
2020/11/10 | 公布建構集 Part 2 及訓練集資料 Part 2 開放下載及上傳答案 |
2020/12/13 23:59:59 | 報名及組隊截止 |
2020/12/14 | 公布測試集,開放下載及上傳答案 |
2020/12/25 | 開始上傳報告及原始程式碼 |
2020/12/28 23:59:59 | 比賽截止,關閉測試集的資料上傳答案算分功能 算分方式採用 F1-Score |
2020/12/30 | 公佈系統分數 |
2020/12/31 23:59:59 | 上傳報告截止 |
2021/01/01-01/07 | 評估(系統+報告) |
2021/01/08 | 公布最後成績(系統+報告)(頒獎時間待公布) |
評估方式採用 F1-Score,其公式如下:
$$ F1= 2 \times {Precision \times Recall \over Precision + Recall } $$ $$ Precision={True\ Positive \over {True\ Positive + False\ Positive}} $$ $$ Recall ={True\ Positive \over {True\ Positive + False\ Negative}} $$