臺北醫學大學為台灣歷史悠久的醫學教育高等學府,創立於1960年,於2018QS亞洲大學排名蟬聯國內私校及醫學大學第一,並進榜世界大學排名Clinical, preclinical, and health領域。北醫以培育具人文關懷、創新能力及國際觀的生醫人才為目標,鏈結產官學研共創價值,建構全方位醫療養護服務體系,打造永續經營的生醫平台生態系,邁向教學、研究、產學、醫療一體化發展的國際一流大學。
共病症係病人在接受治療或研究的主診斷之外,其他已經存在、且會對這次的主診斷疾病產生影響的疾病狀況。鑒於全民健康保險研究資料庫已成為醫療服務研究重要之資料來源,如何適當地應用次級資料進行衍生應用研究亦為時下熱潮。本次邀請各界資料科學家共同參與活動,針對所盤點與提供的共病測量資料,來預測特定性別在特定年齡層的共病案例數,藉以提升透過數據科學來探索醫病關聯的掌握程度。
活動開始於台灣時間(UTC+8小時)2017/12/28,結束於2018/03/28午夜11時59分,於2018/03/29公佈結果。
參與本議題研究者在提供疾病共病組合的預測案例數後,系統將依評估方式計算分數與排名。本議題評估方式採用計算上傳值與實際值的方均根差 (Root-Mean-Square Error, RMSE),公式如下:$$RMSE = \sqrt{{1 \over n} \sum_{j=1}^{n} (y_i - \hat{y}_i) ^ 2}$$
本協作議題所提供的資料集,為篩選國人連續三年期間,所登錄在全民健康保險研究資料庫(NHIRD)中的疾病就診資料,並經由臺北醫學大學進一步彙整後所計算「共病」的統計資料。其中,就診疾病項目以ICD-9編碼國際標準作為基準,而同一病患在同一年度內所發生過的疾病視為「共病」,並依年齡層及性別區分共病案例的統計資訊。本次Testing data皆為Private fold形式,資料內容為女性在40-49年齡的共病案例數≧100之數據;而Training data則是排除Testing data外,所有年齡層及性別組合總共19個區段的共病統計數據。
training_data.zip(解壓縮後為training_data.csv)
upload_sample.zip(解壓縮後為upload_sample.csv)
上傳檔案的格式請以csv格式(逗號分隔)儲存於單一檔案,內容須對應upload_sample.csv的ID欄位值序號順序,並提供包含以下欄位資料: