Topic provider


臺北醫學大學為台灣歷史悠久的醫學教育高等學府,創立於1960年,於2018QS亞洲大學排名蟬聯國內私校及醫學大學第一,並進榜世界大學排名Clinical, preclinical, and health領域。北醫以培育具人文關懷、創新能力及國際觀的生醫人才為目標,鏈結產官學研共創價值,建構全方位醫療養護服務體系,打造永續經營的生醫平台生態系,邁向教學、研究、產學、醫療一體化發展的國際一流大學。

Introduction


共病症係病人在接受治療或研究的主診斷之外,其他已經存在、且會對這次的主診斷疾病產生影響的疾病狀況。鑒於全民健康保險研究資料庫已成為醫療服務研究重要之資料來源,如何適當地應用次級資料進行衍生應用研究亦為時下熱潮。本次邀請各界資料科學家共同參與活動,針對所盤點與提供的共病測量資料,來預測特定性別在特定年齡層的共病案例數,藉以提升透過數據科學來探索醫病關聯的掌握程度。

Activity time


活動開始於台灣時間(UTC+8小時)2017/12/28,結束於2018/03/28午夜11時59分,於2018/03/29公佈結果。

Evaluation Criteria

參與本議題研究者在提供疾病共病組合的預測案例數後,系統將依評估方式計算分數與排名。本議題評估方式採用計算上傳值與實際值的方均根差 (Root-Mean-Square Error, RMSE),公式如下:$$RMSE = \sqrt{{1 \over n} \sum_{j=1}^{n} (y_i - \hat{y}_i) ^ 2}$$

Data description


本協作議題所提供的資料集,為篩選國人連續三年期間,所登錄在全民健康保險研究資料庫(NHIRD)中的疾病就診資料,並經由臺北醫學大學進一步彙整後所計算「共病」的統計資料。其中,就診疾病項目以ICD-9編碼國際標準作為基準,而同一病患在同一年度內所發生過的疾病視為「共病」,並依年齡層及性別區分共病案例的統計資訊。本次Testing data皆為Private fold形式,資料內容為女性在40-49年齡的共病案例數≧100之數據;而Training data則是排除Testing data外,所有年齡層及性別組合總共19個區段的共病統計數據。

training_data.zip(解壓縮後為training_data.csv)

  • ID: 共病組合流水編號
  • Gender: 男性為M、女性為F
  • Age: 每10歲分割成一個區段, 如0-9, 10-19, 20-29, …, 90-99共10個區段
  • Code1: 依ICD-9國際標準編碼轉換為3~5碼文字, 如0010, 00589等
  • Code2: 同上, 但為同一年度發生的另一種疾病代碼
  • Code1_Count: 第一種疾病在資料期間內的案例數
  • Code2_Count: 第二種疾病在資料期間內的案例數
  • Co_occ: 兩種疾病在資料期間同一年度內同時發生的案例總數。(但其中女性於40-49歲共病案例數≧100為未知)
  • Upload format description


    upload_sample.zip(解壓縮後為upload_sample.csv)

    上傳檔案的格式請以csv格式(逗號分隔)儲存於單一檔案,內容須對應upload_sample.csv的ID欄位值序號順序,並提供包含以下欄位資料:

  • ID: 共病組合流水編號
  • Co_occ: 兩種共病疾病在資料期間發生的案例數
  • 如:
    ID,Co_occ
    173,3545
    462,34
    600,3
    672,343
    697,33234

    *Please sign up for this topic first.
    *Please sign up for this topic first.

    Rules

  • 若比賽發生舞弊行為,則舞弊之隊伍將被取消參賽資格,並由他隊依排名遞補。
  • 比賽評估結果以最後上傳的結果為基準,若評估分數一致時,以上傳時間優先為主。
  • 除主辦單位提供之參考資料,比賽中不得使用其他外部或私有之輔助資料。
  • 參賽者可基於學術研究目的發表解題之研究成果,但需加註說明資料來源,並書面通知主辦單位。