228

參加人數

議題提供單位

國立臺灣文學館為我國第一座國家級的文學博物館,除蒐藏、保存、研究的功能外,更將透過展覽、活動、推廣教育等方式,使文學親近民眾,帶動文化發展。本館另設有文學圖書閱覽區、文學樂園、文學沙龍等空間,提供多元化服務。此外也備有專業的典藏修護設備與空間。
2021年立法院三讀通過「國立臺灣文學館組織法」,臺文舘更升格為三級機構,未來也將持續強化培育修復人才及文物徵集實力、擴增文學空間及鏈結文學家族。
官網連結:https://www.nmtl.gov.tw/
文學拾藏:http://nmtltrans.tlvm.com.tw/
臺灣文學典藏網:https://collections.culture.tw/nmtl_collectionsweb/
臺灣文學虛擬博物館:http://www.tlvm.com.tw/

2021/09/28 新資料釋出

議題進行期間再蒐集的新資料,已整理好釋出,於資料下載新增 train1_20210928.zip、train2_20210928.zip、train_20210928.json。請參賽者下載訓練,謝謝!

2021/09/06 新增敘獎資格

競賽獎金、最終名次敘獎資格需具備中華民國國籍。

2021/08/25 資料檔案更新

資料下載頁面提供的train_augmentation.json檔案已更新,請參賽者重新下載。

簡介

國立臺灣文學館於文學史料上,不論是典藏質量與數量,皆是極具指標性的館舍,蒐藏了臺灣文學史上具有代表性的重要作品與文獻資料。 定期進行藏品檢視紀錄能讓館員有效掌握藏品現況,臺文館持續投入此檢視紀錄工作已超過十年,並累積了豐富的成果。 然而面對逾11萬件的龐大典藏數量,以人工方式逐件檢視藏品相當曠日耗時。為此,本議題進行AI輔助藏品的劣化辨識開發,未來進一步建構文學藏品劣化狀況資料庫,不僅可協助典藏檢視工作效能提升,也能輔以藏品展示前後狀況比對工作,並降低傳統拍照與檢視所需耗費的大量人力時間。

本次邀請各界資料分析、科學領域者共襄盛舉,針對所提供的文學藏品劣化影像資料,訓練人工智慧模型以辨識劣化的位置及種類,希望藉以助益臺文館的典藏工作。

獎項

獲獎條件:於繳交報告截止前繳交書面報告者。

第一名:50,000 元獎金 (含稅) + TWCC 台灣 AI 雲 新台幣 150,000 元的運算額度

第二名:30,000 元獎金 (含稅) + TWCC 台灣 AI 雲 新台幣 100,000 元的運算額度

第三名:20,000 元獎金 (含稅) + TWCC 台灣 AI 雲 新台幣 50,000 元的運算額度

佳作 (數名):TWCC 台灣 AI 雲 新台幣 50,000 元的運算額度


工業技術研究院、出題廠商之相關人員(含員工、實習生、工讀生等)不得敘獎,若已頒發,則追回獎金、獎項。

獲獎相關說明

  • Private Leaderboard 前三名於期限內繳交書面報告者,始具備得獎資格。
  • 逾期未繳交報告視同放棄獲獎資格(報告不會對外公開)。
  • 獎金、最終名次敘獎資格:具備中華民國國籍者。
  • TWCC 運算額度敘獎資格:具備中華民國國籍者。
  • TWCC 使用期限為 6 個月。
  • 使用TWCC運算資源請遵守TWCC臺灣AI雲之規範,務必詳閱其內容(https://iservice.nchc.org.tw/nchc_service/template/member_contract_3_zh_tw.html

 

活動時間

議題進行時間以台灣時間(UTC+8小時)為主,其時程如下:

時間事件
2021/08/18報名開始
2021/08/25開放下載、開放上傳
2021/11/03 23:59:59上傳截止
2021/11/04公布Private Leaderboard
2021/11/8 23:59:59繳交報告截止
2021/11/12公布得獎名單

評估標準

本議題資料評估指標採用 mean Average Precision(mAP)[1] 於 Intersection over Union(IoU)[2] threshold 為 0.5。根據預測物件框與標註物件框 IoU 大於 0.5 時為 True Positive(TP),反之為 False Positive(FP),藉此得到 Precision。因此系統針對每一個物件評估其 AP 分數,再將劣化的五類 AP 進行平均計算,得到 mAP 評估數值,參賽者按照此指標進行排名。本系統計算 mAP 評估數值採用 COCO API [3]。


Reference
[1] Average Precision (AP):
https://en.wikipedia.org/wiki/Evaluation_measures_(information_retrieval)#Average_precision

[2] intersection over union (IoU):
https://en.wikipedia.org/wiki/Jaccard_index

[3] COCO API:
https://github.com/cocodataset/cocoapi

規則

  • 活動評估結果以最後上傳的結果為基準,若評估分數一致時,以上傳時間優先為主。
  • 上傳次數限制為 5 次/天。
  • 本議題不允許組隊,同一人只能有一組帳號,人員不得重複參加,違者經確認後會取消參賽資格。
  • 參賽作品所使用之資料、技術與程式碼,均屬參賽者之原創或已取得合法授權,若有任何第三者主張侵害智慧財產權或其他違法情事,均由參賽者自行出面處理;若有侵害他人智慧財產權之情事者,主辦單位將取消競賽及得獎資格,參賽者應自行負擔相關法律責任。
  • 可使用外部合法公開授權之資料集,然為維持活動之公平性,參與者若使用外部資料集,須在討論區留下資料集說明及取得的來源供所有人參考。
  • 參賽成果之智慧財產權歸屬參賽者擁有,其著作授權、專利申請、技術移轉及權益分配等相關事宜,應依相關法令辦理。
  • 主辦單位有權對參賽者進行成績查驗相關措施。
  • 不同帳號禁止交流答案,違者視同舞弊。
  • 若活動發生舞弊行為,則舞弊之參賽者將被取消參加資格,獎項依排名遞補。
  • 工業技術研究院、出題廠商之相關人員(含員工、實習生、工讀生等)不得敘獎,若已頒發,則追回獎金、獎項。
  • 測試資料的答案上傳後,將分為兩部份計算:
    • 活動時間截止前,系統僅參照部份測試資料的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Public Leaderboard;此資料佔全部測試資料的 60%。
    • 活動時間截止後,系統將會參照所有測試資料(100%)的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Private Leaderboard,以作為最終成績和最後的排名依據。
  • 禁止使用任何人工方式作答。
  • 未來如有任何爭議,主辦單位將保留最終決定權。
  • 主辦單位有權因需要調整賽程及相關規定。