4

participants

Topic provider


工研院巨量資訊科技中心為國內第一個以推動巨量資料技術與產業為任務的科技研發中心,透過建立智慧分析技術,協助資訊軟體業建立知識經濟核心能力;並切入智慧分析應用,協助相關產業提昇生產力、創造新商機。巨量資訊科技中心針對跨領域的需求,提供產業所需的智慧分析與機器學習演算法等核心技術,建構AI人工智慧、巨量資料分析應用所需之運算平台,以AI人工智慧與巨量資料之創新應用情境來進行服務設計與商業模式,提供全方位的AI人工智慧與巨量資料解決方案。

Introduction

讓機器理解人類語音所表達的訊息,一直以來是業界、學界共同努力的方向。語音辨識(speech recognition)技術擁有數十年的研究歷史,在AI人工智慧興起後又掀起另一波新浪潮,中文語音辨識是否能有新的突破,快來參加本議題跟大家說你就是中文語音資料的專家。

本議題資料集節選自科技部推出的「AI語音數據資料集」,內容包含中國四大文學名著,紅樓夢、三國演義、西遊記、水滸傳,以及警察廣播電台的路況報導,和教育廣播電台的新聞時事等。共有1,751個音訊檔案分為八個類別,參加者須透過音檔辨識為八大分類的那一種。

議題資料來源:AI語音數據資料集

【進行方式】

  1. 報名議題
  2. 下載資料、建立模型
  3. 上傳成果(一天至多3次)
  4. 選擇成果(上傳頁面右邊的挑選成果頁簽,最多挑選三筆)
  5. 公佈名次

此議題僅開放成功大學鄭順林教授「機器學習」課程專題使用。

Activity time

議題進行時間以台灣時間(UTC+8小時)為主,其時程如下:

時間事件
2020/09/25報名開始
2021/01/07 23:59:59上傳截止
2021/01/14公布Private Leaderboard成績

Evaluation Criteria

系統後台將定期批次處理計算分數,評估方式採用計算與實際值的相符正確率(Accuracy)。公式如下: $$ Accuracy \; = \; \frac{Number \; of \; correct \; predictions}{Number \; of \; total \; predictions} $$

Rules

  • 活動評估結果以最後選擇的結果為基準,若參加者無選擇最後成果則表示棄權本議題。
  • 最後評估結果分數一致時,以最早上傳時間優先為主。
  • 上傳次數限制為 3 次/天
  • 可使用外部合法公開授權之資料集,然為維持活動之公平性,參與者若使用外部資料集,須在討論區留下資料集說明及取得的來源供所有人參考。
  • 參賽作品所使用之資料、技術與程式碼,須為參賽者之原創或已取得合法授權,若有任何第三者主張侵害智慧財產權或其他違法情事,均由參賽者自行出面處理;若有侵害他人智慧財產權之情事者,主辦單位將取消競賽及得獎資格,參賽者應自行負擔相關法律責任。
  • 參賽成果之智慧財產權歸屬參賽者擁有,其著作授權、專利申請、技術移轉及權益分配等相關事宜,應依相關法令辦理。除實施本活動之必要評分驗證工作外,本平台不得保留或利用參賽成果於其他用途。
  • 本議題不允許組隊,同一人只能有一組帳號,人員不得重複參加,違者經確認後會取消參賽資格。
  • 若活動發生舞弊行為(如:多人私下組隊或交換答案…等違反規定行為),則舞弊之帳號將被取消參賽資格,名額依排名遞補。
  • 測試資料的答案上傳後,成績將分為兩部份計算:
    • 活動時間截止之前,系統僅計算部份測試資料的答案,並公佈於 Public Leaderboard;此資料佔全部測試資料的 75%。
    • 活動時間截止之後,系統將會計算另一部份測試資料(25%)的答案,並公佈於 Private Leaderboard,以做為最後成績;並以此成績為最後的排名依據。
  • 凡參加報名者,視為已閱讀並完全同意遵守本活動之一切規定。
  • 參賽者如違反本競賽辦法之相關規定,將取消其參賽資格,如已獲獎,則撤銷獲得之獎項,並追回獎金及獎狀。
  • 未來如有任何爭議,主辦單位將保留最終決定權。