2

參加人數

議題提供單位


工研院巨量資訊科技中心為國內第一個以推動巨量資料技術與產業為任務的科技研發中心,透過建立智慧分析技術,協助資訊軟體業建立知識經濟核心能力;並切入智慧分析應用,協助相關產業提昇生產力、創造新商機。巨量資訊科技中心針對跨領域的需求,提供產業所需的智慧分析與機器學習演算法等核心技術,建構AI人工智慧、巨量資料分析應用所需之運算平台,以AI人工智慧與巨量資料之創新應用情境來進行服務設計與商業模式,提供全方位的AI人工智慧與巨量資料解決方案。

簡介

讓機器理解人類語音所表達的訊息,一直以來是業界、學界共同努力的方向。語音辨識(speech recognition)技術擁有數十年的研究歷史,在AI人工智慧興起後又掀起另一波新浪潮,中文語音辨識是否能有新的突破,快來參加本議題跟大家說你就是中文語音資料的專家。

本議題資料集節選自科技部推出的「AI語音數據資料集」,內容包含中國四大文學名著,紅樓夢、三國演義、西遊記、水滸傳,以及警察廣播電台的路況報導,和教育廣播電台的新聞時事等。共分為八個類別,參加者須透過音檔辨識為八大分類的那一種。

議題資料來源:AI語音數據資料集


活動時間

依照單位指示


評估標準

系統後台將定期批次處理計算分數,評估方式採用計算與實際值的相符正確率(Accuracy)。公式如下: $$ Accuracy \; = \; \frac{Number \; of \; correct \; predictions}{Number \; of \; total \; predictions} $$

規則

  • 活動評估結果以最後上傳的結果為基準。
  • 上傳次數限制為 5 次/天。
  • 本議題不允許組隊,同一人只能有一組帳號,人員不得重複參加,違者經確認後會取消參賽資格。
  • 參賽作品所使用之資料、技術與程式碼,均屬參賽者之原創或已取得合法授權,若有任何第三者主張侵害智慧財產權或其他違法情事,均由參賽者自行出面處理;若有侵害他人智慧財產權之情事者,主辦單位將取消競賽及得獎資格,參賽者應自行負擔相關法律責任。
  • 可使用外部合法公開授權之資料集,然為維持活動之公平性,參與者若使用外部資料集,須在討論區留下資料集說明及取得的來源供所有人參考。
  • 參賽成果之智慧財產權歸屬參賽者擁有,其著作授權、專利申請、技術移轉及權益分配等相關事宜,應依相關法令辦理。
  • 主辦單位有權對參賽者進行成績查驗相關措施。
  • 不同帳號禁止交流答案,違者視同舞弊。
  • 若活動發生舞弊行為,則舞弊之參賽者將被取消參加資格。
  • 測試資料的答案上傳後,將分為兩部份計算:
    • 活動時間截止前,系統僅參照部份測試資料的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Public Leaderboard;此資料佔全部測試資料的 40%。
    • 活動時間截止後,系統將會參照所有測試資料(60%)的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Private Leaderboard。
  • 禁止使用任何人工方式作答。
  • 未來如有任何爭議,主辦單位將保留最終決定權。
  • 主辦單位有權因需要調整賽程及相關規定。