282

參加人數

議題提供單位

ITRI 工業技術研究院成立於1973年,以科技研發,帶動產業發展,創造經濟價值,增進社會福祉為任務;成立四十多年來,累積近3萬件專利,並新創及育成281家公司。

簡介

目前人工智慧語音識別的應用已越來越成熟、廣泛,然而背景音的干擾容易造成語音識別上的困難,因此,人聲去噪的技術將是一個重要的研究議題。

本議題期望以 AI 的方式識別混音檔案中的人聲,並保留人聲的部分以進行去噪,期望獲得更純淨的人聲音訊,提高語音識別應用的服務品質。

獎項

獲獎條件:不得使用商用軟體,必要時會進行模型驗證。

第一名:50,000 元獎金 (含稅) + TWS 台智雲 新台幣 100,000 元的運算額度

第二名:30,000 元獎金 (含稅) + TWS 台智雲 新台幣 80,000 元的運算額度

第三名:20,000 元獎金 (含稅) + TWS 台智雲 新台幣 50,000 元的運算額度

佳作 (數名):TWS 台智雲 新台幣 20,000 元的運算額度

持續領先獎(佔據排行榜第一名最長時間):TWS 台智雲 新台幣 30,000 元的運算額度


工業技術研究院之相關人員(含員工、實習生、工讀生等)不得敘獎,若已頒發,則追回獎金、獎項。

獲獎相關說明

  • Private Leaderboard 前三名於期限內繳交書面報告者,始具備得獎資格。
  • 逾期未繳交報告視同放棄獲獎資格(報告不會對外公開)。
  • TWS 運算額度敘獎資格:具備中華民國國籍者。
  • TWS 使用期限為 6 個月。

 

活動時間

議題進行時間以台灣時間(UTC+8小時)為主,其時程如下:

時間事件
2022/01/18報名開始
2022/01/18開放上傳
2022/03/18 23:59:59上傳截止
2022/03/21公布Private Leaderboard
2022/03/28 23:59:59繳交報告截止
2022/04/07公布得獎名單

 

評估標準

參與本議題研究者在提供 denoise 的檔案後,系統後台將根據評估方式計算分數,評估方式採用PESQ,公式如下:$$ Score={\sum_{i=1}^{1000} PESQ(groudtruth_{i}, predition_{i}) } $$

*請大家下載 github 連結中的程式在本機端先測試 evaluation(使用 wide-band):

https://github.com/ludlows/python-pesq

規則

  • 活動評估結果以最後上傳的結果為基準,若評估分數一致時,以上傳時間優先為主。
  • 上傳次數限制為 5 次/天。
  • 工業技術研究院、出題廠商之相關人員(含員工、實習生、工讀生等)不得敘獎,若已頒發,則追回獎金、獎項。
  • 本議題不允許組隊,同一人只能有一組帳號,人員不得重複參加,違者經確認後會取消參賽資格。
  • 參賽作品所使用之資料、技術與程式碼,均屬參賽者之原創或已取得合法授權,若有任何第三者主張侵害智慧財產權或其他違法情事,均由參賽者自行出面處理;若有侵害他人智慧財產權之情事者,主辦單位將取消競賽及得獎資格,參賽者應自行負擔相關法律責任。
  • 參賽成果之智慧財產權歸屬參賽者擁有,其著作授權、專利申請、技術移轉及權益分配等相關事宜,應依相關法令辦理。
  • 主辦單位有權對參賽者進行成績查驗相關措施。
  • 不同帳號禁止交流答案,違者視同舞弊。
  • 若活動發生舞弊行為,則舞弊之參賽者將被取消參加資格,獎項依排名遞補。
  • 測試資料的答案上傳後,將分為兩部份計算:
    • 活動時間截止前,系統僅參照部份測試資料的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Public Leaderboard;此資料佔全部測試資料的 60%。
    • 活動時間截止後,系統將會參照所有測試資料(100%)的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Private Leaderboard,以作為最終成績和最後的排名依據。
  • 禁止使用任何人工方式作答。
  • 獲獎相關說明
    • 不得使用商用軟體,必要時會進行模型驗證。
    • Private Leaderboard 前三名於期限內繳交書面報告者,始具備得獎資格。
    • 逾期未繳交報告視同放棄獲獎資格(報告不會對外公開)。
  • 未來如有任何爭議,主辦單位將保留最終決定權。
  • 主辦單位有權因需要調整賽程及相關規定。