參加人數
ITRI 工業技術研究院成立於1973年,以科技研發,帶動產業發展,創造經濟價值,增進社會福祉為任務;成立四十多年來,累積近3萬件專利,並新創及育成281家公司。
目前人工智慧語音識別的應用已越來越成熟、廣泛,然而背景音的干擾容易造成語音識別上的困難,因此,人聲去噪的技術將是一個重要的研究議題。
本議題期望以 AI 的方式識別混音檔案中的人聲,並保留人聲的部分以進行去噪,期望獲得更純淨的人聲音訊,提高語音識別應用的服務品質。
獲獎條件:不得使用商用軟體,必要時會進行模型驗證。
第一名:50,000 元獎金 (含稅) + TWS 台智雲 新台幣 100,000 元的運算額度
第二名:30,000 元獎金 (含稅) + TWS 台智雲 新台幣 80,000 元的運算額度
第三名:20,000 元獎金 (含稅) + TWS 台智雲 新台幣 50,000 元的運算額度
佳作 (數名):TWS 台智雲 新台幣 20,000 元的運算額度
持續領先獎(佔據排行榜第一名最長時間):TWS 台智雲 新台幣 30,000 元的運算額度
工業技術研究院之相關人員(含員工、實習生、工讀生等)不得敘獎,若已頒發,則追回獎金、獎項。
獲獎相關說明
議題進行時間以台灣時間(UTC+8小時)為主,其時程如下:
時間 | 事件 |
---|---|
2022/01/18 | 報名開始 |
2022/01/18 | 開放上傳 |
2022/03/18 23:59:59 | 上傳截止 |
2022/03/21 | 公布Private Leaderboard |
2022/03/28 23:59:59 | 繳交報告截止 |
2022/04/07 | 公布得獎名單 |
參與本議題研究者在提供 denoise 的檔案後,系統後台將根據評估方式計算分數,評估方式採用PESQ,公式如下:$$ Score={\sum_{i=1}^{1000} PESQ(groudtruth_{i}, predition_{i}) } $$
*請大家下載 github 連結中的程式在本機端先測試 evaluation(使用 wide-band):
https://github.com/ludlows/python-pesq