625 / 421

參加人數 / 組

議題提供單位

國立臺灣大學前身為日治時期之「臺北帝國大學」(創立於日本昭和 3 年、西元 1928 年、民國 17 年)。當時首任校長為幣原坦總長;至民國 34 年(1945年)二次世界大戰結束,日本投降、臺灣光復,同年 11 月 15 日我政府完成接收臺北帝國大學,改制更名為「國立臺灣大學」,由羅宗洛博士任首任校長。
臺大目前已有 11 個學院,以及 3 個專業學院,共 56 個學系、112 個研究所、18 個碩博士學位學程。另設有 4 個國際級、6 個國家級及 51 個校級研究中心,是臺灣規模最大的綜合性大學。學生總人數現今已近 32,000 人,其中大學部 16,000 餘人,研究生 15,000 餘人,比例接近一比一,已經成功轉型為研究型大學。臺大培養出眾多學術界頂尖學者,包含臺灣第一位諾貝爾獎得主李遠哲博士,以及多位的正副元首、企業領導人,是臺灣最具影響力的學校。

獎項提供單位

MathWorks成立於1984年,致力於工程師與科學家所專用高科技運算分析軟體的開發研究,已在學界、業界奠定領導地位。以 MATLAB & Simulink 為平台,在數學、運算分析、人工智慧,深度/機器學習、預測性維護、控制、數位訊號和5G通訊領域提供了無數的解決方案。至今全球已有超過、百萬以上之客戶,包括:汽車、航太、電信與機器人、政府機構、電子、生化製藥、金融科技以及儀器量測…等產業。

成立於1998年9月,以提供創新、高效率的專業技術支援為經營理念,提供研發導向之專業軟體工具,服務於半導體、機器人/馬達控制、工具機、人工智慧開發、5G無線通訊、無人車自主系統、影像處理、量測、光電、生物科技與財務模型分析等領域之高科技研發人員、科學家與工程師。秉持對客戶的承諾,將不斷地追求創新,以豐富與精深的專業知識,提供客戶具前瞻性的解決方案與設計環境,從研發設計周期之分析、架構、模擬、驗證,乃至HDL驗證、硬體實現之完整解決方案。

2020/07/28 歌聲轉譜競賽 得獎名單出爐

請參賽者至AI CUP網站查詢:https://reurl.cc/nzeln1

2020/07/10 [公告] 最後成績公布延後

因為與教育部的審查委員會延期,所以會晚一些公布最後成績,預定是在7/20那週公布,謝謝大家。

2020/06/25 [公告] 得獎隊伍程式碼上傳

各位參賽者大家好,private leaderboard的成績公布了,恭喜各位得獎者。 根據競賽規則,「第四階段:參賽者必須在競賽截止的兩周內上傳報告說明文件,以茲證明無任何作弊或抄襲之可能,前九名的參賽者須提供程式碼,供主辦單位驗證。委員們將在此階段一一進行嚴格的文件審查。」。前九名的參賽者須提供程式碼給我們主辦方,請附上所需要的執行環境和使用說明,並且提供一個script能夠reproduce leaderboard的結果。 請將程式碼、說明、模型上傳到任意雲端,然後使用當初註冊aidea帳號的信箱將共用連結寄到eden.chien@mirlab.org, 標題:[AICup] 歌聲轉譜程式碼提交 – 隊名 一組有多名隊員的只需要寄一封即可,謝謝大家。

2020/06/24 [提醒] 說明文件上傳

【提醒】 各位參賽者大家好,最後提醒大家記得要上傳說明文件,頁數約1至2頁,格式不拘,簡單說明一下使用的方法即可。上傳會在近期開放,謝謝大家。

2020/06/09 [公告] 競賽時程更動。

各位參賽者大家好, 我們比賽的時程有做出更動, 「比賽截止」時間從6/12變更為6/22, 「公布結果並開放上傳報告」從6/15變更為6/25, 完整的時程可以參閱競賽頁面,謝謝大家。

2020/06/04 Baseline公告!

Public set和Private set的baseline分別為: public: 0.1649962614739236 private: 0.1609562262103512 其中public set的數據為: COnPOff : 0.03474875899037167 COnP : 0.1598068015754683 COn : 0.3108121436528413

2020/05/22 【公告】競賽教學影片上線!

連結:https://reurl.cc/WdbNAy 裡面包含了這次的教學影片連結和範例程式碼,如果有問題也可以加入競賽討論區發問。

簡介


matlab

隨著時代的進展,聆聽音樂的方式已經從以往的 CD 轉移到各式各樣的音樂線上平台,如國外的 Spotify、Line Music,國內的 KKBOX、Friday Music 等。就 2016 年 IFPI 的報告指出,數位音樂的產值已經正式超過實體音樂產值,而實體音樂的產值正在連年下降中,顯示出趨勢正站在數位音樂這邊。

而數位音樂的發展帶動了許多相關的 AI 智能應用,包括原曲辨識、哼唱選歌、樂曲分類等,其中 Line Music、KKBOX 與 Spotify 都相繼成立機器學習或人工智慧部門,專門透過歌曲內容與使用者的聆聽習慣來分析使用者的音樂喜好,並且提供上述各種 AI 服務來讓使用者方便聆聽到自己喜歡的音樂,進而衍生出加值的空間。

如前所述,各式各樣的線上音樂平台正在積極的拓展各式各樣的 AI 音樂分析與應用,並成立屬於自己的機器學習或是人工智慧部門。Line Music 也即將在今年正式進駐台灣,顯示數位音樂的市場在經由科技、網路、以及社群平台的發展之後正在火速超越實體音樂的產值中。此類服務在機器學習的研究上可以分成兩個部分,一是針對使用者行為做推薦,另一則是針對歌曲的本質做推薦,在歌曲的本質上,許多基本的特性方法研究是一個必須的重點,如歌曲的主旋律、和弦、歌曲結構、曲風、節拍…等等的基本要素,這些基本要素構成了一首歌曲該如何被分類及推薦,因此熟悉這些音樂基本分析元素及機器學習之方法的人才在目前的音樂產業中是亟需被重點培養的。

競賽論壇:AI CUP - 歌聲轉譜競賽


參賽對象

全國各大專院校在學生(含研究生),業界亦可參加,但不列入敘獎排名。


競賽獎金

敘獎對象須為報名時具中華民國各大專校院之在學生,敘獎時需檢附相關證明。

在「歌聲轉譜競賽」項目前九名的優勝隊伍將分別獲得競賽獎金:

名次獎金
第一名10 萬元
第二名5 萬元
第三名3.5 萬元
優等1.5 萬元
佳作五名各 1 萬元
  • 前三名獲獎隊伍經評審委員審定後將獲得教育部獎狀乙紙。
  • 名次在前 25% 且超過 Baseline 之隊伍,經評審委員會審定後,將獲頒教育部人工智慧競賽計畫辦公室獎狀。
  • 各項獎勵名額得視參賽件數及成績酌予調整,參賽作品未達水準時,得由決選評審委員決定從缺,或不足額入選。

matlab


競賽方式及評選辦法

本競賽「歌聲轉譜」係依據主辦單位所提供之語料集,並經由主辦單位聘僱之音樂領域專家所標註的結果,以 F1-measure 來評比各參賽隊伍的系統效能和名次,詳細辦法說明如下:

主辦單位會標註好 2000 首歌曲的資料,其中 1500 首為測試資料集,作為最終的評分使用,另 500 首則會在競賽途中釋放作為訓練集所用。資料內含有有原曲的音高(單位:Semitone),對應的 YouTube 連結及對應的音符(內含起始時間,結束時間及音高,單位為[毫秒、毫秒、Semitone])。主要的比賽階段如下:

  • 第一階段:主辦單位提供 500 首經音樂專家標註具有歌聲轉譜的資料集,此段時間內參賽者可以利用交互驗證(Cross Validation)的方式來作訓練及測試。
  • 第二階段:線上系統公佈,主辦單位會公布 1500 首測試資料集的音高與對應的 YouTube 連結,參賽者可自行產生對應的音符並依照格式上傳至系統,在此階段只會公布 750 首之評估結果。
  • 第三階段:競賽時間截止,系統會以最後一筆上傳的結果計算剩下 750 首測試資料集的評估分數,並以此測試資料集的結果為最終排名依據。
  • 第四階段:參賽者必須在競賽截止的兩周內上傳報告說明文件,以茲證明無任何作弊或抄襲之可能,前九名的參賽者須提供程式碼,供主辦單位驗證。委員們將在此階段一一進行嚴格的文件審查。
  • 第五階段:競賽成績公佈。

活動時間

時間事件
2020/03/05開放報名及組隊,提供範例資料
2020/03/05-4/30校園巡迴
2020/03/31公布訓練資料
2020/06/01報名及組隊截止
2020/06/02公布測試集,開放上傳結果
2020/06/12 23:59:59
2020/06/22 23:59:59
比賽截止
2020/06/15
2020/06/25
公布系統分數,開始上傳報告
2020/06/29 23:59:59上傳報告截止
2020/07/01系統及報告評估
2020/07/10成績公布(頒獎時間待公布)

評估標準

歌聲轉譜的部分,我們的評估標準取自 E. Molina 等人的論文[1]。具體的標準,包含三種指標的 F-measure,分別列舉如下:

  • Correct OnsetCOn:音符的起始點(onset)正確。
  • Correct Onset, pitchCOnP:音符的起始點及音高(pitch)皆正確。
  • Correct Onset, pitch, offset(COnPOff):音符的起始點、音高及結束點(offset)皆正確。

其中,音高的容忍值為 ±0.5 semitone,即半個半音。考慮到我們所標記的答案,皆是整數音高,這代表只有唯一一個整數答案,可被判斷為正確。

另外,起始點的容忍值為 ±50ms,即 0.05 秒;至於結束點的容忍值,則定為 ±max(50ms, 0.2t),其中 t 是對應的標準答案的音符時長。這代表結束點的容忍值必定不低於 0.05 秒。舉例而言,若某個正確答案的音符時長為 1.0 秒,則該音符的容忍值就會設為 ±0.2 秒。

根據這些容忍值,來計算各個項目的 F-measure:

$$\text{F-measure}=\frac{2*Precision*Recall}{Precision+Recall}$$

其中,假設標記的正確答案共包含 A 個音,而參賽者給出的答案則包含 B 個音,而在某個指標當中,滿足條件的共包含 C 個音,則該指標的 Precision 與 Recall 的計算方式如下:

$$Precision=\frac{C}{B}$$$$Recall=\frac{C}{A}$$

評估的結果會包含 3 個 F-measure 的分數,各自代表一個模型在某個指標上的表現。在此,較高的分數代表一個模型表現較好,反之亦然。最終的排名,會以這三個分數的加權平均進行比序。三個指標中,COn 佔 20%,COnP 佔 60%,COnPOff 佔 20%。

此外,用以計算這三種指標的程式,使用的是 python 語言,且呼叫的是 mir_eval [2] 的函式 mir_eval.transcription.evaluate。一切評估結果將以此為準。

Reference:

[1]Molina, A. M. Barbancho-Perez, L. J. Tardón, I. Barbancho-Perez: “Evaluation framework for automatic singing transcription,” in Proceedings of the 15th International Society for Music Information Retrieval Conference(ISMIR 2014), pp.567-572, 2014.

[2]C. Raffel, B. McFee, E. J. Humphrey, J. Salamon, O. Nieto, D. Liang, and D. P. W. Ellis: “mir_eval: A Transparent Implementation of Common MIR Metrics,” in Proceedings of the 15th International Conference on Music Information Retrieval (ISMIR 2014), 2014.

規則

  1. 參賽隊伍不得註冊多重帳號參加同一項競賽,違者喪失競賽資格;參賽隊伍個別成員自行以個人帳號上傳結果,也視同使用多重帳號參賽。
  2. 每人限報名一隊,加入隊伍後便無法換隊,可於期限之內能繼續添加隊伍人數到上限五人,請謹慎發送、回覆組隊邀請。
  3. 線上評分排名系統有上傳次數限制,每個參賽隊伍每日最多上傳五次。
  4. 參賽隊伍可以使用額外資源(其他的歌曲…等)來增進模型訓練結果,但不可使用人工方式手動標註測試集(Test Data)。
  5. 參賽作品所使用之資料、技術與程式碼,均屬參賽隊伍之原創或已取得合法授權,若有任何第三者主張侵害智慧財產權或其他違法情事,均由參賽隊伍自行出面處理;若有侵害他人智慧財產權之情事者,主辦單位將取消競賽及得獎資格,參賽隊伍應自行負擔相關法律責任。
  6. 為確保競賽的公平性,主辦單位有權要求參賽隊伍提供程式碼與相關資料進行驗證,如有造假、抄襲或詐欺之情事,主辦單位得取消其參賽與得獎資格並追回獎金,參賽隊伍需自行負擔相關法律責任。
  7. 本競賽獎金敘獎對象為全學生之隊伍,隊伍內成員於報名時需全員符合學生身份才可擁有獲獎資格,指導教授不得與學生一同報名,請於最終報告內填寫指導教授名稱即可。業界得獎者可獲得計畫辦公室獎狀,獎金則視各舉辦競賽團隊而定。
  8. 參賽成果之智慧財產權歸屬參賽隊伍擁有,其著作授權、專利申請、技術移轉及權益分配等相關事宜,應依相關法令辦理。
  9. 得獎隊伍獲得獎金應配合中華民國稅法繳交相關所得稅。
  10. 如有以上未盡事宜,視當時狀況共同商議之。
  11. 凡參加報名者,視為已閱讀並完全同意遵守本活動之一切規定。
  12. 參賽隊伍如違反本競賽辦法之相關規定,將取消其參賽資格,如已獲獎,則撤銷或得之獎項,並追回獎金及獎狀。
  13. 若遇爭議,主辦單位保有活動最終解釋權。