AIdea x 教育部攜手推廣人才庫

如同網際網路進入社會各個環節的強大影響力,如今,人工智慧也已經掀起另一波革命。對國家的教育政策而言,培養足夠數量研發人工智慧技術的人才,使國民具備與人工智慧 共同協作之能力,進而提升整體社會的競爭力,為重中之重的任務。
本計畫之重心為「標註暨競賽」,著重在目標明確的題目,藉由競賽精確的題目,訓練學生解決明確目標的問題。我們希望能透過競賽,培養學生解決AI問題的經驗與能力,並導 入人工智慧技術與觀念至教育體系。期望將來在投入實習場域進行實戰時,能學以致用。

指導單位——教育部

教育部「結合資訊、科技與人文,引領學校邁向永續發展新世紀」之願景,規劃「前瞻人才培育」、「精緻數位學習」、「科研倫理素養」、「數位公義關懷」、「校園環境永續」五大目標,建構以「人」為中心的學習環境,培育具關懷社會與環境之現代公民,強化國家永續發展。

/ 議題入口 /
結束

生醫論文自動分析正式賽 – 生醫關聯擷取

近年來隨著人工智慧技術的蓬勃發展,人工智慧的應用逐漸落實在日常生活周遭。全球性的市場調查諮詢公司 Markets & Markets 預估人工智慧應用的市場將從 2017 年的 160.6 億美元成長到 2025 年的 1,906.1 億美元,年均複合增長率達到 36%。獲益於人工智慧技術的產業包括製造業、金融科技、醫療領域等。這一波人工智慧的發展預期將會在 2022 年為醫療領域帶來79 億 880 萬美金的產值 。主要應用的人工智慧技術包括機器學習、自然語言處理、情境感知以及電腦視覺。其中自然語言處理技術更是在促成智慧醫療領域中扮演最重要的推手,依此技術所開發的各種醫療決策分析系統,如 IBM Watson 等,已經開始蓬勃發展與應用。臺灣醫療技術在世界上頗負盛名,這波的人工智慧技術更是掀起了產官學界一股智慧醫療的風潮。本計畫期望能夠藉由此計畫的推動,在這股即將到來的熱潮中扮演領頭羊的腳色,引領學子在學習人工智慧技術的同時,將其應用到跨領域的生物醫學智慧計算領域。本計畫將以自然語言處理技術為核心,開放競賽語料讓學子能夠將人工智慧技術應用於基礎的臨床醫療病歷資料分析到進階的生物資訊文獻語料,據此培養具備人工智慧、機器學習、自然語言處理與倫理道德素養的專業人才,並期待在本競賽中發展的技術成為臺灣健康資料加值應用中最重要的一環。參與本競賽的學子將可實務的了解分析生物醫學資料的流程與技術,並體現轉譯醫學思維,讓學子能夠了解利用自然語言處理技術將基礎醫學、生物資訊研究,和臨床治療連結的大思維。生物命名實體間的關聯擷取為文獻探勘研究的一大重點,本正式賽會提供人工標註的生醫文件(主要來源:PubMed 文獻摘要),並將資料分為訓練集 Part1、Part 2、建構集(開發集)Part1、Part2 與測試集。正式賽的資料來源以 PubMed 摘要為主,競賽的主要目標為從 PubMed 的生物醫學文獻摘要中辨識和提取具有蛋白質交互作用(Protein-protein Interaction,PPI)資訊之描述句子,並針對所擷取出來具有 PPI 的句子進行評估,確認關聯性的類型(例如:target/regulate/post-translation)。本競賽採用 F1-measure 來評估參賽者在測試語料集上預測結果的正確率。主辦單位將在報名規章公布中包含於釋出競賽相關細則並明訂關聯性類型之規範。競賽獎金敘獎對象須為報名時具中華民國各大專校院之在學生資格,敘獎時需檢附相關證明。在「生醫論文自動分析正式賽」項目前六名的優勝隊伍將獲得競賽獎金:名次獎金第一名10 萬元第二名5 萬元第三名3.5 萬元優等1 萬元佳作 2 名各 7.5 仟元前六名獲獎隊伍經評審委員審定後將獲得教育部獎狀乙紙。名次在前 25% 且超過 Baseline 之隊伍,經評審委員會審定後,將獲頒教育部人工智慧競賽計畫辦公室獎狀。各項獎勵名額得視參賽件數及成績酌予調整,參賽作品未達水準時,得由決選評審委員決定從缺,或不足額入選。參賽對象全國各大專院校在學生(含研究生),業界亦可參加,但不列入敘獎排名。競賽方式及評選辦法本競賽「生醫論文自動分析正式賽」係依據主辦單位所提供之語料集,並經由主辦單位聘僱之生醫領域專家所標註的結果,以 F1-measure 來評比各參賽隊伍的系統效能和名次,詳細辦法說明如下:本競賽有三種語料集,分別為訓練集(Training Data)、開發集(Development Data)及測試集(Test Data)。訓練語料集包括 1. 基因名稱(Gene) 2. 基因對應至 Entrez Gene 資料庫中的編號(Gene ID) 3. 基因與基因之間的關聯類型;而開發集及測試集都是只有標註基因名稱及其編號,並未包含關聯類型。其中訓練集及開發集又分為兩個階段釋出,第一階段僅釋出部分訓練集,第二階釋出完整訓練集。另外,開發集也分為兩階段釋出。1. 第一階段:主辦單位提供約 150 篇經生醫專家標註具有基因名稱、編號及關聯資訊之範例資料集。2. 第二階段:主辦單位將提供 1. 部分訓練集 2. 部分開發集(共約 2,000 篇)及線上評分排名系統(使用 F1-measure 指標評分)。參賽隊伍需從「部分訓練集」中訓練基因交互作用關聯類別分類模型,並以該模型對「部分開發集」進行預測,並上傳「部分開發集」之預測結果至線上評分排名系統,來進一步調校系統效能。3. 第三階段:公布「完整訓練集」及「完整開發集」,共 4,000 篇(包含階段二之資料 2,000 篇)。4. 第四階段:主辦單位公布完整的測試集(Test Data),標有基因名稱及編號,但不含關聯資訊標註之摘要約 20,000 篇。參賽隊伍需在截止時間前,至平台上傳從「完整測試集」預測結果。參賽者可上傳多次,並選取其中一至三筆分數作為評選對象。5. 參賽者必須在分數公布後兩周內上傳系統報告說明文件,以茲證明無任何作弊或抄襲之可能。委員們將在此階段一一進行嚴格的文件審查。6. 評分:最後仍用 F1-measure 來評估參賽隊伍的系統效能,並公布於 Private Leader Board,委員將以此成績高低為依據評估最後獎金賽名次。

2019-03-26T16:00:00+00:00 ~ 2019-08-29T15:59:59+00:00
結束

新聞立場檢索應用獎金賽

「新聞立場檢索應用獎金賽」報名開跑啦!獎金最高十萬元!歡迎商管、人文系所同學揪團一起來挑戰,結合跨領域專長與創意,為專業技術激發意想不到的影響力!具爭議性議題的新聞一直是閱聽人關注與討論的焦點,例如:美國牛肉開放進口、死刑廢除、多元成家等。不論是政治、經濟、教育、兩性、能源、環保等公共議題,新聞媒體常需報導不同的立場。若能從大量的新聞文件裡,快速搜尋各種爭議性議題中具特定立場的新聞,不但有助於人們理解不同立場對這些議題的認知與價值觀,對制定決策的過程而言,也相當有參考價值。近年來,許多與意見立場相關的資訊檢索應用應運而生,例如透過社群媒體的「社群聆聽」進行選舉時的民意調查,或是經由網路論壇的輿情分析,掌握某一產品或品牌的市場評價,足以顯示這個問題的重要性。本新聞立場檢索競賽意圖整合「資訊檢索」及「意見探勘」兩種不同的競賽類型,分別規畫「新聞立場檢索技術獎金賽」與「新聞立場檢索應用獎金賽」兩個項目。在「新聞立場檢索應用獎金賽」中,可使用各種合法授權之資料,惟必須包含「新聞立場檢索技術獎金賽」開發之技術及資料。參賽隊伍需提出企劃書並完成應用雛形系統之實作。期望能在不同領域訓練應用人工智慧相關技術人才,同時藉由不同學科領域的觀點,激發各種技術創新、經驗創新等面向的價值與潛力。參賽對象全國各大專院校在學生競賽獎金敘獎對象必須為全學生之隊伍,敘獎時需要檢附相關證明。在「新聞立場檢索應用獎金賽」項目前三名優勝隊伍將獲得競賽獎金:名次獎金首獎10 萬元最佳創意獎6 萬元最有潛力獎4 萬元前三名獲獎隊伍經評審委員審定後將獲得教育部獎狀乙紙。各項獎勵名額得視參賽件數及成績酌予調整,參賽作品未達水準時,得由決選評審委員決定從缺,或不足額入選。競賽方式及評選辦法第一階段:在「新聞立場檢索應用獎金賽」項目,參賽隊伍應基於「新聞立場檢索技術獎金賽」之技術,提出相關應用的企劃書,企劃書內容可使用各種合法授權之資料,惟系統展示時,必須包含「新聞立場檢索技術獎金賽」之資料。若參賽隊伍超過十隊,將依第一階段企劃書選出前十名進入第二階段決選。第二階段:在決選期限前,入選的參賽隊伍需先繳交成果報告書,以利之後的決選審查。參賽隊伍需在決選中現場報告企劃,並提供系統雛形於現場展示與測試,所開發之應用系統形式不限。得獎名單將於 11 月公布於競賽網頁,並以 Email 通知。

2019-03-21T16:00:00+00:00 ~ 2019-11-20T15:59:59+00:00
結束

新聞立場檢索技術獎金賽

具爭議性議題的新聞一直是閱聽人關注與討論的焦點,例如:美國牛肉開放進口、死刑廢除、多元成家等。不論是政治、經濟、教育、兩性、能源、環保等公共議題,新聞媒體常需報導不同的立場。若能從大量的新聞文件裡,快速搜尋各種爭議性議題中具特定立場的新聞,不但有助於人們理解不同立場對這些議題的認知與價值觀,對制定決策的過程而言,也相當有參考價值。參與本競賽之隊伍需開發一搜尋引擎,找出「與爭議性議題相關」且「符合特定立場」的新聞。本競賽網站以網頁連結(Hyperlink)方式,提供國內各大媒體新聞作為競賽用的資料;本網站亦提供參賽隊伍一些「包含立場和爭議性議題」的查詢題目(例如:「反對學雜費調漲」)以及部分標註資料(例如:「相關」與「不相關」),協助參賽隊伍應用「資訊檢索」及「機器學習」技術於檢索模型的訓練,期望所開發之搜尋引擎能有效找出與「反對學雜費調漲」的相關新聞,並依照相關程度由高至低排列。競賽獎金敘獎對象必須為全學生之隊伍,敘獎時需要檢附相關證明。在「新聞立場檢索技術獎金賽」項目前十三名的優勝隊伍將獲得競賽獎金:名次獎金第一名10 萬元第二名6 萬元第三名4 萬元佳作 10 名各 1 萬元前十三名獲獎隊伍經評審委員審定後將獲得教育部獎狀乙紙。名次在前 25% 且超過 Baseline 之隊伍,經評審委員會審定後,將獲頒教育部人工智慧競賽計畫辦公室獎狀。各項獎勵名額得視參賽件數及成績酌予調整,參賽作品未達水準時,得由決選評審委員決定從缺,或不足額入選。參賽對象全國各大專院校在學生,業界亦可參加,但不列入敘獎排名。競賽方式及評選辦法本競賽「新聞立場檢索技術獎金賽」係依據主辦單位提供之語料集建構檢索系統,並經由主辦單位指定之測試查詢主題結果,來評比各參賽隊伍的系統效能和名次,詳細辦法說明如下:本競賽分為兩階段,主辦單位於每個階段提供以下資料:第一階段:「部分新聞語料庫(NC-1)」及「其測試查詢題目(QS-1)」第二階段:「完整新聞語料庫(NC-2)」及「其測試查詢題目(QS-2)」「完整新聞語料庫」包含「部分新聞語料庫」((NC-1⊂NC-2)),「第二階段之測試查詢題目」包含「第一階段之測試查詢題目」((QS-1⊂QS-2))。,第一階段另外提供「訓練標記語料((TD))」「訓練標記語料(TD)」作為訓練模型之參考,詳述如下:1. 第一階段:參賽隊伍需從「部分新聞語料庫(NC-1)」中搜索出其對應之「測試查詢題目(QS-1)」的相關文章,每個查詢題目需回傳排名前 300 名的新聞,並上傳搜尋結果至線上排名系統以調校模型效能,一天最多上傳 10 次。該系統使用 ${MAP@300}$ 指標評分,之後會說明 ${MAP@300}$ 的計算方法。主辦單位於本階段另提供「訓練標記語料(TD)」,每項標記語料包含「訓練用的查詢題目(QS-t)」、「部分新聞語料庫(NC-1)中的某篇新聞」及「該新聞針對查詢題目的相關程度」;其中相關程度分四個等級,分別代表不相關 (0)、部分相關 (1)、相關 (2)、非常相關 (3);「訓練標記語料(TD)」並非「部分新聞語料庫(NC-1)」之完整標記,意即「部分新聞語料庫(NC-1)」的某些新聞可能沒有標記;「測試查詢題目(QS-1)」包含「訓練用的查詢題目(QS-t)」中的 5 個查詢題目。2. 第二階段:參賽隊伍需從「完整新聞語料庫(NC-2)」中搜索出其對應之「測試查詢題目(QS-2)」的相關文章,每個查詢題目需回傳排名前 300 名的新聞。請注意:第二階段上傳的結果將決定本競賽之最終排名,此階段不再提供第一階段線上排名系統的服務,主辦單位會提前公布「完整新聞語料庫(NC-2)」,參賽隊伍必須於「測試查詢題目(QS-2)」公布之當日截止時間前上傳「完整新聞語料庫(NC-2)」的搜索結果,至多上傳 7 次,最後一次上傳的答案將作為評分對象。

2019-03-21T16:00:00+00:00 ~ 2019-09-02T15:59:59+00:00
/ 活動資訊 /
/ 指導單位 /
/ 競賽運籌單位 /
/ 主辦單位 /