13 / 7

參加人數 / 組

議題提供單位


工研院巨量資訊科技中心為國內第一個以推動巨量資料技術與產業為任務的科技研發中心,透過建立智慧分析技術,協助資訊軟體業建立知識經濟核心能力;並切入智慧分析應用,協助相關產業提昇生產力、創造新商機。巨量資訊科技中心針對跨領域的需求,提供產業所需的智慧分析與機器學習演算法等核心技術,建構AI人工智慧、巨量資料分析應用所需之運算平台,以AI人工智慧與巨量資料之創新應用情境來進行服務設計與商業模式,提供全方位的AI人工智慧與巨量資料解決方案。

簡介

情緒分析是現今自然語言處理 (NLP) 最重要的應用之一,藉此可以理解人們文字與言論中的情緒,理解評論的真實走向,幫助資料庫建立更加準確的評論系統。

此議題中蒐集了許多簡短的電影文字評論,參賽者需使用現有的評論,訓練人工智慧模型來分析、判斷類似的文字評論帶有正面或是負面的情緒。


本議題僅開放清華大學教授郭柏志「機器學習概論」課程專題使用。
資料來源

[1] https://ai.stanford.edu/~amaas/data/sentiment/
[2] https://paperswithcode.com/dataset/sst


活動時間


活動結束於 2022/01/15 午夜 11 時 59 分。

評估標準


本議題採用 F1 score [1]。公式如下: $$ F_{1} = {2\cdot {precision \cdot recall \over precision+recall}} \\ $$

Reference
[1] F1 score:
https://en.wikipedia.org/wiki/F1_score

規則

  • 活動評估結果以最後上傳的結果為基準。
  • 上傳次數限制為 5 次/天。
  • 本議題不允許組隊,同一人只能有一組帳號,人員不得重複參加,違者經確認後會取消參賽資格。
  • 參賽作品所使用之資料、技術與程式碼,均屬參賽者之原創或已取得合法授權,若有任何第三者主張侵害智慧財產權或其他違法情事,均由參賽者自行出面處理;若有侵害他人智慧財產權之情事者,主辦單位將取消競賽及得獎資格,參賽者應自行負擔相關法律責任。
  • 可使用外部合法公開授權之資料集,然為維持活動之公平性,參與者若使用外部資料集,須在討論區留下資料集說明及取得的來源供所有人參考。
  • 參賽成果之智慧財產權歸屬參賽者擁有,其著作授權、專利申請、技術移轉及權益分配等相關事宜,應依相關法令辦理。
  • 主辦單位有權對參賽者進行成績查驗相關措施。
  • 不同帳號禁止交流答案,違者視同舞弊。
  • 若活動發生舞弊行為,則舞弊之參賽者將被取消參加資格。
  • 測試資料的答案上傳後,將分為兩部份計算:
    • 活動時間截止前,系統僅參照部份測試資料的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Public Leaderboard;此資料佔全部測試資料的 40%。
    • 活動時間截止後,系統將會參照所有測試資料(60%)的真實數值(Ground Truth)來驗證與計算分數,並公佈於 Private Leaderboard。
  • 禁止使用任何人工方式作答。
  • 未來如有任何爭議,主辦單位將保留最終決定權。
  • 主辦單位有權因需要調整賽程及相關規定。