阿里巴巴AI模型在閱讀測驗SQuAD　以82.44高分擊敗人類

▲▼史丹福大學發起SQuAD問答測驗。（圖／翻攝自SQuAD官網）

▲美國史丹福大學發起SQuAD問答測驗。（圖／翻攝自SQuAD官網，下同）

大陸中心／綜合報導

阿里巴巴與微軟近日都參加了由美國史丹福大學發起的SQuAD（Stanford Question Answering Dataset）問答挑戰賽，他們各自使用自家研發的人工智慧（AI）閱讀系統來回答問題，在經歷10萬條問題的隨機測驗後，雙方都在測驗中擊敗人類所創造的最高分數82.304，刷新紀錄。

據《CNET News》報導，人類過去在SQuAD測驗拿下最高的成績是82.304分，這次阿里巴巴研究部門 iDST所開發的人工智慧（AI）機器學習模型，在回答完一份由10萬條題目所組成的題目庫問題後，在 1 月 5 日以82.44分的分數首度超越人類，接著微軟在相同的測驗中，在1 月 3 日以82.650分同樣超越人類記錄。

報導指出，阿里巴巴旗下的資料科學與技術研究所（Institute of Data Science and Technologies，iDST）首席科學家Luo Si表示，很榮幸能見到這歷史性的一刻，未來也會將此技術應用在各種不同的領域上，「這項科技可以應用在客服、美術館導覽，甚至是回答病患的醫療問題。」

▼阿里巴巴與微軟並列第一，分別以82.4跟82.65分打破人類最高紀錄82.3分。

▲▼史丹福大學發起SQuAD問答測驗。（圖／翻攝自SQuAD官網）

報導提及，這項測試吸引了Google、Facebook、IBM、微軟、卡內基梅隆大學、史丹福大學等研究單位參加。另外，許多單位也會在一年內，多次參加測驗來了解AI系統進步的進度，例如微軟在 2017 年 12 月 17 日得到 82.136 的成績，而阿里巴巴則是在同年 12 月 28 日獲得 79.199 分。

另據《中評社》17日報導，微軟亞洲研發中心助理主管周明（Ming Zhou）表示，史丹福大學問答數據集的結果具有很重要的意義，但人類仍然比機器更擅長理解語言的複雜性以及分辨細微的差別，「自然語言處理領域依然存在不少挑戰，需要我們進一步努力，這個小小的成就只不過是個開始。」

SQuAD為世界公認最具挑戰性的機器閱讀測試之一，系統內建了大約500篇的維基百科文章，以這些文章為基礎，編輯出超過10萬個問答，挑戰者需要構築機器學習模組來回答問題。這類的資料集一開始是為了機器學習研究所設計，用以建置解答預測模型。

▼近年來，許多國家都在積極發展人工智慧（AI）。（圖／CFP）

▲▼AI,人工智慧。（圖／視覺中國CFP）