阿里巴巴AI模型在閱讀測驗SQuAD 以82.44高分擊敗人類

▲▼史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網)

▲美國史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網,下同)

大陸中心/綜合報導

阿里巴巴與微軟近日都參加了由美國史丹福大學發起的SQuAD(Stanford Question Answering Dataset)問答挑戰賽,他們各自使用自家研發的人工智慧(AI)閱讀系統來回答問題,在經歷10萬條問題的隨機測驗後,雙方都在測驗中擊敗人類所創造的最高分數82.304,刷新紀錄。

據《CNET News》報導,人類過去在SQuAD測驗拿下最高的成績是82.304分,這次阿里巴巴研究部門 iDST所開發的人工智慧(AI)機器學習模型,在回答完一份由10萬條題目所組成的題目庫問題後,在 1 月 5 日以82.44分的分數首度超越人類,接著微軟在相同的測驗中,在1 月 3 日以82.650分同樣超越人類記錄。

報導指出,阿里巴巴旗下的資料科學與技術研究所(Institute of Data Science and Technologies,iDST)首席科學家Luo Si表示,很榮幸能見到這歷史性的一刻,未來也會將此技術應用在各種不同的領域上,「這項科技可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。」

▼阿里巴巴與微軟並列第一,分別以82.4跟82.65分打破人類最高紀錄82.3分。

▲▼史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網)

報導提及,這項測試吸引了Google、Facebook、IBM、微軟、卡內基梅隆大學、史丹福大學等研究單位參加。另外,許多單位也會在一年內,多次參加測驗來了解AI系統進步的進度,例如微軟在 2017 年 12 月 17 日得到 82.136 的成績,而阿里巴巴則是在同年 12 月 28 日獲得 79.199 分。

另據《中評社》17日報導,微軟亞洲研發中心助理主管周明(Ming Zhou)表示,史丹福大學問答數據集的結果具有很重要的意義,但人類仍然比機器更擅長理解語言的複雜性以及分辨細微的差別,「自然語言處理領域依然存在不少挑戰,需要我們進一步努力,這個小小的成就只不過是個開始。」

SQuAD為世界公認最具挑戰性的機器閱讀測試之一,系統內建了大約500篇的維基百科文章,以這些文章為基礎,編輯出超過10萬個問答,挑戰者需要構築機器學習模組來回答問題。這類的資料集一開始是為了機器學習研究所設計,用以建置解答預測模型。

▼近年來,許多國家都在積極發展人工智慧(AI)。(圖/CFP)

▲▼AI,人工智慧。(圖/視覺中國CFP)

★ 版權聲明:圖片為版權照片,由CFP視覺中國供《ETtoday新聞雲》專用,任何網站、報刊、電視台未經CFP許可,不得部分或全部轉載,違者必究!

關鍵字:阿里巴巴,微軟,史丹福大學,SQuAD,Stanford Question Answering Dataset,人工智慧,AI,iDST,Luo Si,Google,Facebook,IBM,微軟,卡內基梅隆大學,微軟亞洲研發中心,周明

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

水桶腰阿柴咬飯碗怒摔 眼神死瞪奴才:啊晚餐勒!?

大陸熱門新聞

就是不喝水 男喝整箱飲料昏迷一..

床的世界、和成研發長照產品登陸

核發居住證 陸跨藍綠直接對台

母衝刺猛推撞車!男童急煞下秒更..

104名台灣妹入職廈航

網紅簽生死狀產子 醫生成功卻怒..

她懷孕4月 渣男友與家人全失蹤

評/核發居住證 兩岸民眾選邊站

開電梯疑撞白衣鬼 女嚇瘋腿軟

85度C門市遭突擊 店面一夕空..

20日領件!台胞大陸居住證採「..

台胞居住證 促兩岸「生活統一」

假疫苗案 前食藥監官員吳湞在列

貨車鋼捲滾落 砸死等紅燈女駕駛

相關新聞

讀者迴響

發燒話題

熱門新聞

最夯影音

更多

熱門快報

回到最上面