阿里巴巴AI模型在閱讀測驗SQuAD 以82.44高分擊敗人類

▲▼史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網)

▲美國史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網,下同)

大陸中心/綜合報導

阿里巴巴與微軟近日都參加了由美國史丹福大學發起的SQuAD(Stanford Question Answering Dataset)問答挑戰賽,他們各自使用自家研發的人工智慧(AI)閱讀系統來回答問題,在經歷10萬條問題的隨機測驗後,雙方都在測驗中擊敗人類所創造的最高分數82.304,刷新紀錄。

據《CNET News》報導,人類過去在SQuAD測驗拿下最高的成績是82.304分,這次阿里巴巴研究部門 iDST所開發的人工智慧(AI)機器學習模型,在回答完一份由10萬條題目所組成的題目庫問題後,在 1 月 5 日以82.44分的分數首度超越人類,接著微軟在相同的測驗中,在1 月 3 日以82.650分同樣超越人類記錄。

報導指出,阿里巴巴旗下的資料科學與技術研究所(Institute of Data Science and Technologies,iDST)首席科學家Luo Si表示,很榮幸能見到這歷史性的一刻,未來也會將此技術應用在各種不同的領域上,「這項科技可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。」

▼阿里巴巴與微軟並列第一,分別以82.4跟82.65分打破人類最高紀錄82.3分。

▲▼史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網)

報導提及,這項測試吸引了Google、Facebook、IBM、微軟、卡內基梅隆大學、史丹福大學等研究單位參加。另外,許多單位也會在一年內,多次參加測驗來了解AI系統進步的進度,例如微軟在 2017 年 12 月 17 日得到 82.136 的成績,而阿里巴巴則是在同年 12 月 28 日獲得 79.199 分。

另據《中評社》17日報導,微軟亞洲研發中心助理主管周明(Ming Zhou)表示,史丹福大學問答數據集的結果具有很重要的意義,但人類仍然比機器更擅長理解語言的複雜性以及分辨細微的差別,「自然語言處理領域依然存在不少挑戰,需要我們進一步努力,這個小小的成就只不過是個開始。」

SQuAD為世界公認最具挑戰性的機器閱讀測試之一,系統內建了大約500篇的維基百科文章,以這些文章為基礎,編輯出超過10萬個問答,挑戰者需要構築機器學習模組來回答問題。這類的資料集一開始是為了機器學習研究所設計,用以建置解答預測模型。

▼近年來,許多國家都在積極發展人工智慧(AI)。(圖/CFP)

▲▼AI,人工智慧。(圖/視覺中國CFP)

★ 版權聲明:圖片為版權照片,由CFP視覺中國供《ETtoday新聞雲》專用,任何網站、報刊、電視台未經CFP許可,不得部分或全部轉載,違者必究!

關鍵字:阿里巴巴,微軟,史丹福大學,SQuAD,Stanford Question Answering Dataset,人工智慧,AI,iDST,Luo Si,Google,Facebook,IBM,微軟,卡內基梅隆大學,微軟亞洲研發中心,周明

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

正妹「把車窗當鏡子」忘情喬奶 駕駛坐車內錄全程:茂係啊!

大陸熱門新聞

她興奮開全新賓士車 車體秒裂3..

氫化爐爆炸!男遭「火柱噴射」衝..

佔路肩堵救護車!她下跪求讓道…..

13歲女童靠代寫作業 月入4...

機車撞計程車!後座女拋飛爆頭亡

娶同學媽媽 男大生:第一眼就迷..

即/內蒙古礦井事故 至少20死..

以權謀財色 網路沙皇落馬遭雙開

小米9「沙漠桌布」爆抄襲蘋果

26歲空姐離奇墜樓毀容!失憶4..

廊橋技藝列急需保護非物質文化遺..

陸為「習慣用法」修改字典讀音

特斯拉Model 3提早到貨上..

「狗舔手傷口」患狂犬病!童病發..

相關新聞

讀者迴響

發燒話題

熱門新聞

最夯影音

更多

熱門快報

回到最上面