阿里巴巴AI模型在閱讀測驗SQuAD 以82.44高分擊敗人類

▲▼史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網)

▲美國史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網,下同)

大陸中心/綜合報導

阿里巴巴與微軟近日都參加了由美國史丹福大學發起的SQuAD(Stanford Question Answering Dataset)問答挑戰賽,他們各自使用自家研發的人工智慧(AI)閱讀系統來回答問題,在經歷10萬條問題的隨機測驗後,雙方都在測驗中擊敗人類所創造的最高分數82.304,刷新紀錄。

據《CNET News》報導,人類過去在SQuAD測驗拿下最高的成績是82.304分,這次阿里巴巴研究部門 iDST所開發的人工智慧(AI)機器學習模型,在回答完一份由10萬條題目所組成的題目庫問題後,在 1 月 5 日以82.44分的分數首度超越人類,接著微軟在相同的測驗中,在1 月 3 日以82.650分同樣超越人類記錄。

報導指出,阿里巴巴旗下的資料科學與技術研究所(Institute of Data Science and Technologies,iDST)首席科學家Luo Si表示,很榮幸能見到這歷史性的一刻,未來也會將此技術應用在各種不同的領域上,「這項科技可以應用在客服、美術館導覽,甚至是回答病患的醫療問題。」

▼阿里巴巴與微軟並列第一,分別以82.4跟82.65分打破人類最高紀錄82.3分。

▲▼史丹福大學發起SQuAD問答測驗。(圖/翻攝自SQuAD官網)

報導提及,這項測試吸引了Google、Facebook、IBM、微軟、卡內基梅隆大學、史丹福大學等研究單位參加。另外,許多單位也會在一年內,多次參加測驗來了解AI系統進步的進度,例如微軟在 2017 年 12 月 17 日得到 82.136 的成績,而阿里巴巴則是在同年 12 月 28 日獲得 79.199 分。

另據《中評社》17日報導,微軟亞洲研發中心助理主管周明(Ming Zhou)表示,史丹福大學問答數據集的結果具有很重要的意義,但人類仍然比機器更擅長理解語言的複雜性以及分辨細微的差別,「自然語言處理領域依然存在不少挑戰,需要我們進一步努力,這個小小的成就只不過是個開始。」

SQuAD為世界公認最具挑戰性的機器閱讀測試之一,系統內建了大約500篇的維基百科文章,以這些文章為基礎,編輯出超過10萬個問答,挑戰者需要構築機器學習模組來回答問題。這類的資料集一開始是為了機器學習研究所設計,用以建置解答預測模型。

▼近年來,許多國家都在積極發展人工智慧(AI)。(圖/CFP)

▲▼AI,人工智慧。(圖/視覺中國CFP)

★ 版權聲明:圖片為版權照片,由CFP視覺中國供《ETtoday新聞雲》專用,任何網站、報刊、電視台未經CFP許可,不得部分或全部轉載,違者必究!

關鍵字:阿里巴巴,微軟,史丹福大學,SQuAD,Stanford Question Answering Dataset,人工智慧,AI,iDST,Luo Si,Google,Facebook,IBM,微軟,卡內基梅隆大學,微軟亞洲研發中心,周明

※本文版權所有,非經授權,不得轉載。[ ETtoday著作權聲明 ]

大陸熱門新聞

18名同事合包1314紅包 新..

快訊/習近平:港珠澳大橋正式開..

準新娘蒸發2個月 失蹤前到工地..

被貨車輾過 男童目睹好友亡大哭

小六女砍同學頭顱 因一句話分屍..

酒駕送妹找男友被抓 最狂工具人..

馬拉松擋婚禮!新娘急哭:讓我過

女學生眼被打 10歲男同學遭家..

10歲童刷57萬買裝備 母:自..

網友送花圈...網紅的爺爺氣到..

大媽竊12萬Gucci包 整夜..

港珠澳橋設計師:台海大橋問題並..

世界最長!港珠澳大橋「八大特點..

港珠澳大橋「建設秘辛」曝光

相關新聞

讀者迴響

發燒話題

熱門新聞

最夯影音

更多

熱門快報

回到最上面