ETtoday > 熱搜關鍵字 > 語音辨識

語音辨識

監管創新竟成「肛門命運」 香港Web3嘉年華AI翻譯失誤全場傻眼

香港 Web3 嘉年華現場發生 AI 翻譯出包事件,引發社群熱議。證監會官員在台上發言時,原本「監管促進創新」的內容,卻被即時字幕誤譯為「肛門命運」,相關畫面迅速在網路流傳。

Google悄悄上架離線AI聽寫App iPhone可本機轉錄還能自動潤稿

Google 再度擴大行動端 AI 版圖。Google 近日低調在 iOS 推出全新 AI 聽寫應用 Google AI Edge Eloquent,主打「離線優先」與本機運算,使用者下載語音模型後,即使沒有網路,也能直接在 iPhone 上進行即時語音轉文字,並自動去除贅詞、整理成更流暢的專業文本。

連「晶晶體」都聽得懂!台灣大「聽寫大哥」準確率達97% 打造最懂在地商務的AI大腦

隨著生成式AI技術突破,台灣大哥大運用電信本業龐大的語音數據優勢,開發出「AI聽寫大哥」的語音辨識系統(ASR),實現了從實驗室走向商業落地的關鍵突破,也標誌著台灣大哥大正式邁向「提供算力與大腦」的戰略佈局。

Google開源AI醫療影像工具 強化CT、MRI與臨床口述判讀 

Google 旗下研究團隊今(14日)宣布,正式推出 MedGemma 1.5 醫療生成式 AI 模型更新,並同步公開全新醫療語音轉文字模型 MedASR。此次更新主打「更進階的醫療影像理解」與「專為醫療情境優化的語音辨識」,希望協助開發者打造下一代醫療 AI 應用。

3秒就能複製聲音!阿里通義升級百聆語音模型 支援9語言18方言

阿里巴巴旗下「通義」團隊近日宣布,旗下「百聆」語音模型推出全新版本並正式開源。官方表示,新模型僅需約 3 秒的語音樣本,即可進行跨語言、跨方言的音色複製與語音生成,支援 9 種語言與 18 種中文方言,同時可控制情緒語氣,應用場景涵蓋語音助理、直播配音與無障礙服務等。

Meta發佈超大型語音AI系統 開源模型讓稀有語言「被聽見」

Meta 今(11日)宣布推出名為「Omnilingual ASR」的開放原始碼語音辨識模型套件,支援超過 1,600 種語言,並涵蓋約 500 種此前從未由任何自動語音辨識(ASR)系統服務的低資源語言。

陸發表首款「支援30種方言」語音辨識大模型

大陸電信公司中國電信25日發表一款新的語音辨識大模型,能夠辨識30多種方言,包含粵語 上海話、四川話、溫州話等,並可以同時辨識及理解,是中國大陸目前支援最多方言的語音辨識大模型。

臉書將「付費購買」用戶錄音 藉此改善語音辨識技術...每人最高可拿150元報酬

去年各大智慧語音助理供應商包括亞馬遜、蘋果、Google及微軟,皆被傳出在未告知用戶的情況下側錄用戶對話以改善語音系統。而臉書周四(20日)宣布,將向部分用戶「付費」獲取這些錄音,以改善其語音識別技術。

朋友修行中!語音喊「摩訶咻哩」淨口業咒 她一看「修理X4」笑噴:車行嗎

許多人滑手機懶得打字的時候,就會用語音辨識,但系統有時可能會跳出讓人噴笑的結果。一名女網友貼出LINE截圖,說她有位修行的朋友,對方想用語音辨識系統打出淨口業咒,結果說出來的跟手機顯示的字,讓原PO忍不住笑炸,「好好一句莊嚴的淨口業變成這樣……不說以為他機車行老闆咧!」

微軟AI新里程碑!機器翻譯大突破 中翻英可達人類水平

一組微軟研究團隊於本週3/14(三)宣布,他們已經創造了第一個能夠將中文新聞翻譯成英文的機器翻譯系統,精確度與人類譯者一致。

路癡有救了! 未來Google地圖連室內都看的到

地圖製作還牽扯到另一項技術:虛擬實境技術。漢克感興趣於「步行者世界的地圖」,即那些你在 Google 地圖上看不到的室內空間、隱私場所。漢克認為,未來,人們將會戴上虛擬實境眼鏡,這種地圖是很有必要的。

嗨我在煮蛋!美國婦認真評論 語音辨識出賣她「對話全PO」

現代科技越來越發達,許多人喜歡使用「語音辨識」的功能,直接把聲音轉成文字,省去打字的麻煩。美國有一名紐約時報的忠實女讀者,卻因此在一篇文章底下發表了超怪留言,第一句正經的評論後出現了「哈囉」、「嗨」等日常對話,原來是她忘記關掉語音辨識,讓她和鄰居的對話全都PO上網了。

影/全力發展機器學習 Google五大服務再進化

Google執行主席Eric Schmidt日前宣布,「機器學習」(Machine Learning)是Google下一個發展重心,在「機器學習」加持下,包括Gmail、Google相簿(Google Photos)、Google翻譯、Google語音搜尋,以及虛擬實境等多項服務,品質皆明顯提升。

影/想請Google大神找資料? 出一張嘴就好

想使用Google搜尋資料,用嘴說,肯定比打字更方便。Google持續強化語音搜尋App功能,會根據使用者的發音,找出最接近的字詞,進行搜尋,並在最短時間內,把搜尋結果回傳至使用者的手機。

影/出國擔心語言不通?Google翻譯「拍一下」就秒懂

許多人在出國前,都擔心語言不通的問題,面對招牌、菜單上的陌生文字,就怕一不小心會錯意,鬧出糗事。為此,Google翻譯App持續精進不同語言之間的轉譯功能,只要拿起手機,對著不懂的文字按下拍攝鍵,就可譯成使用者能夠理解的語言。

影/Google相簿會認人 用電腦視覺幫你整理、搜尋照片

多年前隨手拍下的照片,如今想找,卻不知從何找起嗎?為解決上述問題,Google相簿(Google Photos)持續精進「電腦視覺」(Computer Vision)功能,自動根據相片上的人臉、地點、物件,進行辨認並分類,協助使用者快速整理、搜尋相片。

谷歌大神會更聰明 Google:機器學習是未來發展重心

Google大神持續進化!Google執行主席Eric Schmidt表示,「機器學習」(Machine Learning)是Google下一個發展重心,透過「機器學習」,Google不僅能加強Gmail垃圾郵件辨識度,還可降低翻譯錯誤率,就整體表現而言,「Google會更聰明,服務更完美!」

熱門新聞

最夯影音

更多

熱門快報

回到最上面