ETtoday > 熱搜關鍵字 > 語音AI

語音AI

OpenAI全力強化語音AI 備戰首款「無螢幕」個人裝置

OpenAI 正加速布局「以語音為核心」的下一代 AI 裝置。外媒指出,OpenAI 近來大幅整合內部研發資源,全面強化音訊人工智慧能力,為未來推出首款主打語音互動、幾乎不依賴螢幕的消費級硬體產品提前鋪路。

3秒就能複製聲音!阿里通義升級百聆語音模型 支援9語言18方言

阿里巴巴旗下「通義」團隊近日宣布,旗下「百聆」語音模型推出全新版本並正式開源。官方表示,新模型僅需約 3 秒的語音樣本,即可進行跨語言、跨方言的音色複製與語音生成,支援 9 種語言與 18 種中文方言,同時可控制情緒語氣,應用場景涵蓋語音助理、直播配音與無障礙服務等。

Google Gemini Live大升級 節奏與音調更接近真人

Google 今(13日)宣布針對語音互動服務「Gemini Live」推出多項重大更新,新增語速即時調整、語氣自適應、口音選擇與多模態整合等功能,進一步提升語音 AI 的自然度與互動流暢性。

限時免費試用!ElevenLabs推出語音助理11ai 支援千種語音與客製聲音

語音生成技術新創公司ElevenLabs今(24日)宣布推出全新實驗性產品「11ai」,這是一款以語音為優先的個人AI助理,內建多項應用整合功能,主打可連接MCP伺服器、支援自然語音對話、即時任務管理與資訊查詢。

六月限時2折!ElevenLabs推出v3語音模型 支援複雜情緒與角色互動

AI語音生成領導品牌ElevenLabs宣布推出新一代語音模型「Eleven v3(alpha版)」,主打更深層的語意理解與情緒表達能力,支援使用「音訊標籤」精準控制語音情感、語氣與非語言反應。該版本目前開放體驗,六月期間提供2折優惠,並預告即將開放API。

新版語音AI能分辨「嗯、啊」!ElevenLabs讓客服回應節奏更自然

語音AI領導者ElevenLabs正式推出Conversational AI 2.0,大幅升級其語音代理平台,為企業提供更自然的對話體驗、多語言支援、資料保護及跨模態應用,宣告語音人工智慧正式進入「擬人化」與「高度可擴展」的新世代。此次2.0版本距離前一代僅相隔四個月,卻帶來跨越式進化,特別針對企業需求強化安全與隱私合規,並導入即時知識檢索(RAG)、自動語言辨識、多角色切換等關鍵技術。

熱門新聞

最夯影音

更多

熱門快報

回到最上面