▲Gemini正式支援「即時鏡頭畫面(Live Camera)」與「螢幕分享(Screen Sharing)」功能。(圖/Google)
記者吳立言/綜合報導
Google 今(21日)於開發者大會正式宣布,旗下AI助理Gemini正式支援「即時鏡頭畫面(Live Camera)」與「螢幕分享(Screen Sharing)」功能,開放使用者即刻體驗。這代表Gemini不僅能理解文字與語音輸入,現在更具備「看見現場」與「即時協作」的能力。
使用者透過手機鏡頭拍攝眼前物品,Gemini即可即時辨識畫面內容並給予回應,例如幫忙解讀說明書、分析物品種類、或提供步驟指導。而螢幕分享功能則能讓Gemini看到使用者手機或電腦畫面,並針對操作內容提供協助,像是設定教學、表格編輯、翻譯文件等。而在現場,Google也透過影片「實機示範」該功能,只看到在路上隨處看到的東西,Gemini都可以協助糾正並查訊,像是詢問「為什麼路邊會有包裹」,Gemini就即時糾正「這是電箱,不是包裹」。
Google表示,這次更新是Gemini 向「多模態AI助理」進化的重要一步,讓AI更能理解使用者所處的真實情境,強化語言以外的互動能力,推動日常應用場景升級。
讀者迴響