在這滿滿AI的Google I/O中,首先看到Gemini相簿上的應用加入「Ask Photos」功能,用戶只要對Gemini說想要尋找的特定情境照片,如自己的車牌號碼、小孩在游泳池畔等指令,Gemini便會從相簿中找出符合指令情境的照片。在Worksppace中,Gemini能夠幫用戶從gmail、meet中找出想要摘要重點的信件或會議。

Ask Photos-讓用戶透過下達更精準的指令能從照相簿中找到想要的照片。翻攝Google YouTube。
Ask Photos-讓用戶透過下達更精準的指令能從照相簿中找到想要的照片。翻攝Google YouTube。
透過鏡頭來請Gemini回答眼前的問題。翻攝Google YouTube。
透過鏡頭來請Gemini回答眼前的問題。翻攝Google YouTube。
Veo是透過指令製作AI影片的新功能。翻攝Google YouTube。
Veo是透過指令製作AI影片的新功能。翻攝Google YouTube。

Google也為Gemini加入了語音的對話功能,稱之為Gemini Live,其中可以透過手機鏡頭來即時回應的「Project Astra」在會場中透過影片演示,拿著Gemini的手機,利用手機背面的鏡頭行進對話。使用者沿路問Gemini辦公室的聲音是哪裡發出來的?如何用桌上的彩色鉛筆做出生動的描述?桌上電腦螢幕中的程式碼是什麼?甚至還能問他剛剛是否有看到使用者的眼鏡,Gemini也能流暢且迅速的回答出使用者眼鏡就放在剛剛桌上有著紅色蘋果的位置。

可以直接透過鏡頭詢問Gemini。翻攝Google YouTube。
可以直接透過鏡頭詢問Gemini。翻攝Google YouTube。

Gemini加入了影片製作功能-Veo,透過指令的輸入能生成長達1分鐘的高畫質AI影片,並預告近期會開放。

在Google搜尋方面,Gemini加入對多個單字解讀能力,例如可以在Google搜尋中輸入請他設計7天健康自己做的菜單、附近親子友善、寵物友善餐廳等,「Ask Videos」,則是加入了鏡頭協助辨識,例如相機壞了,就能直接開啟鏡頭對著壞掉的相機問Gemini為什麼相機的這邊壞掉,Gemini就會進行搜尋後回答你可能的原因與解決的方式。 

為了提供更加個人化的體驗,Gemini Advanced訂閱者很快就能建立自訂版的Gemini-Gem。用戶可以根據自己的需求,像是個人專屬的健身夥伴、廚房助手、編寫程式碼的搭擋,甚或是創意寫作的導師等等來打造出自己風格的Gem。建立Gem的方式非常簡單,只需要描述自己希望Gem能完成什麼任務,以及想要的回應風格,像是:「你是我的路跑教練,用要正向、樂觀和激勵的方式來幫我排定每天的慢跑訓練計畫。」告訴Gemini這些指示後,只需要透過一個點擊,它就能延伸這些指令,建立符合你的特定需求的 Gem。

打造專屬Gemini個人助理Gem。翻攝Google YouTube。
打造專屬Gemini個人助理Gem。翻攝Google YouTube。

Google預告將整合更多Google工具到Gemini裡面,包括Google日曆、Google Tasks和Google Keep。 部分更新功能也將於即日起對企業客戶開放,許多新功能則會於日後陸續推出。

全場共提到了120次「AI」。翻攝Google YouTube。
全場共提到了120次「AI」。翻攝Google YouTube。
延伸閱讀:Google I/O 2024

點擊閱讀下一則新聞 點擊閱讀下一則新聞
鋼市浮現正向訊號 中鋼董座黃建智:川普2.0矽鋼片可望受惠