畫圈搜尋現在可以幫助學生完成回家功課
「畫圈搜尋」直接內建在使用者體驗裡,只要用簡單的手勢,就以搜尋在手機上看到的任何內容,而且不需要停止正在進行的操作,或切換到其他應用程式。自從在三星Unpacked發布以來,Google為畫圈搜尋新增了全螢幕翻譯等新功能,並且把這項功能擴大,支援更多Pixel和三星裝置。
從今天開始,學生可以直接用手機和平板電腦畫圈搜尋,輕鬆完成回家功課。當學生圈出他們遇到困難的部分時,不用離開數位資訊表或課程大綱,便能獲得逐步的指引,解決許多物理和數學應用題。今年稍晚,畫圈搜尋還能更進一步解決與符號公式、圖表和圖形等相關更複雜的問題。這些都可以透過應用Google專門針對學習進行微調的新模型系列 LearnLM 來實現。目前畫圈搜尋已經在超過1億台裝置上使用,Google計劃今年年底讓使用者人數翻倍。
Gemini更能理解情境脈絡,協助使用者完成工作
Android系統上的Gemini是一種新型助理,可以透過生成式AI來提高創造力和工作效率。這種整合到Android系統裡的體驗,能更準確地瞭解使用者螢幕畫面上內容的上下文,還有正在使用的應用程式。
不久之後,使用者就能夠在使用的應用程式上叫出Gemini的附加功能,用更輕鬆、更多元的方式來使用Gemini。例如,把生成的圖片拖放到Gmail、Google訊息和其他地方,或在YouTube影片中點擊「詢問有關這部影片的問題」,獲取特定資訊。如果是Gemini Advanced使用者,還能夠透過「詢問有關這個 PDF的問題」選項快速獲得答案。此功能將在未來幾個月之內,向數億台裝置推出這項更新。
Gemini Nano將具備完整的多模態功能
Android是首創裝置內建有基礎模型的行動作業系統,今年稍晚,從Pixel開始,Gemini Nano將具備全面的多模態功能,除了處理文字輸入外,手機還能理解更多與上下文相關的資訊,像是影像、聲音和口說對話等。
透過 TalkBack 獲得更清晰的描述內容
今年稍晚,Gemini Nano的多模態功能將整合到TalkBack功能裡,幫助視障使用者獲得更豐富、更清晰的影像描述。TalkBack使用者平均每天會遇到90張未標記的圖片。這項更新,將會幫助彌補影像資訊不全的問題,未來無論是家人朋友傳來照片中的更多細節,或是網路購物時要選擇的衣服款式和剪裁,都能輕鬆掌握資訊。由於Gemini Nano是直接在裝置上運作,因此能快速取得這些描述,而且即使沒有網路時也能正常運作。
在電話中接收可疑詐騙警報
根據2023年10月的一份報告,在報告發表當下的過去12個月中,人們因為詐騙造成的損失超過1兆美元。Google也正在測試一項Gemini Nano的新功能,在通話過程中如果偵測到與詐騙有關的對話模式,就會立即發出警報。例如,如果有一個「銀行代表」提出不常見的銀行要求,要求用戶緊急轉帳、使用禮品卡付款,或是提供PIN碼或密碼這種個人資訊,使用者就會收到警報。這項保護可以直接在裝置上進行,因此對話能夠完全保密。Google預計今年稍晚與大家分享更多關於這項選用功能的資訊。
Google也表示未來將會繼續透過Pixel、三星和更多產品,將Google AI融入智慧型手機體驗的各個層面,並稍晚會再分享Android 15和Android生態系的相關資訊。
延伸閱讀:Google I/O 2024