【編譯葉亭均、易起宇/綜合報導】Google推出新的生成式AI模型「Gemini」,將首度可直接在手機上運作,這將為該公司與ChatGPT開發商OpenAI等同業的競爭帶來突破。
英國金融時報(FT)報導,Google形容Gemini為該公司「最大、最有能力、最通用」的AI系統,可分析影像和聲音資訊,並具有複雜的推理和「規畫」能力。這套系統6日已用來驅動Google的聊天機器人Bard,明年起將更廣泛整合到Google的搜尋引擎上。
Gemini的其中一個版本「nano」,是專門為了在行動裝置上運作而設計,並將整合到Google最新的Pixel手機裡。Google表示,這個模型將在手機上「原生運作」,並已針對手機做過優化,因此Android開發人員將能輕鬆打造出可離線使用的AI應用程式與功能,或是使用裝置上的個人資訊時,更能保持隱私。
這項進步將有助解決AI技術帶來的經濟問題。只用手機的運算能力就能運作生成式AI,而不需透過科技大廠營運的雲端伺服器來運作,將大幅降低運作生成式AI的成本。這也將為想把私密資料留在手機的用戶提供一層保障。
Google暨Alphabet執行長皮柴在部落格文章表示,「我相信,我們現在看到的AI轉型,將是我們一生中最深遠的轉變,遠超過先前邁向手機或邁向網路的轉變」。
生成式AI已在矽谷為科技大廠開闢1塊新戰場。在Google發表這個最新生成式AI系統前,微軟出資支持的OpenAI、Meta,以及Anthropic、Mistral等新創公司都發表了AI模型。
Google表示,Gemini是第一款在特定任務上表現超越人類專家的AI模型,在多項測試中超越OpenAI的GPT4模型。特別的是,這個模型能解決數學推理問題、分析科學數據和編寫進階程式碼。
Google展示如何用Gemini掃描手寫的數學算式,並標出當中錯誤和解釋原因。科技類YouTuber馬克.羅伯則使用整合了Gemini的Google聊天機器人Bard,拍攝一段影片,並在影片中測試打造最具空氣動力學的紙飛機,這款AI模型為他的實驗和設計提供改進建議。 |