I/O大會一文速覽 新模型不是重點 谷歌要讓AI進入一切


摘要:AI開始“模擬現實”
作者:董雨晴,鳳凰網科技
“這是一個非凡的時刻。這是一個超高速發展的時期。”
北京時間5月20日凌晨,谷歌CEO Sundar Pichai在I/O大會上,用一句話定調了谷歌當前對AI行業的判斷。在鳳凰網科技看來,與其說這是一場技術發佈會,不如說谷歌在向外界傳遞一個清晰的信號:當行業還在追逐參數榜時,谷歌已經把戰火燒到了“世界模型”和“極致性價比”兩條新賽道上了。
Gemini Omni正式登場:AI開始“模擬現實”
今天最值得關注的模型更新,不是某個跑分更高的文本模型,而是Gemini Omni。
谷歌將Omni定義爲“世界模型”向前邁出的關鍵一步。用Pichai的話說,AI正從預測文本轉向模擬現實,而Omni是第一個“可以從任何輸入生成任何輸出模態”的模型,這次率先落地的是視頻輸出。
谷歌DeepMind首席架構師Korai在講解中放出了一段演示:給Omni一個簡單的提示詞“蛋白質摺疊的解說”,模型直接生成了一段講解蛋白質如何從氨基酸鏈摺疊成α螺旋和β摺疊、最終形成三維形狀的視頻。並且,這個視頻還不是從素材庫拼接的,而是基於模型在訓練中積累的知識直接生成的。換句話說,Omni開始展現出對“直覺物理學”的理解——它沒有在檢索信息,而是在模擬現實世界的運行邏輯。

行業感到興奮的是Omni在視頻編輯上的能力。Korai演示了用戶上傳自己的視頻後,Omni能基於音頻、圖像和視頻等多種輸入進行跨模態推理,然後自然地對角色、細節、風格進行改變。某種意義上看,這相當於把Nano Banana在圖像編輯上重新定義規則的能力,完整複製到了視頻領域。
Omni Flash將從本週二起向Google AI訂閱用戶開放,用戶可以在Gemini應用、Google Photos和YouTube Shorts上體驗。值得注意的是,所有由Omni創建或編輯的內容,都會被嵌入谷歌不可察覺的數字水印,以應對急迫的安全倫理問題。Pichai同時宣佈,OpenAI和ElevenLabs正在採用SynthID 2,這種跨行業合作在AI透明度議題上並不多見。
Gemini 3.5 Flash:一場針對成本的“閃電戰”
如果說Omni是谷歌向未來的技術儲備,那Gemini 3.5 Flash就是一把當下刺向市場痛點的快刀。
根據谷歌官方數據,3.5 Flash在幾乎所有基準測試中都超越了上一代旗艦模型3.1 Pro,編碼能力尤其進步巨大,在衡量現實經濟價值任務的GDP Val基準上實現了“非凡飛躍”。但真正的殺傷力不在跑分。

Pichai在臺上給出了一組清晰的對比:3.5 Flash的智能處於前沿水平,幾乎與市面上最好的模型持平,但它的輸出速度是其他前沿模型的四倍。在谷歌內部爲Anti Gravity平臺優化後,速度優勢甚至拉大到12倍。

實際上,這種組合應用在谷歌內部直接改變了遊戲規則。
速度背後是成本邏輯。Pichai罕見地替企業CIO算了一筆賬:“我聽到很多CIO說公司快用完年度Token預算了。假如他們拿出80%的工作負載從別家模型切換到3.5 Flash,一年能省超過10億美元。”這種用真金白銀做武器的話術,等於向企業市場直接攤牌:谷歌要走量、要規模、要用性價比清場。
支撐這種性價比的,也逃不開谷歌自研的第八代TPU。這次谷歌首次採用雙芯片設計(CPU 80和8 I),爲訓練和推理分別優化架構。更重要的是,谷歌通過多機多任務訓練框架“Pathways”技術,將訓練分佈到全球超過100萬個TPU上,創建了全球最大的訓練集羣。Korai透露了一個內部數據:今年3月谷歌內部每天處理0.5萬億Token,現在已飆升至每天超過3萬億Token,幾周就翻一番。這種內部大規模使用形成的反饋閉環,正是把成本不斷壓低的核心引擎。
生態卡位:從開發者到購物車,全面“包圍”
模型之外,谷歌今天展示的生態系統打法同樣值得深究。
在開發者側,谷歌發佈了Anti Gravity 2.0,一個獨立桌面應用,可以讓用戶編排多個AI智能體並行完成任務:一個寫網站代碼,一個生成品牌素材,一個做產品架構。同時推出的還有命令行界面和SDK,等於給了程序員與谷歌自身產品同等能力的智能體工具包。
在安全領域,谷歌展示了一款名爲Covenant的工具,能利用Gemini模型自動查找並直接修補代碼漏洞,而不只是發現。這顯然是在瞄準大型企業對安全自動化日益增長的需求。
但真正能讓谷歌流量入口繼續坐穩的,是搜索和購物體驗的改造。
搜索負責人Liz Reid確認,AI Mode模型已升級至3.5 Flash。一組數據佐證了這種AI搜索的勢能:AI Overviews月活超25億,AI Mode推出僅一年月活破10億,搜索查詢量在上季度達到歷史最高點。谷歌順勢推出了25年來最大的一次搜索框升級,支持更長的對話式查詢和AI驅動的建議系統,並將從夏季開始允許用戶創建在後臺7×24小時工作的“信息智能體”。
購物場景的野心更大。谷歌商務負責人Vidhya展示了“Universal Card”智能購物車,能跨設備、跨商家運作:用戶可以在搜索、YouTube、Gmail中隨時添加商品,購物車在後臺自動查優惠、監控降價、補貨提醒,甚至能根據用戶錢包裏的多張銀行卡,自動計算用哪張卡結算最划算。配合已獲得亞馬遜、Meta、微軟等支持的通用商務協議(UCP)和保障支付的AP2協議,谷歌正在搭建一個讓AI智能體安全花錢的完整商業閉環。
在個人助手層面,全新的Gemini Spark定位爲7×24小時運行在雲端的個人AI智能體。比較可怕的是,即使你關掉電腦或手機,它仍在後臺繼續完成任務。Spark將首先面向可信測試者開放,隨後以每月100美元的新Ultra套餐價格推出。
看完這場發佈會的全部內容,我們的一個核心感受是:谷歌已經不再把AI當成單一的產品競賽,而是把它變成了一個從芯片到模型、從開發者到消費者、從搜索到購物的全棧戰爭。用Omni去定義“理解世界”的技術上限,用3.5 Flash去打穿商業化的價格底線,再用搜索、地圖、購物、郵件等國民級應用完成場景收割——這套組合拳的背後,是谷歌對自己規模優勢的最大化利用。
當然,挑戰同樣清晰。Spark智能體能否跨過用戶隱私和信任的門檻?Omni的視頻生成能力在開放後能否守住安全邊界?這些問題的答案,將決定谷歌這盤AI大棋的終局成色。
來源:金色財經













