| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

谷歌: 谷歌推出最新AI模型,皮查伊要幫大客戶年省10億


請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
作者聲明:該圖片由AI生成




圖片由AI生成


北京時間5月20日凌晨,谷歌CEO Sundar Pichai在Google I/O 2026的舞台上算了一筆賬,谷歌頭部大客戶每天可以處理約1萬億個token,如果把其中80%的工作負載從其他前沿模型切換到Google新發布的Gemini 3.5 Flash上,一年能省超過10億美元。

2026年谷歌I/O大會的核心主線仍然是agent,從agent平台(Antigravity)到消費者 agent(Spark)到搜索agent,Google要把agent做成全棧能力。

在這場長達兩小時的 Keynote 中,Google 發布了新一代 Gemini 3.5 系列模型、全模態世界模型Gemini Omni、第八代 TPU 雙芯片架構,以及從編碼工具升級為 agent 管理平台的Antigravity 2.0。

同時,我們也看到了一條新的主線變得更加清晰,Agentic AI時代已經走向中場,前沿模型的核心戰場,也在從拼“最強最聰明”,轉向了把agent 的運行成本壓到企業敢大規模部署的門檻以下。



01 前沿智能+極致速度+一半價格?

谷歌這次發布了Gemini 3.5系列模型,打頭陣的是當天就上線的Gemini 3.5 Flash。



過去幾年,企業在用生成式AI時一直面臨一個痛苦的抉擇。最能幹的模型,通常又大又慢,查詢成本也高。反過來,那些更快、更便宜的模型,往往要犧牲准確性。

Gemini 3.5 Flash號稱要改變這種局面。

皮查伊將它描述為谷歌內部的“游戲規則改變者”,用起來“令人難以置信的愉悅”。

他給出了一個直觀的對比:Gemini 3.5 Flash的整體表現,全面超過了四五個月前還是谷歌頂級旗艦的Gemini 3.1 Pro。皮查伊的原話是:“Gemini 3.5 Flash比Gemini 3.1 Pro更好。它的性能能達到前沿模型的大約九成,速度快4倍,在Antigravity平台上甚至能快到12倍,而成本只有前者的三分之一到一半。”





在每秒輸出token數量上,Gemini 3.5 Flash是其他同類前沿模型的4倍。Google DeepMind首席技術官兼谷歌首席AI架構師科雷·卡武克庫奧盧(Koray Kavukcuoglu)補充說,一個優化版在同樣質量下可以快到12倍,這個版本從美國當地時間5月19日起在谷歌的智能體開發平台Antigravity上開放使用。

在一系列高難度測試中,Gemini 3.5 Flash展現出了強大的智能體和編程能力。它在Terminal-Bench 2.1測試中得分76.2%,在GDPval-AA中達到1656 Elo,在MCPAtlas中達到83.6%。多模態理解方面也很突出,CharXiv推理得分84.2%。



在第三方機構Artificial Analysis的智能與速度指數圖上,Gemini 3.5 Flash占據了右上角目前沒人能觸及到的位置。



用皮查伊的話說,這證明了“你不再需要在質量和速度之間二選一了”。

02 現場演示:復雜任務、多模態、可交互

大會上的幾個演示,直觀展示了Gemini 3.5 Flash處理復雜任務的能力。

在一個演示中,Gemini 3.5 Flash被要求根據動態標准,自動重命名和分類一批亂七八糟的資產文件。這不是簡單的關鍵詞匹配,模型需要先讀取每個文件的內容,理解實際用途,再按照預設的分類邏輯歸檔。整個過程涉及多個判斷和執行步驟,Gemini 3.5 Flash幾秒鍾就搞定了。





這套能力由升級後的Antigravity平台驅動,背後是多個協作的子智能體在並行處理。過去,這類工作可能需要開發者花上幾天來寫腳本,或者交給審計員花數周來手工整理。

另一個演示展示了Gemini 3.5 Flash的多模態生成能力。在AI Studio上,研究人員上傳了一篇學術論文,模型讀懂論文內容後,直接生成了一段解釋核心概念的交互動畫。



圖表不再是靜態的,觀看者可以拖拽參數、切換視角,觀察數據之間的動態關系。這種從文字到交互式視覺內容的直接轉換,靠的是Gemini 3底層的多模態基礎能力。

搜索方面的演示也同樣讓人印象深刻。在一個案例中,用戶在搜索框裡輸入關於Gyroid圖案的問題。利用Gemini 3.5 Flash增強的智能體編程能力,搜索結果不再是傳統的十條藍色鏈接,成為了一個交互式可視化頁面。



用戶可以在頁面上旋轉三維結構、查看不同截面的形態,整個過程不用跳轉到其他網站。負責谷歌搜索業務的莉茲·裡德(Liz Reid)說,這個新版搜索框是“自我們那個標志性搜索框首次亮相以來最大的升級”。

03 1900億資本支出和幫企業省 10億美元的模型

在這種能力基礎之上,對於那些在AI基礎設施上砸了很多錢的企業來說,Gemini 3.5 Flash可能帶來最直接的影響。

皮查伊指出,很多公司早就把全年的token預算用完了,“而現在才剛過五月”。他把Gemini 3.5 Flash定位成那些在規模化部署AI時成本失控的企業的“財務救生索”。

智能體工作流尤其消耗token。谷歌的模型API每分鍾處理大約190億個token,自有產品每月處理超過3200萬億個token,近一年內增長了七倍。而兩年前的I/O大會上,這個數字還只是每月9.7萬億。



在這種背景下,Gemini 3.5 Flash的價格不到同類前沿模型的一半。皮查伊算了一筆賬:對於那些在谷歌雲上每天處理大約1萬億個token的頂級客戶來說,如果把80%的工作量轉移到Flash和前沿模型的組合上,每年可以省下超過10億美元。這個數字足以改變企業的采購決策和項目回報率的計算方式。






Gemini 3.5成本優勢的根基是谷歌的基礎設施投入。皮查伊透露,谷歌2026年的資本支出預計在1800億到1900億美元之間,是四年前310億美元的差不多六倍。



其中一個重要投資方向是定制芯片。第八代TPU第一次采用雙芯片架構,分別為訓練(TPU v8o)和推理(TPU v8i)設計。針對推理優化的TPU v8i,讓谷歌能夠以比依賴通用GPU的競爭對手更低的成本運行模型,省下來的錢會轉給客戶。皮查伊說:“這意味著可以在幾周而不是幾個月內訓練出更大、更有能力的模型。”



04 Gemini Spark:私人AI管家

當模型足夠快、足夠便宜之後,就能從被動回答問題變成主動辦事的智能體。谷歌為此推出了Gemini Spark。



負責Google Labs和Gemini應用的副總裁喬什·伍德沃德(Josh Woodward)介紹說,Gemini Spark是一個7x24小時運行在谷歌雲專用虛擬機上的AI。就算你關了設備,它也能在後台繼續工作。Gemini Spark深度集成了Gmail、文檔、表格和幻燈片。



伍德沃德描述道:“當你使用它時,幾乎感覺就像你把東西甩到身後,Spark會接住它並完成工作。”

關於Spark具體能做什麼,伍德沃德透露了測試人員的幾個使用場景:策劃派對、跟蹤學校日程、監控收件箱中的問題。

安全方面,Gemini Spark在執行高風險操作前需要用戶明確批准。針對支付行為,谷歌推出了智能體支付協議,允許設置嚴格的使用范圍:批准哪些品牌、設置消費上限、限定哪些商家。谷歌計劃今年夏天擴展連接能力,讓Gemini Spark通過Chrome瀏覽器操作更多第三方應用和網站。

一批受信任的測試者本周拿到了訪問權限。下周,Gemini Spark將向美國Google AI Ultra訂閱用戶推出測試版。AI Ultra是谷歌同步推出的新訂閱套餐,月費100美元,面向開發者、技術負責人和高級創作者,提供對Antigravity的優先訪問權、更高的使用限制以及捆綁的Omni Flash訪問權。

圍繞Gemini Spark的是谷歌一系列面向普通消費者的布局。

先看用戶規模。Gemini應用月活用戶已從一年前的4億增長到9億多,搜索中的“AI模式”上線僅一年月活就突破10億,且每季度查詢量翻倍增長。




與此同時,谷歌還推出了兩項新服務:一是全天候監控網絡的信息智能體,可以主動跟蹤你關注的價格、股票或話題變化並及時提醒;二是基於谷歌錢包的AI通用購物車,支持跨不同電商網站統一管理和結算,省去分別登錄、分別付款的麻煩。

05 Gemini Omni:一個新物種

和Gemini 3.5 Flash、Gemini Spark一起亮相的,還有Gemini Omni——谷歌第一個真正的原生多模態模型。



卡武克庫奧盧特意把它和現有的視頻生成模型Veo做了區分:“Veo是一個文本到視頻的模型,而Gemini Omni是一個真正的多模態輸入、多模態輸出模型。”Gemini Omni可以接受文本、圖像、音頻和視頻的任意組合作為輸入,並在同樣的模態上生成輸出。所有處理都在一個統一的模型裡完成,而不是拼湊多個系統。

用戶通過對話就能一步步編輯和生成視頻,每一條指令都基於上一條,視頻隨著對話的推進連貫變化。谷歌高管的演示展示了幾個具體的編輯場景:

用戶上傳一段戶外騎行視頻,輸入指令“把背景換成雪地”,Gemini Omni在保持騎行者和自行車運動軌跡不變的情況下,把整個環境換掉了。接著用戶說“改成從側面跟拍的角度”,畫面的攝像機視角就跟著調整了。最後用戶要求“加上一段旁白解釋這條路線”,模型便生成了配樂和解說。整個過程在同一個對話線程裡完成,不需要導出文件、切換工具或者重新上傳。



卡武克庫奧盧還描述了更廣泛的應用前景:“你可以想象,當你在探索某些東西時,這能構建出非常類似於教程的能力。”谷歌特別強調了物理效果的改進——重力、動能、流體力學——這些細節決定了視頻看起來像實拍還是AI生成的。

在OpenAI年初為了釋放算力而放棄視頻生成工具Sora的背景下,谷歌這時候推出Gemini Omni,是對自己基礎設施實力的一次公開展示。卡武克庫奧盧還透露,團隊曾經讓智能體從零搭建一個可運行的操作系統(未透露名字),用來測試Gemini 3.5 Flash的能力邊界。

內容安全方面,所有Gemini Omni生成的內容都帶有谷歌SynthID數字水印,C2PA內容憑證也在擴展中。Antigravity平台上推出了AI內容檢測API。谷歌宣布OpenAI、Kakao和ElevenLabs也將采用SynthID。對於那些合規要求嚴格的企業來說,這套工具提供了可追溯的審計記錄。

Gemini Omni即日向美國Gemini付費用戶提供,未來幾周將通過Vertex AI API向開發者開放。谷歌還推出了一個“個人頭像”計劃,允許創作者錄制短視頻,授權在生成內容中使用自己的聲音和肖像。谷歌員工當天發布的I/O相關帖子中,就用了他們AI生成的肖像作為示范。

06 Antigravity 2.0:開發和管理自主AI智能體團隊的平台

模型需要平台來承載,為此谷歌同步發布了Antigravity 2.0。六個月前它還只是個編碼環境,現在已經被改造成“用於開發和管理自主AI智能體團隊的平台”。



卡武克庫奧盧指出,團隊“和我們的智能體開發平台Google Antigravity一起開發了Gemini 3.5 Flash”。Flash的速度、工具使用、長上下文推理和代碼生成能力,都針對開發者在平台上的工作負載做了專門的優化。

Antigravity以獨立桌面應用的形式出現,也提供命令行和SDK。開發者可以同時調度多個智能體:一個寫網站代碼,一個生成品牌素材,第三個規劃產品架構。這些智能體並行幹活,統一管理。

一同推出的還有托管智能體和CodeMender。托管智能體通過一次API調用就可以在隔離的Linux環境中啟動,進行推理、使用工具和執行代碼。CodeMender是一個安全智能體,利用Gemini的高級推理能力自動發現並修復關鍵代碼漏洞。卡武克庫奧盧認為,當智能體系統寫的代碼越來越多時,這種能力是必不可少的。

支撐這一切的是一個數據飛輪。今年3月,開發者在Antigravity上每天處理大約0.5萬億個token。到5月中旬,這個數字飆升到超過3萬億,大約十周內增長了六倍。皮查伊說,使用量“幾乎每隔幾周”就翻一番。

飛輪的邏輯很清楚:工程師用得越多,模型團隊收集到的真實信號就越多;這些信號反饋回來改進模型,讓模型變得更有用,進而推動更多人使用。皮查伊稱之為“一個強大的反饋循環,它讓我們能夠持續改進3.5系列模型”,谷歌的重點一直是“提升模型智能,確保工具使用、指令遵循、長周期任務、智能體解碼等一切功能都運轉良好”。

07 每六個月迭代一次

Gemini 3.5 Flash只是開始。

卡武克庫奧盧表示,Gemini 3.5 Pro正在內部測試,下個月推出。他還明確了谷歌主要模型的更新節奏:大約每六個月一次。回顧一下,Gemini 3在去年11月發布,Gemini 3.5在今年5月發布,這個節奏正在穩定下來。當被問及如何決定版本編號時,他解釋說:“決定編號更新的,實際上是我們研究中看到的進展,以及這些進展在模型中的體現和產生的影響。”

對買家來說,這種可預測的快速迭代改變了規劃周期。一個每六個月就能用三分之一成本超越前代旗艦的模型,意味著今天緊巴巴的token預算到年底可能就已經顯得很寬裕了。企業在制定技術路線圖時,不能再拿靜態的眼光來評估性價比。



當然,10億美元還是PPT上的數字推演。遺留系統、合規要求、組織慣性——這些詞在每一輪技術迭代中都會出現,往往會讓紙面上的成本曲線在落地時“打骨折”。但谷歌也表示,自己正在用每天3萬億token、而且每隔幾周就翻番的內部使用量,以任何客戶都沒試過的規模,親身實踐著這個賭注。

一年以後,AI又會是怎樣的新面孔?
您的點贊是對我們的鼓勵     無評論不新聞,發表一下您的意見吧
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
      大家正在圍觀
    加國GICs利率全走高 儲戶比房東爽
    谷愛凌豪宅前堆垃圾 扯出鄰裡大戲
    溫村出行巨變!南下火車邊境免停車
    越住越不幸福?溫村瘋狂增密引爭議
    大溫這個區未來建房或禁挖地下室
    加國大都市學校關閉潮:育兒太難了
    夏天這款全能水果 被營養師吹上天
    平時進不去 溫村隱藏豪宅開放參觀
    去Abbotsford機場超方便 很多方式
    Kirkland這樣霸架 Costco選品太狠
      同類熱門新聞
    與蓋茨和愛潑斯坦關系密切的"隱形
    比爾·蓋茨再度承認婚內出軌,遭愛
    在股市升空的SpaceX可能是馬斯克
    不靠聲波不靠光 水下"WiFi"來了
    "鵝腿阿姨"賣的是鴨腿,曾上北大論
    幹1年拿8年工資!這家科技巨頭員工
    GoogleMaps新設計悄悄上線 導航更
    注意:瀏覽網頁遇到這個彈窗,千萬
    Google翻譯大升級 即時翻譯這類用
    15000元!iPhone折疊屏全面曝光(圖
      隨時閱讀新聞

    加西網微信

    大溫優惠小紅書

    溫哥華地產中心微信

    Android: 加西網
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0298 秒 and 3 DB Queries in 0.0013 秒