| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

馬斯克: 馬斯克的"考神 AI" 但沒能真正"炸場"

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
Grok4 考試非常在行,但沒能真正“炸場”。


2025 年 7 月,馬斯克依然是全科技圈最忙碌的人之一。

特斯拉和 Optimus 機器人項目還在等他拍板,SpaceX 忙著准備下一次火箭發射,Neuralink 繼續推進腦機接口試驗;與此同時,他還要在 X 上和川普隔空對戰、高調宣布創立“美國黨”,各種話題造勢一刻沒停。


而在自己掌控的 X 這個“大染缸”社交網絡裡,馬斯克不僅扮演老板、客服,還要作為首席網紅全力吆喝,推廣 xAI 新一代的 Grok——那個他口中的“真相機器”,來趕超 OpenAI 等對手。

當地時間 7 月 9 日晚上,xAI 團隊進行 Grok 4 Demo 直播,馬斯克本人也照例親自站台,仍稱 Grok 是“世界最強 AI”,說 Grok 4 比很多“研究生”“博士”都強 。

然而在 X 上,用戶的記憶還沒刷新。

Grok 4 官宣期間,Grok 3 在給用戶的回答中“贊美希特勒”的風波持續發酵,這一話題也占據 Grok 4 直播當天的相關媒體頭條。

Grok 4 當天的直播遲到一個小時才開始,還有用戶在 xAI 帖子下面留言“把 Grok 放出來!”也有人繼續刷著“希特勒”相關梗嘲諷。

進入第四代的 Grok,在一些模型測試上刷出高分,但能否真正解決一些老問題?這個常常被質疑是“直男 AI”“謠言搬運機”的“真相機器”,又是否真能兌現“不過濾”卻又不失控的承諾?01

馬斯克的“考神 AI”


“ Grok 4 是在所有學科裡都達到研究生水平的,甚至比大多數 PhD 都強 。”直播晚點 1 小時後,馬斯克首先給 Grok 最新一代的水平如此定位。



Grok 4 各種測試集結果|圖片來源:X


當然,哪怕在文本裡能解 99% 的難題,也不代表就能設計火箭、改進藥物、重塑經濟。但馬斯克稱,AI 現在可能缺乏常識、有時沒發明新技術或新物理,但也只是“時間問題”。

除了在 SAT、GRE 考試中取得近乎完美的成績,在“人類終極考試(HLE)”測試裡,Grok 4 現在的得分比 Gemini 2.5 Pro、o3 都高,Grok 4 Heavy 版本更是突破了 40%。



Grok 4 HLE 結果|圖片來源:X

xAI 團隊成員解釋,這些都是跨學科、開放式、博士級別的難題,為了做到這一點,Grok 4 在訓練上徹底換了思路: 不再只是堆參數和語料的規模,而是選擇將算力大頭用在“推理”層,引入可驗證的結果獎勵,讓模型學會從“第一性原理”思考並糾正錯誤 。

他們還強調,隨著模型變得越來越智能,“真正有意義的測試題目”數量正在下降,一些人類做不出的問題現在對於 AI 來說已經是“小菜一碟”了。
不錯的新聞,我要點贊     無評論不新聞,發表一下您的意見吧
上一頁123456下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0366 秒 and 3 DB Queries in 0.0012 秒