| 廣告聯系 | 簡體版 | 手機版 | 微信 | 微博 | 搜索:
歡迎您 游客 | 登錄 | 免費注冊 | 忘記了密碼 | 社交賬號注冊或登錄

首頁

溫哥華資訊

溫哥華地產

溫哥華教育

溫哥華財稅

新移民/招聘

黃頁/二手

旅游

大模型兩小時暴虐50多名專家 但8小時顯驚人短板

QR Code
請用微信 掃一掃 掃描上面的二維碼,然後點擊頁面右上角的 ... 圖標,然後點擊 發送給朋友分享到朋友圈,謝謝!
AI智能體離自主研發,還有多遠?


Nature期刊的一篇研究曾證明了,GPT-4能自主設計並開展化學實驗,還能閱讀文檔學習如何使用實驗室設備。

另有Transformer作者之一研發的“世界首個AI科學家”,一口氣肝出10篇論文,完全不用人類插手。


如今,AI在研發領域的入侵速度,遠超人類預期。

來自非營利組織METR的最新研究稱:

同時給定2個小時,Claude 3.5 Sonnet和o1-preview在7項具有挑戰性研究工程中,擊敗了50多名人類專家。

令人印象深刻的是,AI編程速度能以超越人類10倍速度生成並測試各種方案。

在一個需要編寫自定義內核以優化前綴和運算的任務中,o1-preview不僅完成了任務,還創造了驚人的成績:將運行時間壓縮到0.64毫秒,甚至超越了最優秀的人類專家解決方案(0.67毫秒)。




論文地址:https://metr.org/AI_R_D_Evaluation_Report.pdf

不過,當比賽時間延長至8小時,人類卻展現出了明顯的優勢。

由下可以看出,隨著時間逐漸拉長,Claude 3.5 Sonnet和o1-preview的性能提升逐漸趨於平緩。




有趣的是,為了獲得更高的分數,AI智能體居然會違反規則“作弊”。

原本針對一個任務,智能體應該減少訓練腳本運行時間,o1-preview直接復制了輸出的代碼。

頂級預測者看到這一結果驚歎道,基於這個進步速度,AI達到高水平人類能力的時間可能會比之前預計的更短。


點個贊吧!您的鼓勵讓我們進步     好新聞沒人評論怎麼行,我來說幾句
上一頁123456下一頁
注:
  • 新聞來源於其它媒體,內容不代表本站立場!
  • 在此頁閱讀全文
    猜您喜歡:
    您可能也喜歡:
    我來說兩句:
    評論:
    安全校驗碼:
    請在此處輸入圖片中的數字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西網為北美中文網傳媒集團旗下網站

    頁面生成: 0.0366 秒 and 4 DB Queries in 0.0071 秒