Welcome Visitors | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

温哥华资讯

故事 | 移民 | 留学 | 八卦 | 娱乐 | 投资 | 旅游
就业 | 健康 | 文艺 | 情感 | 科技 | 华人 | 海归

温西 | 西温 | 本那比 | 列治文 | 白石 | 市中心
温东 | 北温 | 高贵林 | 北素里 | 素里 | 满地宝

大温 | 玩乐 | 吃喝 | 社团 | 汽车 | 贴图
生活 | 房屋 | 亲子 | 摄影 | 原创 | 投资

专栏 | 视频
群组 | 图库

生活资讯专栏科技信息

2025年AI看不懂时钟!90%人答对顶尖AI全军覆没

2025-09-08 | Contributed by: 新智元 | 转到微信 | 有0人参与评论 | 字体: 放大缩小 | 收藏 | Printer Friendly Page

90%人都会的读钟题，顶尖AI全军覆没！

AI基准创建者、连续创业者Alek Safar推出了视觉基准测试ClockBench，专注于测试AI的「看懂」模拟时钟的能力。

结果让人吃惊：

人类平均准确率89.1%，而参与测试的11个主流大模型最好的成绩仅13.3%。

就难度而言，这与「AGI终极测试」ARC-AGI-2相当，比「人类终极考试」更难。

ClockBench共包含180个时钟、720道问题，展示了当前前沿大语言模型（LLM）的局限性。

北京买房人全军覆没深圳上海房价暴跌5成以上

蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛?

顶尖AI全军覆没!2025年AI看不懂时钟

论文链接：https://clockbench.ai/ClockBench.pdf

虽然这些模型在多项基准上展现出惊人的推理、数学与视觉理解能力，但这些能力尚未有效迁移到「读表」。可能原因：

训练数据未覆盖足够可记忆的时钟特征与时间组合，模型不得不通过推理去建立指针、刻度与读数之间的映射。

时钟的视觉结构难以完整映射到文本空间，导致基于文本的推理受限。

也有好消息：表现最好的模型已展现出一定的视觉推理（虽有限）。其读时准确率与中位误差均显着优于随机水平。

接下来需要更多研究，以判定这些能力能否通过扩大现有范式（数据、模型规模、计算/推理预算）来获得，还是必须采用全新的方法。

ClockBench如何拷打AI？

在过去的几年里，大语言模型（LLM）在多个领域都取得了显着进展，前沿模型很快在许多流行基准上达到了「饱和」。

觉得新闻不错，请点个赞吧

这条新闻还没有人评论喔，等着您的高见呢

分享:

Prev Page12 3 4 Next Page

Note:

新闻来源于其它媒体，内容不代表本站立场！

_VIEW_NEWS_FULL

_RELATED_NEWS:

中国乒乓球惨败 9人出局男单几乎全军覆没

蒙娜丽莎让大模型们全军覆没 AI不会眯眼睛?

李自成惨败山海关 10万精锐全军覆没犯致命错误

马云站台的盒马,为何会员店全军覆没?

BC省很快又要建新油管?结果出来了

拉普拉普惨案嫌犯被裁定适合受审

温哥华贷款经纪解决各类疑难贷款

这披萨连锁店本周所有披萨半价促销

深圳巨型蜗牛泛滥专家警告:别碰

温哥华汇款/外币兑换汇率最优安全

小区遛狗遇熊男子犯这错误被挠伤

日本佳子公主变"福建尿片"了?日本人炸毛

顺从抢匪?加拿大警方的建议炸锅了

加国男子挖洞进入楼上公寓遭指控

加航多伦多直飞上海每周4班机票开抢

唐人街将办火龙节精彩舞火龙表演

_RELATED_NEWS_MORE:

温哥华会计事务所收费低服务好

油价又疯了！大温快见2元天花板

炸锅!BC省拒绝调查北岸污水厂项目

CNN曝北京力助金正恩核武地位俄帮平壤寻找铀矿

敏感时刻王毅将出访欧洲3国 "目的"曝光

前总理小杜新赛道张嘴就有六位数

55岁陈建斌眼睛受伤,包裹纱布戴着墨镜,疑...

恐怖女子逃离战火却命丧异乡公交

乌女孩美国地铁遭刺杀震惊全球恐怖画面曝光

斥以色列侵犯卡塔尔领土中国外交部:严厉谴责

六旬大爷成"榜一大哥",裸聊女主播8天花光积蓄

麻烦!BC另一批公务员可能也要罢工

温哥华贷款经纪解决各类疑难贷款

惊心动魄:中国经济正从头部腐烂

乌克兰女子在美遭刺喉案特朗普再发声:畜牲死刑!

观点:美国或在中东威信扫地! 这些连锁效应将发生

_POSTMYCOMMENT:

_TODAYMOSTREAD

周末大温超市优惠抢先看扫货指南

华人注意中国签证办理有重大变化

温哥华街头惨案男子痛失3位家人

通勤党福音大温天车站冷热饮任选

又一邓文迪?4年生3娃替前"世界首

冷空气来袭大温地区明晚降雨上线

欠下10万美金 BC女子旅行医保噩梦

三大利好买家乐观加国房市要复苏

枪杀网红老父亲押送22岁儿子自首

曝内娱模范夫妻男方出轨,邓超成怀

_TOPIC_MOSTREAD

微信重磅更新!网友:再也不怕发错

苹果:开最燃的发布会,过最难的202

成本暴降90%!阿里深夜干了件大事

炒了马斯克,16岁天才少年空降华尔

微软总裁警告参加这个活动的会

怒斥"没救了"...马斯克公开与川普

秒没!iPhone17预售比去年难抢,苹

威慑中、俄! F-16当追逐机美军第

网传1亿年薪挖角OpenAI 腾讯回应

发现iPhone漏洞最高赏金50万!苹果

随时阅读新闻

加西网微信	大温优惠小红书
温哥华地产中心微信	Android: 加西网

Terms & Conditions

Activities Agreement

加西网为北美中文网传媒集团旗下网站

Page Generation: 0.0300 Seconds and 5 DB Queries in 0.0013 Seconds