| 广告联系 | 繁体版 | 手机版 | 微信 | 微博 | 搜索:
欢迎您 游客 | 登录 | 免费注册 | 忘记了密码 | 社交账号注册或登录

首页

温哥华资讯

温哥华地产

温哥华教育

温哥华财税

新移民/招聘

黄页/二手

旅游

印度: 印度工人头戴摄像头 边打工边教机器人抢自己饭碗


请用微信 扫一扫 扫描上面的二维码,然后点击页面右上角的 ... 图标,然后点击 发送给朋友分享到朋友圈,谢谢!



机器人的数据困境有多夸张呢?有个数字可以感受一下。目前机器人领域头部开源数据集 OpenX-Embodiment,汇聚了全球 22 种不同机器人本体、311 个场景下的 100 万条操作轨迹。听起来挺壮观,但大语言模型的训练数据动辄万亿 token,和 100 万放在一起,差了整整六个数量级。

真机遥操还有另外一个麻烦,数据和硬件强绑定。


过去大多数操作数据,都是用特定型号的机器人采集的。A 型机械臂的数据,很难直接拿去训练 B 型机械臂。机械臂的关节结构不同、末端夹爪的形状不同、摄像头的位置不同,同样的"拿起杯子"这个动作,在两种机器人身上对应的运动轨迹可以完全不一样。换一款硬件,数据就得重新采,等于每次升级硬件,都要回到原点重新开始。



要打破这个僵局,就需要把数据和机器解绑。比如不依赖特定型号的机器人,直接从人身上采集操作数据——无本体数据。


因为人类做“拿起杯子”这个动作,其手部轨迹(位置、姿态)是相对于世界坐标系或自身躯干的,可以通过运动学映射转换到不同几何尺寸和关节配置的机械臂上。数据采一次,可以反复用在不同硬件上。

更重要的是,这种采集方式成本足够低,可以轻松覆盖大量不同的真实场景。研究人员做过测试,同样数量的数据,分布在 32 个不同环境、每个环境各 50 条,比全部集中在一个环境的 1600 条,训练出来的模型泛化能力强得多。


机器人需要见过足够多"不一样的世界",才能在一个从没见过的新场景里不慌不乱。这也是为啥 Ego 数据方案这么强调要在真实场景里采集。不同的工厂、不同的操作台、不同的工人,每一个细微的差异,对模型来说都是养分。



今年4月,Generalist 发布 GEN-1。这款模型用 50 万小时人类操作视频训练而成,效果相当惊人:在折纸箱、手机装盒等任务上,平均成功率从 64% 直接拉到 99%,速度也比上一代提升了三倍。
点个赞吧!您的鼓励让我们进步     这条新闻还没有人评论喔,等着您的高见呢
注:
  • 新闻来源于其它媒体,内容不代表本站立场!
  • 在此页阅读全文
    猜您喜欢:
    您可能也喜欢:
    我来说两句:
    评论:
    安全校验码:
    请在此处输入图片中的数字
    The Captcha image
    Terms & Conditions    Privacy Policy    Political ADs    Activities Agreement    Contact Us    Sitemap    

    加西网为北美中文网传媒集团旗下网站

    页面生成: 0.0362 秒 and 5 DB Queries in 0.0021 秒