这段机器人煮咖啡的视频可能标志着人工智能机器人未来的一大步。为什么呢?

机器人2026-01-14 17:45:09 从盛蕊

一家机器人公司发布了一段视频,声称展示了一个人形机器人在观看人类煮咖啡后煮咖啡,同时实时纠正它犯的错误。在宣传片段中,Figure.ai的旗舰型号,被称为“图01”,拿起一个咖啡胶囊,将其插入咖啡机,盖上盖子,打开机器。

尽管目前还不清楚哪些系统在引擎盖下运行,但图已经与宝马签署了一项商业协议,在汽车生产中提供人形机器人——1月18日在新闻稿中宣布了这一消息。专家们还告诉《生活科学》,假设录像准确显示了该公司声称的情况,引擎盖下可能会发生什么。

目前,人工智能驱动的机器人技术是特定领域的——这意味着这些机器做好一件事,而不是做好每一件事。它们从编程的规则基线和用于自学的数据集开始。然而,Figure.ai声称图01只通过观看10个小时的镜头就学会了。

对于一个制作咖啡或修剪草坪的机器人来说,这意味着在多个领域嵌入专业知识,这些领域太笨重而无法编程。必须预见每一个可能的意外事件的规则,并将其编码到软件中——例如,当它到达草坪尽头时该怎么做的具体说明。因此,仅仅通过观看来获得许多领域的专业知识将是一个重大飞跃。一种新型机器人难题的第一部分是图01需要看到它应该重复什么。“在视觉上处理信息可以让它识别过程中的重要步骤和细节,”人工智能企业家和人工智能产品评论的共同所有者马克斯·梅布里告诉《生活科学》。

AIPRM网站的首席执行官克里斯托夫·塞姆珀告诉《生活科学》,机器人需要获取视频数据,并开发物理动作和这些动作顺序的内部预测模型。AIPRM是一个设计提示以输入像ChatGPT这样的人工智能系统的网站。他补充说,它需要将所看到的转化为对如何移动四肢和抓手来执行相同动作的理解。相关内容:埃隆·马斯克刚刚用一段视频取笑了Telsa的新擎天柱第二代机器人,视频的最后有一个时髦的款待

英国分析研究所的数据分析和人工智能专家克莱尔·沃尔什说,还有神经网络的架构——一种受大脑工作方式启发的机器学习模型。大量相互连接的单个节点连接起来产生信号。如果当信号导致一个动作(如伸出手臂或关闭抓手)时达到预期的结果,反馈会加强实现它的神经连接,进一步将其嵌入“已知”过程中。

沃尔什告诉《生活科学》,“在2016年之前,像区分照片中的猫和狗这样的物体识别成功率约为50%。”“一旦神经网络得到完善和工作,结果几乎在一夜之间跃升至80%到90%——通过可靠的学习方法进行观察训练的效果非常好。”

对沃尔什来说,图01和自动驾驶汽车之间有一个相似之处,这使得使用基于概率而不是基于规则的训练方法成为可能。她指出,自学训练可以足够快地构建数据,以便在复杂的环境中工作。为什么自我纠正是一个重要的里程碑尽管大多数人煮咖啡有多容易,但运动功能、精确操作和事件顺序知识对于机器来说学习和执行来说非常复杂。这使得自我纠正错误的能力至关重要——尤其是如果图01从煮咖啡到在人类附近举起重物或执行救生救援工作。

梅伯里说:“机器人的视觉敏锐度不仅仅是看到咖啡制作过程中发生的事情。”“它不仅仅是观察它,它还分析过程,以确保一切尽可能准确。”

这意味着机器人知道不要把杯子装满,以及如何正确插入豆荚。如果它看到与学习行为或预期结果有任何偏差,它会将其解释为错误,并微调其行动,直到达到预期结果。它通过强化学习来做到这一点,在这种学习中,对期望目标的意识是通过在不确定环境中导航的反复试验来发展的。沃尔什补充说,正确的训练数据意味着机器人类似人类的动作可以迅速“扩展和多样化”。 “运动的数量令人印象深刻,精度和自我纠正能力意味着它可能预示着该领域的未来发展,”她说。

但是拥有自然语言处理博士学位的人工智能专家莫娜·柯尔斯坦警告说,图01看起来是一个很好的第一步,而不是一个市场就绪的产品。

“为了在这个狭义任务之外的新环境中实现人类水平的灵活性,环境变化等瓶颈仍然必须得到解决,”柯尔斯坦告诉《生活科学》。“因此,虽然它将优秀的工程与最先进的深度学习相结合,但将其视为实现普遍智能的人形机器人可能夸大了进展。”

© 版权声明

相关文章

暂无评论

暂无评论...