这段机器人煮咖啡的视频可能标志着人工智能机器人未来的一大步。为什么呢？

机器人 2026-01-14 17:45:09 从盛蕊

一家机器人公司发布了一段视频，声称展示了一个人形机器人在观看人类煮咖啡后煮咖啡，同时实时纠正它犯的错误。在宣传片段中，Figure.ai的旗舰型号，被称为“图01”，拿起一个咖啡胶囊，将其插入咖啡机，盖上盖子，打开机器。

尽管目前还不清楚哪些系统在引擎盖下运行，但图已经与宝马签署了一项商业协议，在汽车生产中提供人形机器人——1月18日在新闻稿中宣布了这一消息。专家们还告诉《生活科学》，假设录像准确显示了该公司声称的情况，引擎盖下可能会发生什么。

目前，人工智能驱动的机器人技术是特定领域的——这意味着这些机器做好一件事，而不是做好每一件事。它们从编程的规则基线和用于自学的数据集开始。然而，Figure.ai声称图01只通过观看10个小时的镜头就学会了。

对于一个制作咖啡或修剪草坪的机器人来说，这意味着在多个领域嵌入专业知识，这些领域太笨重而无法编程。必须预见每一个可能的意外事件的规则，并将其编码到软件中——例如，当它到达草坪尽头时该怎么做的具体说明。因此，仅仅通过观看来获得许多领域的专业知识将是一个重大飞跃。一种新型机器人难题的第一部分是图01需要看到它应该重复什么。“在视觉上处理信息可以让它识别过程中的重要步骤和细节，”人工智能企业家和人工智能产品评论的共同所有者马克斯·梅布里告诉《生活科学》。

AIPRM网站的首席执行官克里斯托夫·塞姆珀告诉《生活科学》，机器人需要获取视频数据，并开发物理动作和这些动作顺序的内部预测模型。AIPRM是一个设计提示以输入像ChatGPT这样的人工智能系统的网站。他补充说，它需要将所看到的转化为对如何移动四肢和抓手来执行相同动作的理解。相关内容：埃隆·马斯克刚刚用一段视频取笑了Telsa的新擎天柱第二代机器人，视频的最后有一个时髦的款待

英国分析研究所的数据分析和人工智能专家克莱尔·沃尔什说，还有神经网络的架构——一种受大脑工作方式启发的机器学习模型。大量相互连接的单个节点连接起来产生信号。如果当信号导致一个动作（如伸出手臂或关闭抓手）时达到预期的结果，反馈会加强实现它的神经连接，进一步将其嵌入“已知”过程中。

沃尔什告诉《生活科学》，“在2016年之前，像区分照片中的猫和狗这样的物体识别成功率约为50%。”“一旦神经网络得到完善和工作，结果几乎在一夜之间跃升至80%到90%——通过可靠的学习方法进行观察训练的效果非常好。”

对沃尔什来说，图01和自动驾驶汽车之间有一个相似之处，这使得使用基于概率而不是基于规则的训练方法成为可能。她指出，自学训练可以足够快地构建数据，以便在复杂的环境中工作。为什么自我纠正是一个重要的里程碑尽管大多数人煮咖啡有多容易，但运动功能、精确操作和事件顺序知识对于机器来说学习和执行来说非常复杂。这使得自我纠正错误的能力至关重要——尤其是如果图01从煮咖啡到在人类附近举起重物或执行救生救援工作。

梅伯里说：“机器人的视觉敏锐度不仅仅是看到咖啡制作过程中发生的事情。”“它不仅仅是观察它，它还分析过程，以确保一切尽可能准确。”

这意味着机器人知道不要把杯子装满，以及如何正确插入豆荚。如果它看到与学习行为或预期结果有任何偏差，它会将其解释为错误，并微调其行动，直到达到预期结果。它通过强化学习来做到这一点，在这种学习中，对期望目标的意识是通过在不确定环境中导航的反复试验来发展的。沃尔什补充说，正确的训练数据意味着机器人类似人类的动作可以迅速“扩展和多样化”。 “运动的数量令人印象深刻，精度和自我纠正能力意味着它可能预示着该领域的未来发展，”她说。

但是拥有自然语言处理博士学位的人工智能专家莫娜·柯尔斯坦警告说，图01看起来是一个很好的第一步，而不是一个市场就绪的产品。

“为了在这个狭义任务之外的新环境中实现人类水平的灵活性，环境变化等瓶颈仍然必须得到解决，”柯尔斯坦告诉《生活科学》。“因此，虽然它将优秀的工程与最先进的深度学习相结合，但将其视为实现普遍智能的人形机器人可能夸大了进展。”

机器人

文章版权归作者所有，未经允许请勿转载。

小心：这个机器人可以追着你跑

你可以从波士顿动力公司的人形机器人阿特拉斯身上跑过去，但它不会对你有任何好处——机器人可以在you In机器人制造商昨天（5月10日）分享

机器人

2026-01-14

无线“RoboFly”看起来像一只昆虫，从激光中获得能量

一种新型飞行机器人非常小巧轻便——它的重量大约和牙签一样重——它可以栖息在你的手指上。小飞行者也能够不受束缚地飞行，并由激光驱动。

机器人

2026-01-14

这个“盲人”猎豹机器人没有视力，没有问题

麻省理工学院的工程师和机器人专家显然正在竭尽全力帮助我们过渡到一个全面的机器人接管。他们在“盲人运动”方面的最新成就是90磅。（41公斤）猎豹3号。这种四肢机械野兽可以跺脚爬上散落着碎片的楼梯，在不平坦的地形上冲刺，在被重击后恢复过来，或者pushed By设计机器人来“感觉”自己的立足点，就像被蒙住眼睛的人所做的那样，麻省理工学院的研究人员希望制造出一种机器，它可以比依靠视觉更快地对意外障碍物做出反应。机器人的设计者、麻省理工学院机械工程副教授Sangbae Kim在一份声明中说。[奔跑中的机器人！5个真正可以移动的机器人】“视觉可能会‘嘈杂’，有点不准确，有时甚至不可用，如果你过于依赖视觉，你的机器人必须非常准确地定位，最终会很慢，”金说。“如果它踩到相机看不到的东西怎么办？它会做什么？这就是盲目运动可以提供帮助的地方。我们不想太相信我们的视觉。”就像它的大猫一样，这个机器人可以左右弯曲和弯曲它的身体和腿——几乎就像它准备向毫无戒心的猎物跳跃一样。多个传感器收集机器人每走一步的数据；根据麻省理工学院的声明，特殊算法评估肢体运动的数据，以帮助猎豹3号弄清楚每只脚放在哪里，以及当它遇到意想不到的绊脚石，如石头或树枝时如何恢复。这些计算使机器人能够决定什么时候“承诺”脚步并向前移动是安全的，什么时候后退更谨慎。

机器人

2026-01-14

这是第一位机器人公民索菲亚对性别和意识的看法

在一段既令人不安又令人敬畏的视频中，世界上第一个机器人公民索菲亚分解了从性别到道德机器人设计的所有内容。索菲亚上个月在匈牙利布达佩

机器人

2026-01-14

这段机器人煮咖啡的视频可能标志着人工智能机器人未来的一大步。为什么呢？

相关文章

小心：这个机器人可以追着你跑

无线“RoboFly”看起来像一只昆虫，从激光中获得能量

这个“盲人”猎豹机器人没有视力，没有问题

这是第一位机器人公民索菲亚对性别和意识的看法

这段机器人煮咖啡的视频可能标志着人工智能机器人未来的一大步。为什么呢？暂无评论

排行榜

Mark Copy

Content at Scale

INK

星火网文助手

TextCortex

Copymatic

NeuralText

Frase

AI头条

基金里面的阿尔法是什么意思

爱情中的三观是什么意思

沙场秋点兵的译文是什么

苏泊尔是国产还是外资

沅水的源头在哪里

香蕉能不能放冰箱

tnt是什么意思

火车票后面有个兑是什么意思

这段机器人煮咖啡的视频可能标志着人工智能机器人未来的一大步。为什么呢？

相关文章

这段机器人煮咖啡的视频可能标志着人工智能机器人未来的一大步。为什么呢？ 暂无评论

排行榜

Mark Copy

Content at Scale

INK

星火网文助手

TextCortex

Copymatic

NeuralText

Frase

AI头条

这段机器人煮咖啡的视频可能标志着人工智能机器人未来的一大步。为什么呢？暂无评论