人工智能驱动的人形机器人可以为您提供食物、堆叠菜肴并与您交谈

机器人2026-01-14 17:44:57 张萱林

由于与OpenAI技术的集成,一个自我纠正的人形机器人只需观看人类煮咖啡的镜头就学会了煮咖啡,现在可以回答问题。

在新的宣传视频中,一名技术人员要求图01在类似厨房的极简测试环境中执行一系列简单的任务。他首先向机器人要东西吃,然后被递给一个苹果。接下来,他让图01解释为什么它在捡垃圾时递给他一个苹果。机器人用机器人但友好的声音回答了所有问题。相关内容:观看科学家在佩戴Apple Vision Pro时用手控制机器人

该公司在其视频中表示,对话是由OpenAI技术的集成驱动的,OpenAI是ChatGPT背后的名字。然而,图01不太可能使用ChatGPT本身,因为人工智能工具通常不会使用像“嗯”这样的停顿词,这个机器人就会这样做。如果视频中的一切都像声称的那样工作,这意味着机器人技术在两个关键领域的进步。正如专家们之前告诉Live Science的那样,第一个进步是像人可以执行的灵巧、自我纠正运动背后的机械工程。这意味着受关节或肌肉启发的非常精确的电机、执行器和抓手,以及操纵它们执行任务并微妙地握住物体的电机控制。

即使是拿起一个杯子——人们几乎没有意识到这一点——也使用密集的车载处理来精确地定位肌肉。第二个进步是实时自然语言处理(NLP),这要归功于OpenAI引擎的加入——当你输入查询时,它需要像ChatGPT一样即时和响应。它还需要软件将这些数据翻译成音频或语音。NLP是计算机科学的一个领域,旨在赋予机器理解和传达演讲的能力。尽管镜头看起来令人印象深刻,但到目前为止Livescience.com持怀疑态度。以0.52秒的速度听,以1.49秒的速度听,当图01以一个快速的“呃”开始一个句子,并重复“我”这个词时,就像一个人花一瞬间来整理她的想法以便说话一样。为什么(以及如何)人工智能语音引擎会包含如此随机、类似人类的措辞?总体而言,拐点也可疑地不完美,太像人类在语音中使用的自然、无意识的节奏。

我们怀疑它实际上可能是预先录制的,以展示图机器人正在做什么,而不是现场测试,但是如果——正如视频标题所声称的——一切都是神经网络的结果,并且确实显示图01实时响应,我们刚刚向未来迈出了又一大步。

© 版权声明

相关文章

暂无评论

暂无评论...