人工智能驱动的人形机器人可以为您提供食物、堆叠菜肴并与您交谈

机器人 2026-01-14 17:44:57 张萱林

由于与OpenAI技术的集成,一个自我纠正的人形机器人只需观看人类煮咖啡的镜头就学会了煮咖啡,现在可以回答问题。

在新的宣传视频中,一名技术人员要求图01在类似厨房的极简测试环境中执行一系列简单的任务。他首先向机器人要东西吃,然后被递给一个苹果。接下来,他让图01解释为什么它在捡垃圾时递给他一个苹果。机器人用机器人但友好的声音回答了所有问题。相关内容:观看科学家在佩戴Apple Vision Pro时用手控制机器人

该公司在其视频中表示,对话是由OpenAI技术的集成驱动的,OpenAI是ChatGPT背后的名字。然而,图01不太可能使用ChatGPT本身,因为人工智能工具通常不会使用像“嗯”这样的停顿词,这个机器人就会这样做。如果视频中的一切都像声称的那样工作,这意味着机器人技术在两个关键领域的进步。正如专家们之前告诉Live Science的那样,第一个进步是像人可以执行的灵巧、自我纠正运动背后的机械工程。这意味着受关节或肌肉启发的非常精确的电机、执行器和抓手,以及操纵它们执行任务并微妙地握住物体的电机控制。

即使是拿起一个杯子——人们几乎没有意识到这一点——也使用密集的车载处理来精确地定位肌肉。第二个进步是实时自然语言处理(NLP),这要归功于OpenAI引擎的加入——当你输入查询时,它需要像ChatGPT一样即时和响应。它还需要软件将这些数据翻译成音频或语音。NLP是计算机科学的一个领域,旨在赋予机器理解和传达演讲的能力。尽管镜头看起来令人印象深刻,但到目前为止Livescience.com持怀疑态度。以0.52秒的速度听,以1.49秒的速度听,当图01以一个快速的“呃”开始一个句子,并重复“我”这个词时,就像一个人花一瞬间来整理她的想法以便说话一样。为什么(以及如何)人工智能语音引擎会包含如此随机、类似人类的措辞?总体而言,拐点也可疑地不完美,太像人类在语音中使用的自然、无意识的节奏。

我们怀疑它实际上可能是预先录制的,以展示图机器人正在做什么,而不是现场测试,但是如果——正如视频标题所声称的——一切都是神经网络的结果,并且确实显示图01实时响应,我们刚刚向未来迈出了又一大步。

© 版权声明

相关文章

这个“盲人”猎豹机器人没有视力,没有问题

麻省理工学院的工程师和机器人专家显然正在竭尽全力帮助我们过渡到一个全面的机器人接管。他们在“盲人运动”方面的最新成就是90磅。(41公斤)猎豹3号。这种四肢机械野兽可以跺脚爬上散落着碎片的楼梯,在不平坦的地形上冲刺,在被重击后恢复过来,或者pushed By设计机器人来“感觉”自己的立足点,就像被蒙住眼睛的人所做的那样,麻省理工学院的研究人员希望制造出一种机器,它可以比依靠视觉更快地对意外障碍物做出反应。机器人的设计者、麻省理工学院机械工程副教授Sangbae Kim在一份声明中说。[奔跑中的机器人!5个真正可以移动的机器人】“视觉可能会‘嘈杂’,有点不准确,有时甚至不可用,如果你过于依赖视觉,你的机器人必须非常准确地定位,最终会很慢,”金说。“如果它踩到相机看不到的东西怎么办?它会做什么?这就是盲目运动可以提供帮助的地方。我们不想太相信我们的视觉。”就像它的大猫一样,这个机器人可以左右弯曲和弯曲它的身体和腿——几乎就像它准备向毫无戒心的猎物跳跃一样。多个传感器收集机器人每走一步的数据;根据麻省理工学院的声明,特殊算法评估肢体运动的数据,以帮助猎豹3号弄清楚每只脚放在哪里,以及当它遇到意想不到的绊脚石,如石头或树枝时如何恢复。这些计算使机器人能够决定什么时候“承诺”脚步并向前移动是安全的,什么时候后退更谨慎。
2026-01-14

人工智能驱动的人形机器人可以为您提供食物、堆叠菜肴并与您交谈 暂无评论