“多元宇宙模拟引擎”预测了训练人形机器人和自动驾驶汽车的每一个可能的未来

机器人 2026-01-14 17:43:59 凌进仪

拉斯维加斯——研究人员建立了一个新的“多元宇宙模拟”平台,可以生成大量数据来训练由人工智能(AI)驱动的先进自学习机器人。

据设计该平台的英伟达公司称,这套被称为“宇宙”的工具可以让研究人员创建“世界基础模型”——模拟现实世界环境和物理定律以预测现实结果的神经网络。这些生成式人工智能模型可以创建合成数据来训练具身或物理人工智能系统,如自动驾驶汽车或人形人工智能系统robots.Training人工智能系统需要大量数据,但科学家估计,到2026年,我们可能会用完公开可用的数据。与现实世界交互的人工智能系统,如机器人,通常需要真实世界的镜头,这些镜头非常难以制作,获取成本也很高。但是创建真正有用的合成数据也具有挑战性,一项研究之前警告说,使用解释不当的合成数据可能会变成难以理解的废话。Cosmos旨在通过让科学家根据现实世界的物理学快速生成大量人工视频片段来解决这些问题。相关内容: 2024年机器人技术的突破:测试你对该领域最令人兴奋的进步的了解“今天的人形开发人员有数百名人类操作员进行数千次重复演示,只是为了教授一些技能,”英伟达Omniverse和仿真技术副总裁Rev Lebaredian周一(1月6日)在拉斯维加斯消费电子展2025上的虚拟新闻发布会上说。“今天的AV开发人员需要驾驶数百万英里;更资源密集型的是处理、过滤和标记捕获的数千PB数据,物理测试是危险的。当一个机器人原型可能花费数十万美元时,人形开发人员会损失很多。”模拟多元宇宙这个新平台的一个关键组成部分是多元宇宙模拟,在该模拟中,Cosmos与英伟达的Omniverse软件系统相结合,在特定场景中生成所有可能的未来结果。然后,这将被输入机器人或自动驾驶car.It的训练中,使用图像生成中使用的扩散模型——机器学习算法,通过向数据集中添加“噪声”(粒状规格)来生成数据,然后学习去除噪声——以及自回归模型,这些模型是用于预测流程中下一步的统计模型。该平台可以一起接收文本、图像或视频,然后生成镜头,以实时预测特定场景中接下来会发生什么。“机器人技术的ChatGPT时刻即将到来。英伟达创始人兼首席执行官黄仁勋在一份声明中表示:“与大型语言模型一样,世界基础模型是推进机器人和视音频开发的基础,但并非所有开发人员都有培训自己的专业知识和资源。”"我们创建宇宙是为了使物理人工智能民主化,并让每个开发人员都能接触到通用机器人。"

使用Cosmos创建的世界基础模型也可在开源许可条款下使用。

© 版权声明

相关文章

这个“盲人”猎豹机器人没有视力,没有问题

麻省理工学院的工程师和机器人专家显然正在竭尽全力帮助我们过渡到一个全面的机器人接管。他们在“盲人运动”方面的最新成就是90磅。(41公斤)猎豹3号。这种四肢机械野兽可以跺脚爬上散落着碎片的楼梯,在不平坦的地形上冲刺,在被重击后恢复过来,或者pushed By设计机器人来“感觉”自己的立足点,就像被蒙住眼睛的人所做的那样,麻省理工学院的研究人员希望制造出一种机器,它可以比依靠视觉更快地对意外障碍物做出反应。机器人的设计者、麻省理工学院机械工程副教授Sangbae Kim在一份声明中说。[奔跑中的机器人!5个真正可以移动的机器人】“视觉可能会‘嘈杂’,有点不准确,有时甚至不可用,如果你过于依赖视觉,你的机器人必须非常准确地定位,最终会很慢,”金说。“如果它踩到相机看不到的东西怎么办?它会做什么?这就是盲目运动可以提供帮助的地方。我们不想太相信我们的视觉。”就像它的大猫一样,这个机器人可以左右弯曲和弯曲它的身体和腿——几乎就像它准备向毫无戒心的猎物跳跃一样。多个传感器收集机器人每走一步的数据;根据麻省理工学院的声明,特殊算法评估肢体运动的数据,以帮助猎豹3号弄清楚每只脚放在哪里,以及当它遇到意想不到的绊脚石,如石头或树枝时如何恢复。这些计算使机器人能够决定什么时候“承诺”脚步并向前移动是安全的,什么时候后退更谨慎。
2026-01-14

“多元宇宙模拟引擎”预测了训练人形机器人和自动驾驶汽车的每一个可能的未来 暂无评论