拉斯维加斯——研究人员建立了一个新的“多元宇宙模拟”平台,可以生成大量数据来训练由人工智能(AI)驱动的先进自学习机器人。
据设计该平台的英伟达公司称,这套被称为“宇宙”的工具可以让研究人员创建“世界基础模型”——模拟现实世界环境和物理定律以预测现实结果的神经网络。这些生成式人工智能模型可以创建合成数据来训练具身或物理人工智能系统,如自动驾驶汽车或人形人工智能系统robots.Training人工智能系统需要大量数据,但科学家估计,到2026年,我们可能会用完公开可用的数据。与现实世界交互的人工智能系统,如机器人,通常需要真实世界的镜头,这些镜头非常难以制作,获取成本也很高。但是创建真正有用的合成数据也具有挑战性,一项研究之前警告说,使用解释不当的合成数据可能会变成难以理解的废话。Cosmos旨在通过让科学家根据现实世界的物理学快速生成大量人工视频片段来解决这些问题。相关内容: 2024年机器人技术的突破:测试你对该领域最令人兴奋的进步的了解“今天的人形开发人员有数百名人类操作员进行数千次重复演示,只是为了教授一些技能,”英伟达Omniverse和仿真技术副总裁Rev Lebaredian周一(1月6日)在拉斯维加斯消费电子展2025上的虚拟新闻发布会上说。“今天的AV开发人员需要驾驶数百万英里;更资源密集型的是处理、过滤和标记捕获的数千PB数据,物理测试是危险的。当一个机器人原型可能花费数十万美元时,人形开发人员会损失很多。”模拟多元宇宙这个新平台的一个关键组成部分是多元宇宙模拟,在该模拟中,Cosmos与英伟达的Omniverse软件系统相结合,在特定场景中生成所有可能的未来结果。然后,这将被输入机器人或自动驾驶car.It的训练中,使用图像生成中使用的扩散模型——机器学习算法,通过向数据集中添加“噪声”(粒状规格)来生成数据,然后学习去除噪声——以及自回归模型,这些模型是用于预测流程中下一步的统计模型。该平台可以一起接收文本、图像或视频,然后生成镜头,以实时预测特定场景中接下来会发生什么。“机器人技术的ChatGPT时刻即将到来。英伟达创始人兼首席执行官黄仁勋在一份声明中表示:“与大型语言模型一样,世界基础模型是推进机器人和视音频开发的基础,但并非所有开发人员都有培训自己的专业知识和资源。”"我们创建宇宙是为了使物理人工智能民主化,并让每个开发人员都能接触到通用机器人。"
使用Cosmos创建的世界基础模型也可在开源许可条款下使用。