CES 2025吸引了全球的目光,突飞猛进的AI技术在这里最为耀眼。“AI正以惊人的速度发展,下一个前沿将是‘物理 AI’。”NVIDIA (英伟达)创始人兼首席执行官黄仁勋在CES发布会上表示,他将这一进展比作大语言模型对生成式AI的“革命性”影响。
NVIDIA创始人兼首席执行官黄仁勋
实际上,CES 2025期间,英伟达已经推出了“物理 AI”相关的解决方案,今后,自动驾驶的AI训练数据规模将因此而提升数个量级,研发成本也将大幅降低。
什么是“物理AI”?
1999年,NVIDIA发明了可编程GPU。从那时起,AI就从根本上改变了计算的运作方式。“在最近这短短的12年间,AI技术堆栈的每一层都发生了翻天覆地的变化,这是一个令人难以置信的转变。”黄仁勋饱含激情地说到。
AI的进阶,最开始是“感知式AI”,即AI理解图像、文字和声音;然后是“生成式AI”,即AI创造文本、图像和声音;现在,我们正在进入“物理AI”的时代,即能够运行、推理、计划和行动的 AI。
今天大家所熟悉的ChatGPT和文心一言,就是最典型的生成式AI,它们不仅能分析现有数据,还能在归纳已有数据后展开演绎与创造,模仿并生成全新的内容。
物理AI更进一步,是一个能够理解现实世界(物理世界)并与之进行交互的模型。利用物理AI,自动驾驶汽车、智能机器人等自主机器,能够感知、理解并在现实世界中执行更为复杂的操作,从而实现机体、控制、形态、动作执行和感知的协同进化。
黄仁勋表示:“物理 AI 将为总值50万亿美元的制造业和物流业带来巨大改变。从汽车到工厂和仓库,移动的事物能够被机器人化,并通过 AI具身化。英伟达的Omniverse图形和仿真模拟平台和全新推出的Cosmos世界基础模型,将作为实现全球实体产业数字化的基础库。”
自动驾驶与“物理AI”
众所周知,自动驾驶的技术迭代需要大量的训练数据和模拟场景支持,英伟达提供了三种关键计算系统——用于采集数据训练AI模型的NVIDIA DGX、用于虚拟测试和生成合成数据的Omniverse 和Cosmos、用于自动驾驶汽车的车载超级计算机DRIVE AGX,已经形成了一个闭环系统。
物理AI反哺自动驾驶虚拟测试
黄仁勋特别强调了其中“合成数据”在推动自动驾驶汽车发展的重要作用,因为现实世界的数据资源仍然有限,因此,合成数据对训练自动驾驶汽车的“数据工厂”来说至关重要。
英伟达全新推出的世界基础模型Cosmos,为自动驾驶与机器人开发提供了一个低成本的数据生成方案,这将全方位加速汽车智能化变革,对产业格局、技术走向及出行生态都将产生深远的影响。
Cosmos旨在将预见能力和多元宇宙模拟的能力引入AI模型,使其能够模拟每一种可能的未来情况,并选择最佳的行动方案。以自动驾驶汽车的开发应用为例,Omniverse提供高保真的虚拟场景,用于测试和优化自动驾驶算法,而Cosmos则利用自动驾驶汽车获取的真实数据生成新的虚拟数据,进一步丰富训练样本。
黄仁勋表示,与大语言模型一样,Cosmos世界基础模型对于推动机器人和自动驾驶汽车开发至关重要,但并非所有开发者都拥有自主训练模型所需的专业知识和资源,因此,英伟达将Cosmos定位为物理AI领域的“ChatGPT”,目标是通过开放式的基础模型让更多开发者触及高质量数据资源和AI工具。
Cosmos 集成了生成式模型、tokenizer 和视频处理管线,可以为自动驾驶汽车和机器人等领域构建物理AI系统提供支持。
黄仁勋解释说:“Cosmos模型会提取文本、图像或视频提示,并以视频形式生成虚拟世界状态。Cosmos生成优先考虑自动驾驶汽车和机器人用例的独特需求,例如真实世界环境、照明和物体持久性。”
据了解,Cosmos的首批用户包括1X、Agile Robots、Agility、Figure AI、Foretellix、Fourier、Galbot、Hillbot、IntBot、Neura Robotics、Skild AI、Virtual Incision、Waabi 和小鹏汽车等领先的机器人和汽车公司,此外还有共享出行巨头Uber。
以往,NVIDIA DRIVE Thor集中式车载计算平台作为小鹏新一代电动汽车的AI大脑,为其专有的XNGP AI辅助驾驶系统提供支持,今后,Cosmos的加持,将使其大幅加速开发流程,并能够为用户塑造更好的未来移动体验。Uber则希望利用物理AI进一步优化自动驾驶配送算法。
物理AI进一步扩展Omniverse
在物理AI的赋能下,Omniverse及其应用都得到了进一步扩展。
Omniverse搭配Cosmos,组成了一个合成数据倍增引擎,开发者能够使用该引擎轻松生成大量可控、逼真的合成数据。开发者还可以在 Omniverse中创建3D场景并对输出的图像或视频进行渲染,然后将这些图像或视频可以与文本提示一起用于调整Cosmos模型,生成无数用于物理AI训练的合成虚拟环境。
在汽车行业,Omniverse + Cosmos可以生成合成驾驶场景,将AI训练数据的规模提升数个量级。用黄仁勋的话来说,通过使用Omniverse和Cosmos,NVIDIA的AI数据工厂可以“将数百次驾驶扩展为数十亿英里的有效里程。”
借助这些AI工具,车企能够大幅降低研发成本,加速技术迭代,提升自动驾驶算法的精度和可靠性。
车企可以借助AI工具加速研发效率
此外,英伟达还发布了第四代NVIDIA DRIVE Thor车载计算平台。Thor芯片有多先进,当然不必多说,而第四代Thor的算力相比上一代Orin平台骤升20倍!这不仅是计算性能的升级迭代,更推动了自动驾驶功能的全面升级!
借助Thor,英伟达为车载计算机提供了强大的实时计算能力,支持摄像头、雷达、激光雷达等多传感器融合,实现多模态感知与决策,使车辆具备自动驾驶L4甚至L5级别的能力。
随着搭载这些芯片的车辆上路,它们采集的真实行驶数据,将成为优化自动驾驶算法的“富矿”。Omniverse虚拟平台加上Cosmos,可以说,英伟达的自动驾驶迭代方式不仅注重虚实结合,而且借助真实世界的数据反哺虚拟时间,无疑,这是一项开创性的巨大进步。
自动驾驶汽车工具链供应商Foretellix是数据驱动型自动驾驶开发领域的领导者,该公司正在使用英伟达的自动驾驶汽车仿真蓝图进行全3D传感器仿真,以此优化自动驾驶汽车的测试和验证。这种自动驾驶仿真由Omniverse Sensor RTX API驱动,使开发者能够播放驾驶数据、生成新的基准真实数据并执行闭环测试,从而大幅加速开发、缩短新车上市周期。
汽车工程师所熟知的仿真领域的领导者Altair,正在使用Omniverse构建交互式计算流体动力学(CFD)的实时 CAE 数字孪生。基于强大的行业竞争力,该公司被西门子重金收购,今后将纳入到西门子的全流程数字孪生版图。另外一家仿真巨头Ansys 也正在将 Omniverse 用于其领先的 CAE 应用 Ansys Fluent中,改进工作流,提升工程效率。
现代汽车集团正在采用英伟达的AI技术和Omniverse打造更安全、更智能的汽车,同时提升制造能力,并部署最前沿的机器人技术。
面向企业的XR流式传输平台 Innoactive,借助AI技术改进工作流,为Apple Vision Pro增加了空间流式传输的平台支持。借助这种解决方案,大众汽车能够以人眼分辨率进行汽车设计和工程项目的审查。
Katana Studio也在使用 Omniverse空间流式传输工作流程为日产汽车和大众汽车创建定制汽车配置器,以使他们的终端顾客能够在沉浸式的环境中定制设计自己喜欢的专属车型,同时改善客户决策流程。
此外,英伟达还吸引了包括丰田、特斯拉、奔驰、比亚迪、理想、小米、极氪在内的多家车企加入其生态系统的“朋友圈”,共同推动下一代自动驾驶的创新与发展。
从生成式AI到物理AI,我们将共同见证一个新的时代。黄仁勋说:“自动驾驶的时代已经到来!”
评论
加载更多