“生成式AI之后,物理AI时代开启”……合成数据崛起为全球AI核心基础设施

随着能够感知、判断并在现实环境中执行动作的“物理AI(Physical AI)”时代在生成式AI之后正式到来,全球AI产业的竞争重心正逐渐转向数据基础设施。为了在机器人、自动驾驶、智能工厂等现实场景中实现AI应用,获取接近真实环境的训练数据已成为关键,而合成数据(Synthetic Data)正被视为支撑这一趋势的核心基础设施。
合成数据是指基于数字孪生(Digital Twin)虚拟环境生成的AI训练数据,而非反复采集真实世界数据。其核心不仅在于简单的3D建模,更在于对材质、表面纹理、反射率、光照条件以及传感器误差等现实物理因素的还原,从而构建接近真实工业现场的训练环境。
业界认为,在真实环境中反复训练机器人在成本、时间以及异常数据获取方面存在明显局限。因此,先在虚拟环境中完成训练与验证,再应用于现实世界的“Sim-to-Real(仿真到现实)”模式预计将进一步普及。相比单纯扩大数据生成量,能够直接应用于机器人、自动驾驶和智能工厂场景的“Simulation-Ready Data(仿真就绪数据)”的重要性正在迅速提升。
典型案例包括全球工业自动化企业ABB与英伟达(NVIDIA)的合作。ABB Robotics为开发下一代自主工业机器人,已与英伟达建立合作体系,并公布了将其机器人仿真平台“RobotStudio”与英伟达“Omniverse”结合的工业AI仿真环境建设计划。
ABB正在通过将机器人设计、编程与仿真软件RobotStudio与英伟达Omniverse结合,进一步强化工业机器人在实际工厂部署前先于虚拟环境中完成学习与验证的体系。与此同时,英伟达也正依托Omniverse与Isaac Sim物理仿真技术,重点推进缩小虚拟环境与现实环境差异的Sim-to-Real技术开发。
业界普遍认为,此次合作不仅仅是单纯的技术联盟,更是抢占物理AI时代核心基础设施——合成数据与仿真生态系统主导权的战略布局。让在虚拟环境中训练的AI模型能够稳定运行于制造、物流等真实工业场景的技术竞争,已全面展开。
在韩国,面向物理AI训练的合成数据市场布局也正在扩大。不过,工业级合成数据需要实现工业空间结构、光照、物体交互、机器人运动路径以及基于物理规则的仿真,因此被认为是技术门槛极高的领域。
其中,SKAI Intelligence作为基于英伟达Omniverse的工业合成数据企业受到关注。公司近期成立了专门的企业附属研究所(R&D中心),以进一步提升数字孪生与合成数据技术,并强化Real-to-Sim与Sim-to-Real架构设计能力。
SKAI Intelligence不仅专注于3D数据生成,还致力于构建融合工业现场结构、物体交互、机器人运动路径及物理仿真的合成数据基础设施。此外,Xiilab、N.LIGHT、CrowdWorks等韩国企业,也正凭借数字孪生、3D CAD及AI数据构建能力,加速进入相关市场。
市场增长潜力同样迅猛。根据全球市场研究机构Grand View Research的数据,全球合成数据市场规模预计将从2023年的2.184亿美元增长至2030年的17.881亿美元。随着机器人、自动驾驶和智能工厂等物理AI应用产业持续扩大,工业级合成数据需求预计也将快速增长。
一位业内人士表示:“在物理AI时代,合成数据是让机器人在投入真实环境之前,提前经历大量异常场景的核心训练基础设施。”他还指出:“未来的竞争力,将取决于企业能否更精确地将现实世界数字化,并将其有效连接至AI训练与实际性能提升。”