世界模型(World Model)是一种理解现实世界动态的生成式AI模型,其不仅能理解静态的数据,还能模拟现实世界的动态过程。
多模态感知融合、真实物理世界构建、动态环境预测是世界模型核心能力。在构建方法上,目前世界模型主要有用扩散模型生成、用Transformer架构提取关键信息、用“双自回归技术”补“长时记忆”、用“神经-符号结合”补“逻辑推理”四种构建方法。
世界模型是实现空间智能的核心、物理推理的基础,在自动驾驶、机器人、数字孪生、影视游戏、虚拟现实、元宇宙、医疗健康、具身智能等领域具有广阔应用潜力。在自动驾驶领域,世界模型可以整合静态结构、动态实体等多源信息,实时捕捉并更新环境状态,进而为自动驾驶的感知、预测、决策、规划等提供统一的环境表征。
根据新思界产业研究中心发布的
《2025-2029年世界模型行业市场深度调研及投资前景预测分析报告》显示,目前世界模型正不断从“前沿概念”进入“工程落地”拐点,预计自动驾驶、机器人等领域率先实现商业化应用,尤其是自动驾驶领域。
世界模型核心思想可以追溯到上世纪90年代初,但近年来才引起广泛关注,目前世界模型仍处于早期发展阶段。世界模型训练需要处理海量、高维度的物理交互数据,对AI芯片的推理、训练能力要求极高,目前世界模型商业化落地仍面临算力成本过高、训练数据太单一、长时间预测不准、场景适配性差等难题。
但作为实现空间智能的核心,世界模型已成为国内外厂商必争之地,在国际市场上,世界模型布局企业包括World Labs、谷歌、英伟达、Meta、Tesla、Wayve等。Genie 3是谷歌首个支持实时交互的世界模型,也是目前最具代表性的世界模型之一。
我国在世界模型领域亦有布局,目前参与者已达十余家,包括商汤、理想、华为、腾讯、蔚来、小米等,其中商汤的绝影开悟世界模型在产品技术、应用能力、生态建设等方面优势明显,综合实力位居国内第一。
新思界
行业分析人士表示,世界模型已成为国内外厂商必争之地,我国企业已具备与国际厂商相竞争的实力。近年来,在相关企业积极布局下,新世界模型不断涌现,同时世界模型在自动驾驶、机器人、具身智能等领域的探索也不断推进。但由于算力成本高、数据单一等难题,目前世界模型仍处于发展早期阶段,距离大规模落地仍有一定距离。
关键字: