今年1月,这家炙手可热的世界模型创业新星就被传出可能正在进行一轮5亿美元新融资,但最终结果却远超预期——
不是5亿,而是10亿美金(约合人民币69亿元),而且这一轮AMD、英伟达、富达等都投了。
加上本轮融资,成立于2024年4月的World Labs可谓成长飞速——
就这么说吧,可能最接近World Labs融资速度的Anthropic,也花了25个月才达到50亿美元估值。
进入2026,谁都知道世界模型很hot,但看到World Labs成长如此之快,人们或许才对这一点有了更多实感。
虽然这里面不乏AI教母李飞飞带来的光环效应,但不得不说,投资者对世界模型的押注决心,比预想中来得更早、也更猛。
仔细一梳理,你就知道这不是一轮单纯的财务投资,而更像一次围绕“空间智能”生态的产业合围。
而本轮投了2亿美金的Autodesk则对应3D设计与工业软件生态,这也是空间智能最终的落地方向之一。
包括Sea Limited,作为东南亚最大的互联网生态之一,由于旗下覆盖游戏、电商与数字内容场景(这些天然与虚拟空间、沉浸式互动高度相关),所以它更像是一张通往新兴市场的入场券。
至于富达和Emerson Collective(乔布斯遗孀创办的慈善与影响力投资机构),则更多代表的是资本层面的认可。
前者意味着这家公司已经进入主流金融资本的视野,后者则偏向长期主义与影响力投资逻辑,押注的不是短期回报,而是下一代技术范式的长期演进。
把这些放在一起看,显然这套投资阵容已经把空间智能未来可能涉及的关键环节一次性拼齐了——
我们致力于加速推进空间智能的使命,构建世界模型,从而革新故事讲述、创造力、机器人技术、科学发现等领域。
围绕这一前沿阵地,World Labs虽然成立时间不长,但融资一直没断过——
成立当月便完成首轮融资,0产品但估值2亿美金;两三个月后又完成一轮1亿美元融资,由NEA领投,公司估值被抬升至超过10亿美元,正式跻身独角兽行列。
(注:英伟达之前也投了,以及Google首席科学家Jeff Dean、AI教父Geoffrey Hinton等也都以个人投资者身份参投了。)
也是在今年年初,思科请了李飞飞、黄仁勋、Sam Altman等搞了一场人工智能峰会。在访谈中,李飞飞就再次谈到了世界模型和World Labs的首款产品Marble。
李飞飞:好的。现在我每天醒来只思考一件事,那就是空间智能。这是我大约两年前与一群年轻技术专家共同创立的公司——World Labs的核心使命。
从进化角度看,五亿多年前,感知能力的出现开启了神经系统的进化竞赛,而语言则是很晚才出现的。感知、触觉和视觉是智能的基础。因此,理解、推理、互动并导航于线D物理世界,是与语言智能同样基础的能力。
李飞飞:Marble是我们第一代空间智能模型的代号,我们informally(非正式地)称它为“世界模型”。
它能够接收多模态输入,无论是文字、图片、视频,还是简单的3D输入,然后将其转化为一个可导航、可交互的3D世界。这个世界是几何一致、永久稳定的,与当前的视频生成模型完全不同。它可以支持机器人模拟、游戏开发等多种应用。
我们在两个月前发布了Marble,虽然还是第一代,但已经是目前最先进的3D生成世界模型。
主持人:有人认为仅靠语言模型无法实现AGI,你怎么看?空间智能会带来哪些新可能?
李飞飞:确实,语言模型有局限,而物理世界的理解和互动能力是AGI的关键一环。最直接的应用是机器人技术,但远不止于此。
我们已经看到用户用Marble开发游戏、VFX特效、虚拟制片;建筑师和设计师用于室内设计;甚至还有临床研究人员用于心理健康研究,比如为OCD患者(即强迫症)创建个性化的沉浸式环境。还有人用它来做个性化的瑜伽或健身训练。
主持人:作为AI领域的资深研究者,创办World Labs的过程中,最让你惊讶的是什么?
李飞飞:首先,AI的发展速度令人屏息。过去几年,模型发布、论文、新闻层出不穷,每个人内心都有一种“学不完”的焦虑。这让我既兴奋,也提醒自己要保持谦逊和学习的心态。
其次,让我担忧的是AI讨论的两极化——要么是极端的技术乌托邦,要么是末日论调。这种极端的rhetoric(修辞)并不负责任。技术从来都是双刃剑,关键在于我们,每一位从业者、每一位公民如何引导它。
李飞飞:我们可以类比电力的发展。电力的成功不是因为它本身,而是因为它点亮了学校、温暖了家庭、推动了工业、延长了寿命。AI的成功也应该是这样,当文明变得更好,当每个人都能更自由地追求幸福、尊严和繁荣时,AI才真正成功。
李飞飞:目前来看,我们的Marble模型比GPT-5等大语言模型小几个数量级。原因有二:一是数据不足,3D/4D的真实世界数据不像文本那样丰富;二是这个领域还很年轻,我们还在探索模型架构。
李飞飞:确实,语言模型有互联网级别的文本数据可用,而物理世界的数据则更难获取。因此我们采取混合数据策略:结合互联网规模的文本、图像、视频,再加上模拟数据和真实世界采集数据(如自动驾驶公司的路测数据)。此外,合成数据和数据生态系统的成熟也在加速这一进程。
李飞飞:这是一个极具挑战性的问题。以自动驾驶为例,2006年我们首次让车在沙漠中行驶138英里,但直到去年,Waymo才真正在市区大规模运营。这中间花了近20年。
而通用机器人比汽车复杂得多:汽车在二维平面上移动,只需“不碰撞”;而机器人要在三维空间中与物体交互,甚至要精准地触摸而不破坏。这涉及手部灵活度、视觉精度、空间理解、数据稀缺等多重挑战。
这就是为什么我创办World Labs——这个问题太重要了,值得我们全力以赴。
李飞飞:World Labs是一家面向企业的公司,我们非常愿意与各行各业的伙伴合作。空间智能是横向技术,应用场景极其广泛:机器人、仿真、沉浸式娱乐、医疗、教育、金融服务、农业、制造业、城市规划……几乎无所不包。
虽然World Labs身披“空间智能”“世界模型”这些外衣,但本质上要做、也正在做的只有一件事——
10亿美元融资、50亿美元估值,看似是资本数字的跃升,背后却是一个更清晰的信号——
至于世界模型是否会成为继大语言模型之后的又一主线?空间智能会不会成为通往物理AI与通用机器人的关键桥梁?
虽然这些问题还需要时间来回答,但至少在资本市场层面,人们已经投下了初步信任票。