九游体育官网登录入口第三个层级是＂生成与重建的调和＂-九游「中国」Ninegame·官方网站-登录入口

你的位置：九游「中国」Ninegame·官方网站-登录入口 > 新闻 > 九游体育官网登录入口第三个层级是＂生成与重建的调和＂-九游「中国」Ninegame·官方网站-登录入口

25

2026
06

九游体育官网登录入口第三个层级是＂生成与重建的调和＂-九游「中国」Ninegame·官方网站-登录入口

发布日期：2026-06-25 04:58 点击次数：143

Landing AI 本期论点：空间智能，是 AI 走向通用化历程中的下一个重要前沿。

谈话模子让咱们对话天下，图像模子让咱们感知天下，而空间模子将决定咱们能否谢天下中行动。李飞飞与 World Labs 的新冒险，或者将决定下一个 AI 平台级变革的开端。

当大谈话模子风靡公共、生成式 AI 深度镶嵌闲居生活，从搜索、写稿到编程，无一不在转换东说念主类的想维与抒发花式。关联词，在 AI 社区的一场炉边对谈中，李飞飞却抛出了一个更具挑战性的问题："咱们有莫得忘了，AI 其实生活谢天下里？"

近期，在 YC 举办的一场线下行动，手脚到场嘉宾，斯坦福大学训诲、前 Google Cloud 首席科学家李飞飞共享了她的最新判断：真确的通用东说念主工智能（AGI），不仅要能处理谈话和图像，还必须具备聚集和模拟物理天下的智商。她将这个智商称为"空间智能"（spatial intelligence），并将其界说为畴昔 AI 最重要、亦然最重荷的一齐关卡。

注：本文由 ChatGPT 4o 整理

从 ImageNet 到 World Labs：她长久走在数据前边

李飞飞的时候逸想从未脱离试验天下的结构。早在 2007 年，她便在普林斯顿大学发起 ImageNet 表情，险些"下载了整座互联网"的图像，用于构建一个千万级范围的图像识别数据库。她在对谈中回忆："其时候统统东说念主齐在究诘算法，我遴选去究诘数据，因为咱们需要天下的样本。"

ImageNet 得胜激活了深度学习的后劲，也让"数据即燃料"的范式成为主流。AlexNet 在 2012 年 ILSVRC 比赛中的惊艳施展，评释了大范围有标签数据与神经收积贮合的威力。

如今，十五年昔时，李飞飞再次投身"数据建模"的一线，但此次对准的是一个维度更高、结构更复杂的对象——三维天下。她创立的创业公司 World Labs，正奋勉于于构建新一代"天下模子"（world models），目的是在编造空间中重建、模拟以致生成一个可供 AI 感知、聚集与操作的三维环境。"我称它为第三代基础模子：谈话是第一代，图像是第二代，天下才是终极场景。"她说。

空间智能为奈何此重荷？

在对谈中，李飞飞以极简的花式解释了空间智能的根蒂难题："谈话是一维的序列，图像是二维的像素网格，而天下，是 3D + 时候的连气儿体。"

她将挑战转头为三个层级。最初是"维度爆炸"，谈话模子处理的是 token 序列，而空间建模需要聚集三维结构过甚随时候变化的动态属性，数据维度与计较复杂度指数高潮。

第二个挑战是"感知病态性"。咱们的视觉系统只可取得二维投影，例如录像头拍下的是一幅图像，但 AI 却要基于这个图像归附出齐备场景的三维结构，包括被装扮的部分、物体之间的相对位置与大小。这在数学上即是一个"病态问题"——小罪过会被无穷放大。

第三个层级是"生成与重建的调和"。李飞飞指出，空间智能模子既要能重建已知场景，也要像生成模子那样"幻想"未知结构，从扫描试验到编造合成，两头之间是一个连气儿谱。谈话模子不错靠大范围爬虫数据作念熟识，但天下数据"藏在东说念主类大脑里"，难以捏取、组织与标注。

因此，World Labs 遴选领受"混杂式数据政策"——东说念主工集中试验场景数据、合成熟识数据，并引入物理与语义先验，用小而精、结构性强的数据替代地说念的范围驱动。

World Labs 要处理什么问题？

在对谈中，李飞飞强调，World Labs 的目的是构建一种"既能看见天下、又能假想天下"的 AI 智商。她将这种智商称为"生成 - 感知一体化"（generative-perceptual symmetry），区别于昔时那种将计较机视觉与生成模子隔离对待的作念法。

她例如说，在一个实在的厨房里，AI 不仅要识别出"锅""勺子""灶台"，还要聚集空间结构，比如"锅在灶台上，勺子在锅里"，并推理"要是出动锅的位置，勺子也会被带动"。这些空间逻辑不仅依赖图像识别，更需要物理模拟智商和空间推明智商。

World Labs 因此不是在作念"图像模子的升级版"，而是在打造一个真确用于智能体（agents）出手的天下模子底座——不管是机器东说念主、自动驾驶系统，照旧千里浸式 XR 环境，通通需要它。

她也明确提到，World Labs 的第一代产物可能集聚焦"场景级 3D 模子生成"与"任务导向式天下模拟平台"，办当事人义包括家庭机器东说念主、工业制造、空间教授与编造试验等多个垂直边界。

为什么 AGI 离不开空间智能？

在现时 AI 时候热门已经蚁集在谈话模子的配景下，李飞飞的判断显得尤为澄澈：" LLM 只处理了智能的一部分，那是笼统层。真确的智能，还要落地。"她指出，险些统统的通用智能诓骗——不管是自动驾驶、送餐机器东说念主，照旧畴昔的 AI 助理——齐波及对空间环境的聚集与应酬。

她分析称，通用谈话模子处理的是常识抒发问题，而空间智能处理的是生涯与行动问题。后者才是构建 Agent 的重要基底。要是莫得空间建模，统统的"行动苛刻"齐仅仅画饼果腹。

她进一步征引现时几项趋势手脚佐证：OpenAI 与 Jony Ive 协调开导的新一代 AI Agent 产物，正在探索具备感知智商的硬件形态；DeepMind 推出的 DreamerV3 模子强调从感知到假想到行动的闭环学习；而 GNN（图神经收集）与 RLHF（东说念主类反应强化学习）正在强化 AI 对"物理天下中关连"的聚集力。

" AGI 的下一步，不在于更聪敏的谈话模子，而在于更可靠的天下模子。"她转头说念。

从科研到创业：她为何总走"最难的那条路"？

对李飞飞来说，World Labs 并非她第一次站在未知前沿。她在共享中坦言，从读博期间在险些莫得导师维持的环境中宝石计较机视觉，到 ImageNet 配置初期险些没东说念主降服数据驱动门径，她早已民俗了"莫得东说念主铺路的所在我方开一条路"。

"我尊重常识，也尊重勇气。"她说。在 World Labs，她宝石的独一门径是："找那种不怕艰苦、不怕没东说念主招供的东说念主。"她称之为" intellectual fearlessness "九游体育官网登录入口，一种在莫得阶梯图的情况下也能历久投身于构建职责中的精神。

相关资讯

热点资讯

25

202606

九游体育官网登录入口第三个层级是＂生成与重建的调和＂-九游「中国」Ninegame·官方网站-登录入口

2026
06