25
2026
06

九游体育官网登录入口第三个层级是"生成与重建的调和"-九游「中国」Ninegame·官方网站-登录入口

发布日期:2026-06-25 04:58    点击次数:143

Landing AI 本期论点:空间智能,是 AI 走向通用化历程中的下一个重要前沿。

谈话模子让咱们对话天下,图像模子让咱们感知天下,而空间模子将决定咱们能否谢天下中行动。李飞飞与 World Labs 的新冒险,或者将决定下一个 AI 平台级变革的开端。

当大谈话模子风靡公共、生成式 AI 深度镶嵌闲居生活,从搜索、写稿到编程,无一不在转换东说念主类的想维与抒发花式。关联词,在 AI 社区的一场炉边对谈中,李飞飞却抛出了一个更具挑战性的问题:"咱们有莫得忘了,AI 其实生活谢天下里?"

近期,在 YC 举办的一场线下行动,手脚到场嘉宾,斯坦福大学训诲、前 Google Cloud 首席科学家李飞飞共享了她的最新判断:真确的通用东说念主工智能(AGI),不仅要能处理谈话和图像,还必须具备聚集和模拟物理天下的智商。她将这个智商称为"空间智能"(spatial intelligence),并将其界说为畴昔 AI 最重要、亦然最重荷的一齐关卡。

注:本文由 ChatGPT 4o 整理

从 ImageNet 到 World Labs:她长久走在数据前边

李飞飞的时候逸想从未脱离试验天下的结构。早在 2007 年,她便在普林斯顿大学发起 ImageNet 表情,险些"下载了整座互联网"的图像,用于构建一个千万级范围的图像识别数据库。她在对谈中回忆:"其时候统统东说念主齐在究诘算法,我遴选去究诘数据,因为咱们需要天下的样本。"

ImageNet 得胜激活了深度学习的后劲,也让"数据即燃料"的范式成为主流。AlexNet 在 2012 年 ILSVRC 比赛中的惊艳施展,评释了大范围有标签数据与神经收积贮合的威力。

如今,十五年昔时,李飞飞再次投身"数据建模"的一线,但此次对准的是一个维度更高、结构更复杂的对象——三维天下。她创立的创业公司 World Labs,正奋勉于于构建新一代"天下模子"(world models),目的是在编造空间中重建、模拟以致生成一个可供 AI 感知、聚集与操作的三维环境。"我称它为第三代基础模子:谈话是第一代,图像是第二代,天下才是终极场景。"她说。

空间智能为奈何此重荷?

在对谈中,李飞飞以极简的花式解释了空间智能的根蒂难题:"谈话是一维的序列,图像是二维的像素网格,而天下,是 3D + 时候的连气儿体。"

她将挑战转头为三个层级。最初是"维度爆炸",谈话模子处理的是 token 序列,而空间建模需要聚集三维结构过甚随时候变化的动态属性,数据维度与计较复杂度指数高潮。

第二个挑战是"感知病态性"。咱们的视觉系统只可取得二维投影,例如录像头拍下的是一幅图像,但 AI 却要基于这个图像归附出齐备场景的三维结构,包括被装扮的部分、物体之间的相对位置与大小。这在数学上即是一个"病态问题"——小罪过会被无穷放大。

第三个层级是"生成与重建的调和"。李飞飞指出,空间智能模子既要能重建已知场景,也要像生成模子那样"幻想"未知结构,从扫描试验到编造合成,两头之间是一个连气儿谱。谈话模子不错靠大范围爬虫数据作念熟识,但天下数据"藏在东说念主类大脑里",难以捏取、组织与标注。

因此,World Labs 遴选领受"混杂式数据政策"——东说念主工集中试验场景数据、合成熟识数据,并引入物理与语义先验,用小而精、结构性强的数据替代地说念的范围驱动。

World Labs 要处理什么问题?

在对谈中,李飞飞强调,World Labs 的目的是构建一种"既能看见天下、又能假想天下"的 AI 智商。她将这种智商称为"生成 - 感知一体化"(generative-perceptual symmetry),区别于昔时那种将计较机视觉与生成模子隔离对待的作念法。

她例如说,在一个实在的厨房里,AI 不仅要识别出"锅""勺子""灶台",还要聚集空间结构,比如"锅在灶台上,勺子在锅里",并推理"要是出动锅的位置,勺子也会被带动"。这些空间逻辑不仅依赖图像识别,更需要物理模拟智商和空间推明智商。

World Labs 因此不是在作念"图像模子的升级版",而是在打造一个真确用于智能体(agents)出手的天下模子底座——不管是机器东说念主、自动驾驶系统,照旧千里浸式 XR 环境,通通需要它。

她也明确提到,World Labs 的第一代产物可能集聚焦"场景级 3D 模子生成"与"任务导向式天下模拟平台",办当事人义包括家庭机器东说念主、工业制造、空间教授与编造试验等多个垂直边界。

为什么 AGI 离不开空间智能?

在现时 AI 时候热门已经蚁集在谈话模子的配景下,李飞飞的判断显得尤为澄澈:" LLM 只处理了智能的一部分,那是笼统层。真确的智能,还要落地。"她指出,险些统统的通用智能诓骗——不管是自动驾驶、送餐机器东说念主,照旧畴昔的 AI 助理——齐波及对空间环境的聚集与应酬。

她分析称,通用谈话模子处理的是常识抒发问题,而空间智能处理的是生涯与行动问题。后者才是构建 Agent 的重要基底。要是莫得空间建模,统统的"行动苛刻"齐仅仅画饼果腹。

她进一步征引现时几项趋势手脚佐证:OpenAI 与 Jony Ive 协调开导的新一代 AI Agent 产物,正在探索具备感知智商的硬件形态;DeepMind 推出的 DreamerV3 模子强调从感知到假想到行动的闭环学习;而 GNN(图神经收集)与 RLHF(东说念主类反应强化学习)正在强化 AI 对"物理天下中关连"的聚集力。

" AGI 的下一步,不在于更聪敏的谈话模子,而在于更可靠的天下模子。"她转头说念。

从科研到创业:她为何总走"最难的那条路"?

对李飞飞来说,World Labs 并非她第一次站在未知前沿。她在共享中坦言,从读博期间在险些莫得导师维持的环境中宝石计较机视觉,到 ImageNet 配置初期险些没东说念主降服数据驱动门径,她早已民俗了"莫得东说念主铺路的所在我方开一条路"。

"我尊重常识,也尊重勇气。"她说。在 World Labs,她宝石的独一门径是:"找那种不怕艰苦、不怕没东说念主招供的东说念主。"她称之为" intellectual fearlessness "九游体育官网登录入口,一种在莫得阶梯图的情况下也能历久投身于构建职责中的精神。



相关资讯
热点资讯


Powered by 九游「中国」Ninegame·官方网站-登录入口 @2013-2022 RSS地图 HTML地图

Copyright Powered by365建站 © 2013-2024