nh1

世界模型打得头破血流,但AI还是不懂李飞飞的心

栏目:行业   作者:冯亭    发布时间:2026-06-17 16:32   阅读量:10048   会员投稿

李飞飞在不久前亲自为“世界模型”立下“渲染、模拟、规划”三功能缺一不可的铁律,“世界模型”定义权的争斗进入另一场白热化阶段。

但这场争夺的背后,是AI产业正走向充满技术傲慢这一岔路口的现实。

模型参数、物理模拟精度、视频生成长度……巨头们追逐着可量化的“世界”,却对模型内部那个真正需要被理解、被共情的“人心”视而不见。世界的链路日益明晰,与人的链接,却依然隐形。

这是一个吊诡的现实。

一方面,是以谷歌DeepMind的Genie 3、特斯拉的通用世界模型以及英伟达瞄准的万亿美元仿真市场,在物理世界的因果推演与视觉模拟上高歌猛进,构建着越来越逼真的数字沙盒。在这场向物理世界进军的浪潮中,李飞飞团队开发的Marble模型是一个最具代表性的角色,它专门为机器人训练和自动驾驶测试,打造了一个安全可控的虚拟考场。

资本正疯狂涌入,以构建能自主规划动作的“通用规划系统”为最终目标。

另一面,则是以豆包为代表的主流消费级AI应用,坐拥千万级 DAU,深度重塑着人们的日常,凭借“态度极好、能力一般、嘴巴特甜”的“呆傻”人设,成为无数人排解情绪的数字伙伴。它的“恍然大悟式道歉”与“嬉皮笑脸”,与其说是技术缺陷,不如说是一种生存策略——

一种用情绪价值弥补认知短板的、属于AI的“人情世故”。

只是,生存策略终究无法掩盖底座能力的缺失。在陪伴属性之外,AI应用作为效率工具的另一面正暴露出最令人不安的缺陷。那些频发的“幻觉”不仅在解构信任,更开始给用户带来真金白银的损失。

有用户因轻信豆包关于“退票仅扣5%”的错误信息,最终损失600元;另有人依据AI生成的“模拟预约信息”前往餐厅,却被告知预约无效。艾媒咨询的调查报告揭示了行业痛点:45.81%的消费者认为AI“无法实时优化”,43.21%认为其“推理能力较弱”。

图片

两种路径,看似并行,实则揭示了同一个本质问题:目前的AGI只有“物理/逻辑认知”,缺乏“人本认知”。

在传统世界模型的范式里,AI学习的是文本的概率组合与客观规律。它能极其精准地预测下一个词是什么,却无法预测屏幕前那个面对连续工作高压、突发生活变故,打下长长问号的用户,此刻正处于怎样的内心脆断边缘。

让AI回归人本,真正理解人、懂人的诉求,是 AGI 时代走入下半场必须重视的命题。当所有人都向着物理空间的一维世界模型狂奔时,回应这一命题的终极答案已经出现: 

我们不仅需要“物理世界模型”,更需要“人本世界模型”。 

1

人本世界模型:

被遗忘的命题与迟来的答案

让AI回归人是“人本世界模型”之所以必须被提出的原点。

它并非对现有物理世界模型的否定,而是一次至关重要的范式跃迁——

从“理解世界如何运行”,转向“理解人如何在世界中存在、感受与决策”。

理论上看,人本世界模型是一个复合系统:

它将心理学、社会学、行为科学等多学科理论,与人工智能技术深度融合,构建一个能够对个体心理状态、行为模式、社会关系和环境交互过程进行统一建模的认知框架。

它不再仅仅处理像素和文本,而是处理意图、动机、情绪和关系,实现对“心理——行为——关系——环境”这一复杂系统的认知、推理与预测,为人工智能进入人本智能阶段提供核心基础设施。

「人本世界模型」的落地并非停留于概念。在垂直交叉领域,市场上已经出现了硬核的早期探索:
●Hume AI 推出的共情语音模型(EVI),通过对人类语音中微小的断句、语气和生理情绪起伏进行高分辨率的多模态建模,试图真正读懂用户的隐秘动机;
●斯坦福的 AI 小镇(Generative Agents),则通过将心理特质、社会关系与环境交互统一编码,成功让虚拟智能体表现出了具备社会学常识的自主行为推演。
……
图片
▲EVI界面
这些前沿尝试的活跃,早已证明了技术向“人本”进军的确定性趋势。
然而,这条看似风口正盛的赛道,现阶段依然走得举步维艰。
目前,市面上大多数泛心理或情感陪伴类应用,受限于行业整体的发展阶段,其功能往往多聚焦于“情感树洞”或“趣味轻互动”等轻量级场景。一旦面对用户更深层的焦虑缓解、职场高压,或是更具破坏性的心理创伤支持,现阶段的应用往往难以独立给出具备专业价值的深度判断与干预。
这种场景落地的局限,本质上映射了当前主流大模型能力的共性瓶颈。观察如今最顶尖的通用大模型表现便能窥见端倪:豆包在面对深层情绪时常常装傻充愣、DeepSeek显得“不懂风情”、GPT则陷入过度讨好。
它们无一例外,都在用温柔的语调和固定的话术模板,去提供低阶的“心理按摩”,而非基于底层物理世界因果与人性深度洞察的有效共情。
这种缺乏专业科学模型的对话,没有触及到“真正懂人”的核心。一旦面对真正复杂的心理危机、职场高压或社会学层面的心理失衡,这些轻量级的陪伴就会显得苍白无力,甚至可能因为错误的心理暗示,加剧用户的心理失衡。

这种缺乏专业科学模型的对话,没有触及到“真正懂人”的核心。一旦面对真正复杂的心理危机、职场高压或社会学层面的心理失衡,这些轻量级的陪伴就会显得苍白无力,甚至可能因为错误的心理暗示,加剧用户的心理失衡。

而“人本世界模型”的出现,就是要给 AI 换上了一颗真正能共情、能推理、能预测的“人心”。

它能弥补当前AI+心理应用的短板,从初级的情感陪伴,上升到更加专业、真正能为人类社会和产业结构带来切实可见效益的高度。在危机发生前,就读懂那些隐形的求救信号。  

这正是连信数字推出“洞见人和”人本世界模型的初衷与分野。

2

从「重构物理空间」

到「丈量人类内心」

“洞见人和”人本世界模型的实践,早已超越了C端的情感陪伴,深入到社会系统的毛细血管之中。

●在政法系统,它辅助识别潜在的社会风险个体;

●在校园,它辅助构建学生心理健康的动态预警网络;

●在企业,它帮助我们分析组织氛围与安全生产的隐性关联。

在这个所有人都在用算力堆砌物理世界的时代,“洞见人和”人本世界模型的落地,绝不仅仅是为了让AI拥有更高的情商,而是为了完成一场深刻的技术普惠——

让机器在真正读懂人心的基础上,成为反哺整个社会运行的智能基座。 

它拥有全球领先的人物分析AI能力,实现了AI对于社会复杂系统本质规律的认知、推理和预测。它将感知世界与认知人类内心有机结合,全面构建起驱动决策与行动的AI能力基础设施,是全国首个通过国家双备案的心理大模型。 

让机器读懂人心,用 AI 成就美好社会,是这场范式迁越的终极使命。

为了让这项具有范式颠覆意义的技术红利真正反哺社会,连信数字将人本世界模型的核心能力及衍伸模型矩阵,悉数开放于 “连心云”能力平台。  

连心云能力开放平台以极度的开放性为纽带,向下深深扎进“洞见人和”人本世界模型的能力沃土,向上则如纵横交错的根系一般,紧密连接合作伙伴、业务场景,也连接着整个人本产业生态。

图片

连心云的开放,承载着连信数字对AGI下半场生产力形态的终极想象:

让理解人的能力,如同水、电、煤等大工业文明的日常资源一般无处不在,成为千行百业无论何时何地,都可以随时灵活调用的公共基础设施。

若要让理解人的能力成为如同水电煤一样的基础设施,不仅需要底层认知模型的范式进化,更需要无数深谙行业痛点、卡位核心场景的同路人,共同去完成这场生产力的终极合围。

连心云能力开放平台向全产业张开双臂,我们期待与每一位集成商、生态伙伴以及场景开创者并肩,去填补物理算法在现实世界留下的巨大盲区。

如果您也相信科技的终点是人,愿意在各自擅长的领域与我们共同切磋、质询,共建这套属于新时代的人本基础设施,我们静候您的同行。

3

工具理性之外:

一场关于“服务”与“威胁”的终极思辨

不久前,高德发布了全新 3D 原生城市世界模型。我们可以预见,关于“世界模型”的概念内卷与学术争议依旧不会有最终定论。世界模型依旧在物理、像素、时空轨道的赛道上狂飙。 

但无论科技如何演进,工具和科技最终都该服务于人。AI 之父辛顿(Geoffrey Hinton)在最新采访中再一次提到“AI 对人类生存的威胁”,这种担忧,恰恰映射出了目前纯物理、纯算力世界模型的冰冷与盲目。 

而连信数字与连心云在做的事,恰恰是对这种技术异化的温柔纠偏:

从政法系统到校园内外,从高危生产车间到每个普通人的深夜。它不抢夺人的资源,而是去感受人心、理解人心、反哺人心。 

科技卷到最后,终点一定是人。在 AGI 走向深水区的下半场,比起那些只能吐出稀奇古怪人机回答的冰冷机器,能读懂人类内心脆弱与坚韧的“人本世界模型”,显然更值得被这个时代关注。

引用来源:连心云微信公众号《世界模型打得头破血流,但AI还是不懂李飞飞的心》

ad