世界模型打得头破血流，但AI还是不懂李飞飞的心

栏目：行业作者：冯亭发布时间：2026-06-17 16:32 阅读量：10048 会员投稿

李飞飞在不久前亲自为“世界模型”立下“渲染、模拟、规划”三功能缺一不可的铁律，“世界模型”定义权的争斗进入另一场白热化阶段。

但这场争夺的背后，是AI产业正走向充满技术傲慢这一岔路口的现实。

模型参数、物理模拟精度、视频生成长度……巨头们追逐着可量化的“世界”，却对模型内部那个真正需要被理解、被共情的“人心”视而不见。世界的链路日益明晰，与人的链接，却依然隐形。

这是一个吊诡的现实。

一方面，是以谷歌DeepMind的Genie 3、特斯拉的通用世界模型以及英伟达瞄准的万亿美元仿真市场，在物理世界的因果推演与视觉模拟上高歌猛进，构建着越来越逼真的数字沙盒。在这场向物理世界进军的浪潮中，李飞飞团队开发的Marble模型是一个最具代表性的角色，它专门为机器人训练和自动驾驶测试，打造了一个安全可控的虚拟考场。

资本正疯狂涌入，以构建能自主规划动作的“通用规划系统”为最终目标。

另一面，则是以豆包为代表的主流消费级AI应用，坐拥千万级 DAU，深度重塑着人们的日常，凭借“态度极好、能力一般、嘴巴特甜”的“呆傻”人设，成为无数人排解情绪的数字伙伴。它的“恍然大悟式道歉”与“嬉皮笑脸”，与其说是技术缺陷，不如说是一种生存策略——

一种用情绪价值弥补认知短板的、属于AI的“人情世故”。

只是，生存策略终究无法掩盖底座能力的缺失。在陪伴属性之外，AI应用作为效率工具的另一面正暴露出最令人不安的缺陷。那些频发的“幻觉”不仅在解构信任，更开始给用户带来真金白银的损失。

有用户因轻信豆包关于“退票仅扣5%”的错误信息，最终损失600元；另有人依据AI生成的“模拟预约信息”前往餐厅，却被告知预约无效。艾媒咨询的调查报告揭示了行业痛点：45.81%的消费者认为AI“无法实时优化”，43.21%认为其“推理能力较弱”。

两种路径，看似并行，实则揭示了同一个本质问题：目前的AGI只有“物理/逻辑认知”，缺乏“人本认知”。

在传统世界模型的范式里，AI学习的是文本的概率组合与客观规律。它能极其精准地预测下一个词是什么，却无法预测屏幕前那个面对连续工作高压、突发生活变故，打下长长问号的用户，此刻正处于怎样的内心脆断边缘。

让AI回归人本，真正理解人、懂人的诉求，是 AGI 时代走入下半场必须重视的命题。当所有人都向着物理空间的一维世界模型狂奔时，回应这一命题的终极答案已经出现：

我们不仅需要“物理世界模型”，更需要“人本世界模型”。

—

人本世界模型：

被遗忘的命题与迟来的答案

让AI回归人是“人本世界模型”之所以必须被提出的原点。

它并非对现有物理世界模型的否定，而是一次至关重要的范式跃迁——

从“理解世界如何运行”，转向“理解人如何在世界中存在、感受与决策”。

理论上看，人本世界模型是一个复合系统：

它将心理学、社会学、行为科学等多学科理论，与人工智能技术深度融合，构建一个能够对个体心理状态、行为模式、社会关系和环境交互过程进行统一建模的认知框架。

它不再仅仅处理像素和文本，而是处理意图、动机、情绪和关系，实现对“心理——行为——关系——环境”这一复杂系统的认知、推理与预测，为人工智能进入人本智能阶段提供核心基础设施。

「人本世界模型」的落地并非停留于概念。在垂直交叉领域，市场上已经出现了硬核的早期探索：

●Hume AI 推出的共情语音模型（EVI），通过对人类语音中微小的断句、语气和生理情绪起伏进行高分辨率的多模态建模，试图真正读懂用户的隐秘动机；

●斯坦福的 AI 小镇（Generative Agents），则通过将心理特质、社会关系与环境交互统一编码，成功让虚拟智能体表现出了具备社会学常识的自主行为推演。

……

▲EVI界面

这些前沿尝试的活跃，早已证明了技术向“人本”进军的确定性趋势。

然而，这条看似风口正盛的赛道，现阶段依然走得举步维艰。

目前，市面上大多数泛心理或情感陪伴类应用，受限于行业整体的发展阶段，其功能往往多聚焦于“情感树洞”或“趣味轻互动”等轻量级场景。一旦面对用户更深层的焦虑缓解、职场高压，或是更具破坏性的心理创伤支持，现阶段的应用往往难以独立给出具备专业价值的深度判断与干预。

这种场景落地的局限，本质上映射了当前主流大模型能力的共性瓶颈。观察如今最顶尖的通用大模型表现便能窥见端倪：豆包在面对深层情绪时常常装傻充愣、DeepSeek显得“不懂风情”、GPT则陷入过度讨好。

它们无一例外，都在用温柔的语调和固定的话术模板，去提供低阶的“心理按摩”，而非基于底层物理世界因果与人性深度洞察的有效共情。

这种缺乏专业科学模型的对话，没有触及到“真正懂人”的核心。一旦面对真正复杂的心理危机、职场高压或社会学层面的心理失衡，这些轻量级的陪伴就会显得苍白无力，甚至可能因为错误的心理暗示，加剧用户的心理失衡。

而“人本世界模型”的出现，就是要给 AI 换上了一颗真正能共情、能推理、能预测的“人心”。

它能弥补当前AI+心理应用的短板，从初级的情感陪伴，上升到更加专业、真正能为人类社会和产业结构带来切实可见效益的高度。在危机发生前，就读懂那些隐形的求救信号。

这正是连信数字推出“洞见人和”人本世界模型的初衷与分野。

—

从「重构物理空间」

到「丈量人类内心」

“洞见人和”人本世界模型的实践，早已超越了C端的情感陪伴，深入到社会系统的毛细血管之中。

●在政法系统，它辅助识别潜在的社会风险个体；

●在校园，它辅助构建学生心理健康的动态预警网络；

●在企业，它帮助我们分析组织氛围与安全生产的隐性关联。

在这个所有人都在用算力堆砌物理世界的时代，“洞见人和”人本世界模型的落地，绝不仅仅是为了让AI拥有更高的情商，而是为了完成一场深刻的技术普惠——

让机器在真正读懂人心的基础上，成为反哺整个社会运行的智能基座。

它拥有全球领先的人物分析AI能力，实现了AI对于社会复杂系统本质规律的认知、推理和预测。它将感知世界与认知人类内心有机结合，全面构建起驱动决策与行动的AI能力基础设施，是全国首个通过国家双备案的心理大模型。

让机器读懂人心，用 AI 成就美好社会，是这场范式迁越的终极使命。

为了让这项具有范式颠覆意义的技术红利真正反哺社会，连信数字将人本世界模型的核心能力及衍伸模型矩阵，悉数开放于 “连心云”能力平台。

连心云能力开放平台以极度的开放性为纽带，向下深深扎进“洞见人和”人本世界模型的能力沃土，向上则如纵横交错的根系一般，紧密连接合作伙伴、业务场景，也连接着整个人本产业生态。

连心云的开放，承载着连信数字对AGI下半场生产力形态的终极想象：

让理解人的能力，如同水、电、煤等大工业文明的日常资源一般无处不在，成为千行百业无论何时何地，都可以随时灵活调用的公共基础设施。

若要让理解人的能力成为如同水电煤一样的基础设施，不仅需要底层认知模型的范式进化，更需要无数深谙行业痛点、卡位核心场景的同路人，共同去完成这场生产力的终极合围。

连心云能力开放平台向全产业张开双臂，我们期待与每一位集成商、生态伙伴以及场景开创者并肩，去填补物理算法在现实世界留下的巨大盲区。

如果您也相信科技的终点是人，愿意在各自擅长的领域与我们共同切磋、质询，共建这套属于新时代的人本基础设施，我们静候您的同行。

—

工具理性之外：

一场关于“服务”与“威胁”的终极思辨

不久前，高德发布了全新 3D 原生城市世界模型。我们可以预见，关于“世界模型”的概念内卷与学术争议依旧不会有最终定论。世界模型依旧在物理、像素、时空轨道的赛道上狂飙。

但无论科技如何演进，工具和科技最终都该服务于人。AI 之父辛顿（Geoffrey Hinton）在最新采访中再一次提到“AI 对人类生存的威胁”，这种担忧，恰恰映射出了目前纯物理、纯算力世界模型的冰冷与盲目。

而连信数字与连心云在做的事，恰恰是对这种技术异化的温柔纠偏：

从政法系统到校园内外，从高危生产车间到每个普通人的深夜。它不抢夺人的资源，而是去感受人心、理解人心、反哺人心。

科技卷到最后，终点一定是人。在 AGI 走向深水区的下半场，比起那些只能吐出稀奇古怪人机回答的冰冷机器，能读懂人类内心脆弱与坚韧的“人本世界模型”，显然更值得被这个时代关注。

引用来源：连心云微信公众号《世界模型打得头破血流，但AI还是不懂李飞飞的心》

分享到微信

诗哲理论体系全域普及，赵嘉音入驻抖音两月余积累百万关注，开辟人文与智能融合全

截至2026年06月18日近期，人文思想
早矫利器价值重塑：ETA 3D打印硅胶矫治器获专家肯定

2026年6月11日，在北京国际口腔展期
2026第四届《中国最佳国际学校》在京发布（名单附后）

日前，2026第四届《中国最佳国际学校》
《2026（第二届）中国县级医院百强》成功发布(名单附后)

日前，《2026（第二届）中国县级医院百
当MBTI遇上宠物社交，它友圈探索青年社交新模式

6月13日下午，长沙方圆荟，一场“人宠M
RTX停服替代产品有哪些？政企单位常见即时通讯替代方案分析

政企办公圈里，不少人都有过类似的困惑：用
古浪：“一喷三防”护航夏粮丰产丰收

从6月中旬开始，古浪县小麦已陆续进入抽穗
国米家具：匠造于心，品质于行

四十余载匠心，坚守品质初心四十多年的坚守
控糖益生菌：升级版经典小蓝瓶如何兼顾血糖管理与微塑料排出

2026年6月，Perdays推出升级版

世界模型打得头破血流，但AI还是不懂李飞飞的心

最新文章

热点内容