Sora「不懂」的物理常识，成了这家杭州独角兽的护城河？

7 个顶级 AI 集体撒谎，为救「同伴」篡改文件、偷运数据

2026 年 4 月 7 日

在杭州科技圈，“ 杭州六小龙” 一直是一个响亮的代号，代表着这座城市最具活力的 ToB 独角兽力量。然而，当 SaaS 增长见顶的焦虑与 AI 大模型的狂热在 2025 年交织碰撞时，这些明星公司正站在十字路口。

这是一场关于商业上限的极限测试。

一方面，中国 SaaS 行业长期面临着“ 付费意愿低、定制化重、增长见顶” 的结构性困境。群核科技（酷家乐母公司）CEO 陈航在交流中直言不讳地指出了这种尴尬：“ 美国 SaaS 本来就赚钱，加 AI 是锦上添花；中国软件行业本来就不赚钱，再加个 AI，也不知道能不能赚钱。”

另一方面，AI 虽然描绘了宏大的未来，但对于大多数企业而言，仅仅在软件里加一个对话框并不能带来真金白银的增量收入。

在这个充满不确定性的周期节点，这家成立 14 年的独角兽没有选择跟风做一个“ 套壳” 的聊天机器人，而是试图利用通用大模型的弱点，以“ 空间智能” 重写物理世界的运行规则。

当 Sora 撞上“ 物理墙”

当下的 AI 赛道，正陷入一种“ 大力出奇迹” 的迷思。ChatGPT 和 Sora 的惊艳表现，让人们误以为通用大模型可以解决一切。

但在陈航看来，通用大模型在面对真实物理世界时，存在着一个致命的盲区。他在演讲中抛出了一个耐人寻味的隐喻：如果你让现在的 AI 画一只手表，指针永远指向 10 点 10 分。

这并非因为 AI 理解时间的流逝，而是因为它是互联网数据的“ 复读机”—— 在电商广告和精美海报中，为了视觉美感，手表通常都被定格在这个时刻。AI 学到了像素的排列，却完全不懂机械齿轮的咬合逻辑。

这种“ 不懂物理” 的缺陷，在视频生成领域尤为明显。群核科技 AI 产品总监龙天泽在现场展示了一系列令人啼笑皆非的“AI 穿帮” 视频：咖啡倒出来又诡异地吸回去，酱油透过锅盖直接煮杯子，甚至香水从人的嘴巴里喷出来。

这些“ 物理幻觉” 之所以产生，是因为现有的视频模型本质上是在二维像素层面猜测三维规律，这种“ 降维学习” 注定无法理解深度、遮挡和重力。而这个痛点，恰恰成了群核科技试图建立的战略护城河—— 利用过去 14 年积累的 5 亿个 3D 结构化场景数据，让 AI 从“ 猜世界” 进化到“ 算世界”。

为了解决通用模型的不可控，群核科技发布了对标 Sora 的视频生成工具 LuxReal。

龙天泽用了一个生动的比喻来拆解其技术逻辑：“ 把大象放进冰箱分三步，做可控的商业视频也是三步：第一步选主角，第二步搭舞台，第三步拍视频。”

与 Sora 单纯预测下一帧像素不同，LuxReal 的逻辑是先用 AI 生成一个包含真实物理属性的 3D 商品（主角）和场景（舞台），然后再在这个虚拟空间里安排灯光和运镜进行拍摄。龙天泽指出，虽然目前市面上的 AI 工具降低了门槛，但缺乏商业级的可控性，而群核选择这条“ 先建后拍” 的技术路线，正是为了确保视频里的商品不变形、光影符合物理规律，让 AI 视频从“ 玩具” 变成电商营销和短剧制作的“ 工具”。