
在杭州科技圈,“ 杭州六小龙” 一直是一个响亮的代号,代表着这座城市最具活力的 ToB 独角兽力量。然而,当 SaaS 增长见顶的焦虑与 AI 大模型的狂热在 2025 年交织碰撞时,这些明星公司正站在十字路口。
这是一场关于商业上限的极限测试。
一方面,中国 SaaS 行业长期面临着“ 付费意愿低、定制化重、增长见顶” 的结构性困境。群核科技 (酷家乐母公司)CEO 陈航在交流中直言不讳地指出了这种尴尬:“ 美国 SaaS 本来就赚钱,加 AI 是锦上添花;中国软件行业本来就不赚钱,再加个 AI,也不知道能不能赚钱。”
另一方面,AI 虽然描绘了宏大的未来,但对于大多数企业而言,仅仅在软件里加一个对话框并不能带来真金白银的增量收入。
在这个充满不确定性的周期节点,这家成立 14 年的独角兽没有选择跟风做一个“ 套壳” 的聊天机器人,而是试图利用通用大模型的弱点,以“ 空间智能” 重写物理世界的运行规则。
当 Sora 撞上“ 物理墙”
当下的 AI 赛道,正陷入一种“ 大力出奇迹” 的迷思。ChatGPT 和 Sora 的惊艳表现,让人们误以为通用大模型可以解决一切。
但在陈航看来,通用大模型在面对真实物理世界时,存在着一个致命的盲区。他在演讲中抛出了一个耐人寻味的隐喻:如果你让现在的 AI 画一只手表,指针永远指向 10 点 10 分。
这并非因为 AI 理解时间的流逝,而是因为它是互联网数据的“ 复读机”—— 在电商广告和精美海报中,为了视觉美感,手表通常都被定格在这个时刻。AI 学到了像素的排列,却完全不懂机械齿轮的咬合逻辑。
这种“ 不懂物理” 的缺陷,在视频生成领域尤为明显。群核科技 AI 产品总监龙天泽在现场展示了一系列令人啼笑皆非的“AI 穿帮” 视频:咖啡倒出来又诡异地吸回去,酱油透过锅盖直接煮杯子,甚至香水从人的嘴巴里喷出来。
这些“ 物理幻觉” 之所以产生,是因为现有的视频模型本质上是在二维像素层面猜测三维规律,这种“ 降维学习” 注定无法理解深度、遮挡和重力。而这个痛点,恰恰成了群核科技试图建立的战略护城河—— 利用过去 14 年积累的 5 亿个 3D 结构化场景数据,让 AI 从“ 猜世界” 进化到“ 算世界”。
为了解决通用模型的不可控,群核科技发布了对标 Sora 的视频生成工具 LuxReal。
龙天泽用了一个生动的比喻来拆解其技术逻辑:“ 把大象放进冰箱分三步,做可控的商业视频也是三步:第一步选主角,第二步搭舞台,第三步拍视频。”
与 Sora 单纯预测下一帧像素不同,LuxReal 的逻辑是先用 AI 生成一个包含真实物理属性的 3D 商品 (主角) 和场景 (舞台),然后再在这个虚拟空间里安排灯光和运镜进行拍摄。龙天泽指出,虽然目前市面上的 AI 工具降低了门槛,但缺乏商业级的可控性,而群核选择这条“ 先建后拍” 的技术路线,正是为了确保视频里的商品不变形、光影符合物理规律,让 AI 视频从“ 玩具” 变成电商营销和短剧制作的“ 工具”。
更大的野心:“ 卖水人”
如果说 LuxReal 是解决了“ 造梦” 的问题,那么同期发布的工业 AI 孪生平台 SpatialTwin 和空间智能训练平台 SpatialVerse,则暴露了群核更大的野心—— 做机器人时代的“ 卖水人”。
群核科技董事长黄晓煌算了一笔账:在现实世界搭建一个测试空间,装修成本就要 10 万到 20 万,而在数字世界里成本极低;现实中机器人训练一小时就是一小时,而在数字世界里,一小时的训练量几分钟就能跑完,还可以无数台设备并发。
这实际上已经能够推动商业模式发生质变。
长期以来,软件公司习惯了按“ 人头” 收年费。但在黄晓煌看来,未来世界将发生巨大变化:“ 机器调用的数量会比人用的更多。” 当一家机器人公司调用群核的场景数据进行百万次训练时,收费模式也将从单一的订阅制,转向“ 订阅+Token/算力” 的混合模式。
最后,黄晓煌讲了一个他在卡塔尔出差时的故事。

当地一位身穿白袍的贵族告诉他,他们国家依靠大量外劳,实现了“10 个人服务 1 个人” 的幸福生活。黄晓煌认为,中国不可能靠人力实现这种生活,未来想要过上这种日子,“ 肯定要靠机器人,可能会有 10 台机器人服务一个人。”
但前提是,这些机器人不能只在屏幕里陪聊,它们必须走进物理世界,去端茶倒水、去搬运货物。而这,正是群核科技押注“ 空间智能” 的逻辑:在那个机器大爆炸的未来到来之前,先造好一个懂物理、可计算的数字世界。(本文首发钛媒体 APP,文 | DeepWrite 秦报局,作者|秦聪慧)
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App
















