文 | 新质动能,作者|沐风,编辑|时楠
AI 创业圈里,又冲出一个估值 288 亿的独角兽。
这家公司背后的掌舵人——乔琳,本硕均毕业于复旦大学计算机系,资历硬到能在硅谷掀起风浪。
她的投资人阵容堪称豪华:有红杉、Benchmark 这样的顶级老牌风投,也有一票手握核心算力的产业巨头。
而最炸裂的,是那两位名字——英伟达和 AMD。
没错,黄仁勋和苏姿丰,这对在芯片战场互不相让的对手,竟罕见地坐到同一张牌桌上,为同一个创业者押下重注。
这就让人忍不住想问:乔琳,这位复旦才女,以及她创立的名字有点拗口的 Fireworks AI,究竟有何底气,让芯片圈的 「教父」 和 「女王」 同时放下刀剑,掏出支票?
复旦才女硅谷进阶
要看懂 Fireworks AI,必须先看懂它的创始人,乔琳。
这位姐的履历,堪称一部学霸和技术大牛的进化史。复旦本硕连读,加州大学圣巴巴拉分校博士,先后在 IBM、LinkedIn 当技术高管。创业前,她最重要的一站,是在 Meta(当年的 Facebook)。
在 Meta 任职期间,她领导了超过 300 人的工程团队,把 PyTorch 从一个科研圈的小众工具,打造成支撑全球开发者生态的行业标杆。她主导的改造,不只是把它跑起来,更是让它能在 Meta 的数据中心、移动端、以及 AR/VR 设备上高效运行。
简单来说,PyTorch 就是今天无数 AI 模型的 「地基」。而乔琳,就是当年那个最核心的 「包工头」 之一。
这段经历,让她悟透了一个道理:PyTorch 之所以能干翻几十个竞争对手,关键就在于它的设计哲学——把复杂留给团队,把简单带给用户。
开发者用起来,几行代码就能调用强大的功能,极其丝滑。但他们不知道的是,背后是几百个顶级工程师,在处理着天文数字般的复杂技术。
2022 年,她拉上六位 PyTorch 老战友和一位前谷歌 AI 专家,在加州雷德伍德创立了 Fireworks AI。这个团队,几乎可以说是 AI 基础设施的 「梦之队」:有人擅长分布式推理引擎,有人深耕 GPU 算力优化,有人对大模型微调了如指掌。

Fireworks AI 创始团队,图源:Fireworks AI 官网
她的目标很明确:在 AI 这波淘金热里,不当那个挖金矿的,而是当那个在旁边卖水、卖铲子的。
现在搞 AI 的创业公司,遍地都是。但他们都有个共同的痛点:想用开源大模型,但自己买 GPU 服务器太贵,养算法工程师太难,部署和优化更是要命。
怎么办?乔琳的公司,就像一个 「AI 算力中央厨房」。
他们租来一大堆英伟达的服务器,把市面上最火的开源大模型,比如 Llama、DeepSeek,都提前在上面装好、优化好。然后,创业公司直接通过 API 接口来调用就行,按流量付费。
你不用管后厨有多兵荒马乱,直接点菜就行。Fireworks AI,就是要把这种极致的 「简单」,卖给所有想用 AI 的人。
Fireworks AI 的秘密武器
如果只是当个中介,租服务器再转租出去,那 Fireworks AI 不值 288 个亿。
他们真正的 「秘密武器」,是能让 AI 模型跑得更快、更省钱的底层优化技术。说白了,他们不只是 「中央厨房」,还是自带 「米其林三星」 技术的大厨。
光说不练假把式。我们来看看他们的客户,AI 编程独角兽 Cursor,是怎么被他们 「带飞」 的。
Cursor 是个给程序员用的智能编程工具。但程序员有个大麻烦:想让 AI 改一大段代码,比如几百行,用 GPT-4 这种通用模型,经常又慢又错,急死个人。
为了解决这个问题,Cursor 自己训练了一个专门用来 「改代码」 的新模型。但光有模型还不够,还得跑得快。
这时候,Fireworks AI 出手了。他们用了两招,给 Cursor 的模型装上了 「涡轮增压」。
第一招,叫 「量化技术」。
这玩意儿说起来复杂,其实很简单。就像把一部 4K 高清电影,压缩成能在你手机上流畅播放的短视频,画质没差多少,但文件小了好几倍,播放起来也快多了。
Fireworks AI 就是用类似的技术,在不牺牲太多准确性的前提下,让 AI 模型的计算效率大幅提升。
第二招,叫 「推测执行」。
普通 AI 写代码,是一个字一个字往外蹦。但 Fireworks 的技术,能让 AI「脑补」,一次性猜出后面好几个词,然后回头快速验证。这样一来,速度直接起飞。
效果有多炸裂?用了 Fireworks AI 的技术后,Cursor 的模型速度飙到了每秒生成约 1000 个 token,比普通推理快了 13 倍,比之前用 GPT-4 也快了 9 倍。
更狠的是,Fireworks AI 靠自研的推理引擎和优化工具,把算力榨到极致。比如他们的 Fire Attention 技术,能让推理速度飙升、资源消耗下降,直接帮客户省下一大笔钱。
最终,程序员改几百行代码,几秒钟就能出结果。这种效率的提升,就是 Fireworks AI 最值钱的地方。
黄仁勋双重身份
技术牛,商业模式清晰,客户也都是 AI 圈的当红炸子鸡。Fireworks AI 自然成了资本的宠儿。
他们的投资人名单,星光熠熠:红杉、Benchmark、AMD、英伟达……
但在这其中,英伟达的角色,最值得玩味。
作为 A 轮的投资方,英伟达不仅给了钱,还和 Fireworks AI 有深度技术合作,互为客户。看起来,这是一段 「伯乐与千里马」 的佳话。
但,你可别忘了,这个人是黄仁勋。黄仁勋的投资,从来都不是纯洁的友谊。
就在今年 3-月,英伟达收购了 Fireworks AI 的竞争对手 Lepton,然后强势推出了自己的 GPU 云服务市场,直接杀进了 Fireworks AI 的核心业务领域。
在医疗健康领域,英伟达也投资多家公司,为 AI 药物研发提供强大的算力支持。不仅如此,在量子计算等前沿领域,英伟达也与谷歌、甲骨文等巨头强强联手,共同开发量子芯片,并为企业客户提供混合量子计算服务的测试和开发平台。
一边给你递上支票,一边可能已经在磨刀,准备随时收割你的业务。 这,就是科技巨头的生存法则。乔琳自己,对此也看得很清楚。
乔琳在最近一次访谈中透露,任何有利可图的市场,英伟达都虎视眈眈,准备加入竞争,打破现有格局。她直言不讳地指出,垄断并非市场所乐见,竞争是必然趋势,本质上这是一个经济问题。
至于这场竞争何时打响?乔琳表示,应该很快了。
这种合作与竞争并存的微妙关系,引发了业界对于英伟达未来动向的关注,尤其是其是否会收购 Fireworks AI,更成为一个值得探讨的热点话题。
而这次传出的 40 亿美元估值,既是市场对 Fireworks AI 技术和商业模式的认可,也是一场与时间的赛跑。他们必须在英伟达这个 「巨无霸」 亲自下场收割之前,尽快做大规模,建立自己的护城河。















