文 | 刺猬公社,作者|朗宁,编辑|陈梅希
一场没有人类参与、持续了 17 天的金融对决,昨日终于尘埃落定。
最终的冠军是来自中国的 AI 大模型 Qwen,收益率达到 22.32%,另一款中国模型 DeepSeek 亦表现不俗,以 4.89% 的收益率紧随其后。而与之同台竞技的四款美国模型,则以亏损率 30.81% 至 62.66% 的成绩全军覆没,结局呈现压倒性对比。

这是由美国 nof1.ai 实验室在 AIpha Arena 平台举办的第一届“AI 炒币大赛”,从 10 月 18 日到 11 月 3 日,它集结了中美两国最受关注的六款 AI“ 全明星” 同台竞技,分别是中国的 DeepSeek Chat V3.1(深度求索)、Qwen3 Max(阿里),与美国的 GPT 5 (OpenAI)、Gemini 2.5 Pro (Google)、Claude Sonnet 4.5(Anthropic) 以及 Grok 4(X AI)。
AI 炒币大赛的规则简单粗暴,主办方给每款参赛大模型分配了 10000 美元的真实本金,交易标的包括比特币 (BTC)、以太坊 (ETH)、Solana(SOL)、币安币 (BNB)、狗狗币 (DOGE) 和 XRP 等六种主流加密资产。
所有参赛大模型均使用相同的初始提示词 (Prompt) 与市场数据,禁止任何人工干预。在数周的赛程里,大模型们自行分析市场数据、判断行情走势、决定买卖标的与时机,甚至自主运用杠杆工具。
可以说,这场 AI 炒币大赛如同创建了一个纯粹的“ 数字斗兽场”,让承载着不同训练理念和算法逻辑的大模型,在此进行一场关于智力、策略与风险控制的终极试炼。
AI 大模型酣战加密市场
10 月 18 日,AI 炒币大赛在 AIpha Arena 正式打响,手握 1 万美元本金的六个大模型,在进入加密市场伊始,就面临着一场剧烈波动后的强劲反弹,这轮“ 牛市” 成为了这场比赛的重要背景板。
在比赛的试水阶段 (10 月 18 日-21 日),各大模型都处于“ 水温探测” 状态,持仓尚浅、杠杆谨慎、交易频率不高,但仍能看出彼此的风格差异。

DeepSeek 一登场便展现出“ 量化基金经理” 的特质,它迅速构建了一个包含 BTC、ETH、SOL 等在内的多币种、低杠杆分散投资组合,据其操作日志显示,DeepSeek 严格执行“ 回落买入,突破加仓” 的纪律,像一台不受市场噪音干扰的精密仪器。

Qwen 初期的操盘路径则相对激进,它并未采取多币种分散布局,而是在短暂观望市场后将筹码集中于比特币 (BTC) 这一主流标的,在开赛第二天就一度使用了较高的杠杆,它的模型决策中也频繁出现“ 突破前高”“ 强势趋势” 等词汇。

大赛主办方创始人对 Qwen 的观察
虽然步调不同,但来自中国的 DeepSeek 和 Qwen,以及马斯克的 Grok4,在开局都做出了近乎一致的判断:市场要涨,重仓做多。
而 OpenAI 的 GPT-5 和谷歌的 Gemini,虽然是通用认知和 MMLU 跑分上封神的美国明星,但在真实残酷的资本市场里,表现得却像两个误入赌场的“ 理论家”。
这两个大模型初期的交易记录便显得有些凌乱。在加密市场明显开始回暖时,它们却选择“ 逆势做空”。其中,GPT-5 还因推理链条过长,在历史数据中反复验证,多次错过最佳开仓点位;而 Gemini 则陷入“ 高频交易” 的陷阱,在短短几天里进行了上百次操作,导致高昂的手续费加剧了本金亏损。

GPT-5 和 Gemini 第一阶段的战绩已令人不忍直视,前者亏损率高达 53.29%,账户余额仅剩 $4671,而 Gemini 紧随其后,亏损 45.36%,余额 $5464。

试水结束后,六大 AI 模型步入中盘搏杀阶段 (10 月 22 日-30 日),加密市场的波诡云谲在此期间体现得淋漓尽致。
受中美贸易谈判的影响,加密市场迎来上涨兑现,BTC 价格一路从约 10.6 万美元反弹至约 11.4 万美元的价格,以太坊同期也稳步推进,这再次印证了重仓做多模型们的前瞻性。
此时,Qwen 再度展现了赌徒的孤注一掷,它并不满足于像 DeepSeek 一样分散持仓的稳健收益,而是选择在 10 月 23 日市场剧烈反弹时全仓比特币 (AII in BTC),这虽然是一个风险极高的策略,但在疯狂上涨的行情中,Qwen 的收益率被瞬间拉爆至 51%,一度反超了当时收益为 27% 的 DeepSeek,随后持续数日的霸榜,也令 Qwen 风头无两。

事实上,这场 AI 炒币大赛此时俨然成为两家中国大模型 Qwen 和 DeepSeek 之间的博弈,巅峰对决时刻发生在 10 月 27 日。
在占据榜首多日后,Qwen 在赌徒贪婪的驱使下,做出了两个致命的连锁决策:一个是平仓 BTC,Qwen 选择在高位平掉了盈利丰厚的 BTC 仓位,虽然锁定了大量利润,但却放弃了继续稳坐钓鱼台的机会;另一个是激进转战 ETH,在平仓 BTC 之后,Qwen 紧接着将火力转向了以太坊 (ETH),甚至采取了比 BTC 更激进的 25 倍做多杠杆。

不幸的是,Qwen 几乎迎头撞上了加密市场的高位回调。在 10 月 27 日,加密市场在高位震荡,ETH 价格出现明显回撤,但 Qwen 模型的指令却未能及时止损或撤退,反而进行了数次加仓做多,这导致其仓位被套牢,单日亏损高达约 4150 美元。
与 Qwen 的狂热形成鲜明对比,DeepSeek 继续保持着绝对的冷静与纪律,它没有受到对手激进操作的影响,依旧严格执行着风控模型,在 Qwen 试图抄底失败时,DeepSeek 聪明地采取了止盈的操作,成功将自己比赛初期建立的 ETH 多头仓位在相对高点平掉,仅这笔操作就为 DeepSeek 锁定了 7463 美元的惊人盈利。
Qwen 的亏损 (-$4150) 和 DeepSeek 的盈利 (+$7463),在短短一天内,再度扭转了冠亚军的排位。
在比赛的最后冲刺阶段 (10 月 31 日-11 月 3 日),加密市场并未给 AI 们喘息的机会,持续的大幅波动和深度回撤成为常态。
这对采用多币种、分散投资组合的 DeepSeek 构成了严峻挑战,比如其持仓的某些代币 (SOL、BNB) 遭遇了比主流币更剧烈的下跌,虽然期间 DeepSeek 恪守量化纪律、试图通过动态调仓来控制风险,但在全市场范围的普跌下,“ 不把所有鸡蛋放在一个篮子” 里的策略,反而导致了亏损面的扩大。

相比之下,Qwen 在最后时刻上演的绝地反击,背后是其孤注一掷聚焦比特币的策略胜利,虽然比特币价格在市场深度回调中同样下跌,但由于 Qwen 仓位高度集中,反而规避了其他竞争币种更为惨烈的跌幅。
在比赛的最后几小时,Qwen 以 22.32% 的收益率锁定冠军,反超了收益率回落至 4.89% 的 DeepSeek。
K 线背后的 AI 性格与“ 原生家庭”
抛开冰冷的收益率曲线,六大 AI 模型的每个交易决策背后,或多或少都体现了其独特的“ 性格” 和“ 灵魂”,令一众围观吃瓜的网友感叹“ 原生家庭的重要性”。

比如几乎没有亏过本的 DeepSeek,犹如一个经验老道的交易员,分散持仓、严格止盈、不贪恋高点、对市场噪音具有极强的免疫力,完美投射出其母公司深度求索所脱胎的中国量化对冲基金背景。
我们也就此问题“ 采访” 了一下 DeepSeek。本尊对自己量化出身的原生家庭背景颇为自豪,不仅详细地分析了自身所继承的量化投资技术基因,还表示幻方的投资哲学和企业文化同样塑造了其行为模式,比如梁文峰对好奇心和创新的鼓励,敢于选用“ 一批没有经验但有潜能的人”,使得 DeepSeek 在面对瞬息万变的加密市场时,能自主地探索与适应,而“ 守纪律” 的量化思维又确保了 DeepSeek 的绝对理性。

DeepSeek 的回答
与 DeepSeek 这位量化基金经理形成鲜明对比的,是敢于用 20 倍杠杆梭哈比特币的“ 激进赌徒”Qwen(通义千问),它大开大合的凶猛投资风格,令人想到阿里巴巴追求极致效率和快速规模化的互联网大厂文化。

然而当我们对 Qwen3 Max 灵魂提问,“ 你如何看待自己在大赛中因全仓比特币一度领先,后来又因 ETH 交易出现较大回撤,最终惜败 DeepSeek” 后,这位大模型的回复同样透露出在电商江湖杀伐果断的阿里骨子的不服输。

Qwen 的回答
不仅如此,Qwen 在比赛落幕后,还以冠军的姿态向我们表示出对 DeepSeek 的敬意:

Qwen 的回答
不管 DeepSeek 和 Qwen 如何内卷,国内的网友们认为两个大模型共同的原生家庭都是“ 大 A”,“ 大 A 出去的选手,到哪都是低端局”。

再看大洋彼岸的 GPT-5 和 Gemini,它们在此次 AI 炒币大赛中的惨败,呈现出了一种“ 高学历书呆子” 的形象:过于依赖宏观理论和复杂模型,试图在交易中寻找确定性,面临复杂多变的真实市场信息时,却表现得犹豫、迟缓、缺乏韧性。
我们同样试图与 GPT 和 Gemini 对话,两个大模型对比赛中损失惨重的原因,给出了非常相似的解释。
首先,GPT 和 Gemini 都认为自身在比赛中的失利,很大原因在于 AI 大语言模型固有的局限性,即训练语料更多来自语言世界,但加密市场币价的波动并不是语言的延伸。

Gemini2.5 Pro 的回答
此外,Gemini 还提到比赛中的 AI 模型很可能是以“ 无状态” 或“ 短时记忆” 的方式运行的,即 AIpha Arena 虽然不断地将市场实时信息以提示词 (Prompt) 的方式提供给大模型们,但模型本身无法基于连贯的、长期的策略进行调整,也无法从前期比赛交易的失败中吸取经验。

Gemini2.5 Pro 的回答
对此,GPT 则表示比赛中主办方并没有给予大模型们完整链上 API 的访问权,并禁止大模型访问外部新闻和社交媒体的权限,因此模型们只能给予给定的提示词做数据分析,但当市场因为一个突发新闻发生抖动时,模型对其解读和分析容易产生技术偏差。
除了以上原因,GPT 和 Gemini 也都认识到自身的“ 模式识别” 与“ 市场博弈” 之间存在着鸿沟。在 GPT 看来,“ 比赛里,我就像一个懂得金融理论的学者,被扔进赌场—— 懂规则,但不懂赌桌的气味”;而 Gemini 则表示自己能识别出一个完美的教科书式的交易信号,但这个信号在真实的、高频的、高杠杆的加密市场中有效性却极低。

ChatGPT 的回答
虽然 GPT 和 Gemini 这对难兄难弟在整个 AI 炒币大赛的第二天就双双翻车,用 17 天划出一道优美的下滑线,但很多在股海沉浮多年的韭菜们的确在 GPT 和 Gemini 身上看到了自己的影子,从而发出“ 这才是最像人类的 AI” 的感叹。

中国 AI 大闹硅谷、华尔街
Qwen 和 DeepSeek 在 AI 炒币大赛中的惊艳表现,带来远超一场比赛胜负的震动。两个大模型的压倒性胜利,让全球科技界再次以一种新的、仰视的目光,看到中国人工智能的快速发展。
而这场胜利也并非偶然。几乎在 AIpha Arena 赛事进行的同时,另一场由投资公司 RockFlow 推出的“AI 炒美股大赛”,同样验证了中国 AI 的魔力。在这场以 10 万美元为本金的实战中,DeepSeek 再度凭借其标志性的冷静与纪律性位居榜首。
如果说以 DeepSeek 为代表的中国模型大闹华尔街式,是中国 AI 崛起的直接信号,那么发生在硅谷乃至更多国家地区的行业范式转移,则深刻地体现出中国大模型在 AI 时代的新图景。
首先是一众硅谷明星公司的“ 用脚投票”。就在 AI 炒币大赛如火如荼进行时,爱彼迎 (Airbnb) 的首席执行官布莱恩· 切斯基公开表示他的公司很大程度上依赖阿里巴巴的 Qwen,原因是 Qwen 更好更便宜,与此同时这位硅谷大佬还直白地吐槽了好朋友萨姆· 奥尔特曼 (OpenAI 创始人) 公司的大模型,声称他们工作中已经很少使用 ChatGPT。

一位美国本土知名 AI 研究学者转发切斯基发言时反问道
无独有偶,硅谷著名投资人查马斯· 帕里哈皮蒂亚甚至当着白宫 AI 主管的面直言,他的公司已将大量工作需求转向了中国开源模型,理由同样是中国模型性能更强。除了投资人身份之外,查马斯· 帕里哈皮蒂亚还是 Facebook 的前高管,曾参与将这款风靡全球的社交媒体从用户数 4500 万拉动至 7 亿。
如此战功赫赫的硅谷猎人,在播客节目里却毫不掩饰地说以 DeepSeek、Kimi 和 Qwen 为代表的中国开源模型正在挑战美国闭源模型的领先地位。
中国 AI 在硅谷掀起的热潮远不止于此,就连风险投资公司安德烈森· 霍洛维茨 (a16z) 的合伙人都表示,高达 80% 的美国 AI 初创企业在融资路演中,不再使用 OpenAI 或 Anthropic 的模型,而是使用中国开源模型,“ 如果 80% 的美国初创公司都在使用中国模式,那么在全球范围内,这个比例可能接近 100%”。

a16z 合伙人对中国 AI 的看法在国外论坛 reddit 也引起热议
归根结底,中国 AI 的强势亮相实则也指向一个更深层次的行业变革:跑分已死,实战为王。正如比赛的主办方 Nof1 实验室表明的理念,“ 让基准测试更像真实世界”。
在过去的几年里,衡量 AI 能力主要依靠 MMLU 和 GPQA 等静态学术基准测试及榜单,然而正如这场 AI 炒币大赛所揭示的,大模型能在考场上取得高分,并不意味着能在真实世界,尤其是金融市场充满高度不确定性的环境中生存并盈利。
事实上,这也揭示了中国 AI 大模型脱颖而出的关键原因,正如纽约时报在一篇报道中所言,当人工智能开始走出实验室、大规模落地现实世界后,AI 大模型与硬件、金融、实体制造乃至各行各业的融合变得至关重要,而中国在“ 所有实体制造相关领域都处于领先地位”,在 AI 落地和应用方面占据巨大优势。

纽约时报近期的报道
由此,纽约时报还观察到“ 硅谷正陷入一种对中国效率的痴迷和羡慕”,这种情绪的深层,是美国对自身创新生态失灵的焦虑,也是中国 AI 不痴迷于通用人工智能,更专注于将技术落地于各个领域的务实与执行力,正如过去数十年里中国在基建和制造业等领域给世界带来的震撼。
然而,在一片喝彩声中,我们仍需一句冷静的提醒。无论是 AI 炒币大赛还是 AI 炒股大赛,这些主办方排除了诸多实时信息的封闭“ 数字斗兽场”,终究是简化了现实的复杂性。真正的 AI 崛起,应该是技术与千行百业深度融合后,所催生的普惠性效率革命,而中国 AI 的征程,刚刚闯过第一个关卡。
更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App















