
图片由 AI 生成
在历经“ 卷” 价格争议、DeepSeek 冲击波、Agent 元年、端侧 AI 爆发后,豆包大模型又迎来了一次重要更新。
12 月 18 日,火山引擎正式发布豆包大模型 1.8 及音视频创作模型 Seedance 1.5 pro。
据火山引擎总裁谭待介绍,截至今年 12 月,豆包大模型日均 token 使用量突破 50 万亿,较去年同期增长超过 10 倍;目前已有超过 100 家企业客户累计 token 使用量超过一万亿。
火山引擎称,权威评测数据显示,最新版大模型在 Agent 能力、多模态理解等方面已跻身全球第一梯队。
针对日益增长的视频创作需求,火山引擎推出了 Seedance 1.5 pro 音视频创作模型。据其介绍,该模型具备影视级的叙事张力,能够精准捕捉运动细节并细腻呈现人物情绪,更在音画同步技术上取得了突破性进展。
目前,个人用户已可在豆包、即梦 AI 等平台体验该模型;企业用户则可通过火山引擎 API 接入 Seedance 1.5 pro 模型服务。
多模态能力增强,Agent 进入“ 真干活” 阶段
尽管多模态大模型需求旺盛,但行业仍处于早期,技术限制尚未完全突破,谭待也在会后的媒体采访中表示,需保持耐心,模型会持续进化并逐步解锁新领域,这是模型成为“ 复杂智能体” 的必经之路。
“Agent 能力” 则是这场发布的重头戏,几乎贯穿了这次豆包大模型的发布全程。
在谭待看来,多模态意味着模型开始真正进入复杂应用场景,特别是企业场景,这是 Agent 成立的前提条件。
作为豆包家族的最新旗舰模型,豆包大模型 1.8(Doubao-Seed-1.8) 面向多模态 Agent 场景进行了定向优化。
豆包 1.8 在 Agent 方面的“ 工具调用” 能力进步显著,可一次性调用 20 多个工具,完成跨平台比价、OA 审批、数据填报等长链条任务,平均规划步骤降低 37%,执行成功率提升 21%。
另外,最新的豆包大模型在复杂指令遵循能力和 OS Agent 能力都实现了大幅增强。
在多模态理解方面,豆包 1.8 大幅提升了视觉理解的基础能力,可以低帧率理解超长视频;在视频运动理解、复杂空间理解、文档结构化解析能力上也都有所提升。
豆包 1.8 还原生支持智能上下文管理。用户可以配置上下文策略,当任务轮次过长时,模型会根据策略智能清除低价值的历史工具调用信息,确保多步骤任务稳定完成。
在火山引擎公布的 Agent 能力公开测评中,豆包 1.8 在数学、推理、复杂指令遵循、通用体智能、智能体编程等多项测试上都与 GPT-5High、Gemini 3 Pro、Cloude Sonnet 4.5 等全球领先的大模型在同一水平线上。
其中,在通用体智能 BrowseComp-en 方面,豆包 1.8 得到 67.6 分,不仅较上一代豆包 1.6 的 16.7 分大幅提升,也高于其他大模型。

图片来自火山引擎官方
Agent 规模化爆发后,需要新运营和管理系统
自去年起,AI 产业一度迷茫于找不到除了聊天机器人外的能提供实际价值的应用场景,呼唤“Agent 时代” 的声音愈发高涨。
在谭待看来,从中国的视角出发观察,“ 今年算是 Agent 元年,明年肯定还会继续爆发”。他还提到,目前 AI 帮助人们去做 PPT 甚至短剧、漫剧的尝试已经非常多,只是品质还不够,预计明年品质会很快得到提升。
在 Agent 的行业应用与客户拓展上,谭待发现,互联网、零售、汽车、教育等领域进展较快,而传统行业起步慢但天花板高。企业客户消耗大部分 token,但个人用户数量占主导。
“Agent 不只是开发问题,而是一个需要长期运营和管理的新系统。” 谭待表示,而目前来说,最大的挑战不是模型能力,而是 Agent 的开发和迭代速度远远跟不上模型能力的提升。
实际上,在今年的大模型竞赛中,尤其是年底阶段,Agent 能力已是重中之重,“ 从会聊天到会干活”“ 有高智商也要有高情商” 的特质,愈发受到关注。
各大主流玩家中,Anthropic 的 Cloude 不断打磨精进着编程能力,已成为实际场景应用的典型案例之一。11 月,谷歌重磅发布的 Gemini 3 也在实用性、性价比方面大受好评。
年初引发全球追逐的 DeepSeek,在 12 月初最新发布的 DeepSeek-V3.2 中,着重强调了其在通用 Agent 任务中的表现,其更新的 API 还首次支持了在思考模式下使用工具调用能力,大大提升了用户获取到的答案的丰富度和适用性。
上周,OpenAI 在公司十周年之际发布的“ 翻身之作”GPT-5.2,虽然从反馈来说褒贬不一,但其聚焦实际应用场景、专业用途,着力于凸显“ 经济价值” 的方向仍然引发关注,一度获封“ 最强打工人”,从这家最初推动大模型浪潮的公司押注的方向,也能看出产业的风向所在。
“ 大模型最大的价值肯定不只是帮人写打油诗,合成一些照片。它最大的价值还是在教育、医疗、科研等方面,更好地帮助人成长,这也是大家对 AI 最大的期许。” 谭待对媒体表示。
Agent 即将爆发已经是行业共识,谭待关心的是,后续 Agent 的管理问题。
火山引擎总裁谭待,图片来自火山引擎官方
他称,2024 年,一个企业可能有 50 多个 Agent,2025 年增加到 200 多个,明年肯定会更多,这就需要提高管理、运营尤其是协同的能力。他也表示,助力企业管理好 Agent 也是火山引擎相关产品的关注和发力重点。
火山引擎已升级了企业级 AI Agent 平台 AgentKit,覆盖了 Agent 从开发、部署到管控的生命周期,解决企业在 Agent 落地中面临的身份权限管理、模型确定性及系统集成等核心挑战。
在 Agent 运营层面,火山引擎推出了 HiAgent 智能体工作站,构建统一的企业 AI 任务调度中心、提供一系列开箱即用的通用智能体,并支持个性化定制。
2025 年,关于“Agent 元年” 的争论和实践,已收官在即,如果明年 Agent 爆发进一步爆发,能带来直接收益的实用场景和企业订单大幅增长,想必各家大模型厂商的竞争也将愈发激烈。(作者|胡珈萌,编辑|李程程)

更多精彩内容,关注钛媒体微信号 (ID:taimeiti),或者下载钛媒体 App















