2026 年 5 月 9 日 星期六
  • 登录
  • 注册
周天财经
广告
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金
没有结果
查看所有结果
周天财经
没有结果
查看所有结果
首页 黄金

通义万相 「音频驱动视频生成模型」 开源,可生成分钟级视频

2025 年 8 月 27 日
在 黄金
阅读时间: 1 min read
阅读:663
A A

【TechWeb】8 月 27 日消息,通义万相又迎来重磅开源,全新发布的音频驱动的视频模型 Wan2.2-S2V 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑电影级数字人视频。模型生成视频时长可达分钟级,可大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。

据介绍,Wan2.2-S2V 可驱动真人、卡通、动物、数字人等多种类型图片,并支持肖像、半身以及全身等任意画幅,上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

通义团队基于通义万相的通用视频生成能力,融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成;引入 AdaIN 和 CrossAttention 两种控制机制,实现了更准确更动态的音频控制效果。

生成时长上,Wan2.2-S2V 单次生成的视频时长可达分钟级。

Wan2.2-S2V 通过层次化帧压缩技术,大幅降低了历史帧的 Token 数量,通过该方式将 motion frames(历史参考帧) 的长度从数帧拓展到 73 帧, 从而实现了稳定的长视频生成效果。

Wan2.2-S2V 还支持文本控制,输入 Prompt 后还可对视频画面进行控制,实现镜头运动、角色轨迹和实体间互动,让视频主体的运动和背景的变化更丰富。

同时通过多分辨率训练、支持模型多分辨率的推理,Wan2.2-S2V 可支持不同分辨率场景的视频生成需求, 如竖屏短视频、横屏影视剧。

目前,用户可在 Github、HuggingFace 和魔搭社区下载模型,通过阿里云百炼调用 API,或在通义万相官网直接体验。

广告

【TechWeb】8 月 27 日消息,通义万相又迎来重磅开源,全新发布的音频驱动的视频模型 Wan2.2-S2V 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑电影级数字人视频。模型生成视频时长可达分钟级,可大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。

据介绍,Wan2.2-S2V 可驱动真人、卡通、动物、数字人等多种类型图片,并支持肖像、半身以及全身等任意画幅,上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

通义团队基于通义万相的通用视频生成能力,融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成;引入 AdaIN 和 CrossAttention 两种控制机制,实现了更准确更动态的音频控制效果。

生成时长上,Wan2.2-S2V 单次生成的视频时长可达分钟级。

Wan2.2-S2V 通过层次化帧压缩技术,大幅降低了历史帧的 Token 数量,通过该方式将 motion frames(历史参考帧) 的长度从数帧拓展到 73 帧, 从而实现了稳定的长视频生成效果。

Wan2.2-S2V 还支持文本控制,输入 Prompt 后还可对视频画面进行控制,实现镜头运动、角色轨迹和实体间互动,让视频主体的运动和背景的变化更丰富。

同时通过多分辨率训练、支持模型多分辨率的推理,Wan2.2-S2V 可支持不同分辨率场景的视频生成需求, 如竖屏短视频、横屏影视剧。

目前,用户可在 Github、HuggingFace 和魔搭社区下载模型,通过阿里云百炼调用 API,或在通义万相官网直接体验。

Related articles

地缘政治不确定性 黄金在波动中寻找方向

2026 年 5 月 9 日
TechWeb微晚报:多家车企否认因「锁电」被约谈,英特尔市值破6000亿美元

TechWeb 微晚报:多家车企否认因 「锁电」 被约谈,英特尔市值破 6000 亿美元

2026 年 5 月 9 日

【TechWeb】8 月 27 日消息,通义万相又迎来重磅开源,全新发布的音频驱动的视频模型 Wan2.2-S2V 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑电影级数字人视频。模型生成视频时长可达分钟级,可大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。

据介绍,Wan2.2-S2V 可驱动真人、卡通、动物、数字人等多种类型图片,并支持肖像、半身以及全身等任意画幅,上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

通义团队基于通义万相的通用视频生成能力,融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成;引入 AdaIN 和 CrossAttention 两种控制机制,实现了更准确更动态的音频控制效果。

生成时长上,Wan2.2-S2V 单次生成的视频时长可达分钟级。

Wan2.2-S2V 通过层次化帧压缩技术,大幅降低了历史帧的 Token 数量,通过该方式将 motion frames(历史参考帧) 的长度从数帧拓展到 73 帧, 从而实现了稳定的长视频生成效果。

Wan2.2-S2V 还支持文本控制,输入 Prompt 后还可对视频画面进行控制,实现镜头运动、角色轨迹和实体间互动,让视频主体的运动和背景的变化更丰富。

同时通过多分辨率训练、支持模型多分辨率的推理,Wan2.2-S2V 可支持不同分辨率场景的视频生成需求, 如竖屏短视频、横屏影视剧。

目前,用户可在 Github、HuggingFace 和魔搭社区下载模型,通过阿里云百炼调用 API,或在通义万相官网直接体验。

广告

【TechWeb】8 月 27 日消息,通义万相又迎来重磅开源,全新发布的音频驱动的视频模型 Wan2.2-S2V 仅需一张图片和一段音频,即可生成面部表情自然、口型一致、肢体动作丝滑电影级数字人视频。模型生成视频时长可达分钟级,可大幅提升数字人直播、影视制作、AI 教育等行业的视频创作效率。

据介绍,Wan2.2-S2V 可驱动真人、卡通、动物、数字人等多种类型图片,并支持肖像、半身以及全身等任意画幅,上传一段音频后,模型就能让图片中的主体形象完成说话、唱歌和表演等动作。

通义团队基于通义万相的通用视频生成能力,融合了文本引导的全局运动控制和音频驱动的细粒度局部运动,实现了复杂场景的音频驱动视频生成;引入 AdaIN 和 CrossAttention 两种控制机制,实现了更准确更动态的音频控制效果。

生成时长上,Wan2.2-S2V 单次生成的视频时长可达分钟级。

Wan2.2-S2V 通过层次化帧压缩技术,大幅降低了历史帧的 Token 数量,通过该方式将 motion frames(历史参考帧) 的长度从数帧拓展到 73 帧, 从而实现了稳定的长视频生成效果。

Wan2.2-S2V 还支持文本控制,输入 Prompt 后还可对视频画面进行控制,实现镜头运动、角色轨迹和实体间互动,让视频主体的运动和背景的变化更丰富。

同时通过多分辨率训练、支持模型多分辨率的推理,Wan2.2-S2V 可支持不同分辨率场景的视频生成需求, 如竖屏短视频、横屏影视剧。

目前,用户可在 Github、HuggingFace 和魔搭社区下载模型,通过阿里云百炼调用 API,或在通义万相官网直接体验。

相关 文章

地缘政治不确定性 黄金在波动中寻找方向

来自 周天财经
2026 年 5 月 9 日
0

当前黄金市场的核心变量,无疑是美伊冲突的...

TechWeb微晚报:多家车企否认因「锁电」被约谈,英特尔市值破6000亿美元

TechWeb 微晚报:多家车企否认因 「锁电」 被约谈,英特尔市值破 6000 亿美元

来自 周天财经
2026 年 5 月 9 日
0

今日要闻一览:英特尔股价周五大涨 市值已...

近一周周大福黄金行情周报 (2026 年 4 月 27 日至 2026 月 5 月 1 日)

来自 周天财经
2026 年 5 月 9 日
0

截至 2026 年 5 月 1 日当周,周大福黄金收...

近一周老凤祥黄金行情周报 (2026 年 4 月 27 日至 2026 月 5 月 1 日)

来自 周天财经
2026 年 5 月 9 日
0

截至 2026 年 5 月 1 日当周,老凤祥黄金收...

近一周菜百黄金行情周报 (2026 年 4 月 27 日至 2026 月 5 月 1 日)

来自 周天财经
2026 年 5 月 9 日
0

截至 2026 年 5 月 1 日当周,菜百黄金收于...

加载更多
广告
  • 热门
  • 评论
  • 最新
神马经典投研: 集资讯、策略、研报一站式期货投研工具

神马经典投研: 集资讯、策略、研报一站式期货投研工具

2025 年 11 月 7 日
「我们也深陷残酷价格战」,德资巨头中国区高管警告

「我们也深陷残酷价格战」,德资巨头中国区高管警告

2025 年 8 月 4 日
一周产业基金|上海市人工智能CVC基金发布;湖北百亿人形机器人母基金来了

一周产业基金|上海市人工智能 CVC 基金发布;湖北百亿人形机器人母基金来了

2025 年 8 月 4 日
「硬科技」指数携手上涨,半导体设备ETF易方达(159558)、芯片ETF易方达(516350)等产品助力布局板块龙头

基民懵了!这个火爆的板块年内涨超 37%,主力却借道 ETF 狂抛逾 400 亿元

2025 年 9 月 20 日
Lesson 1: Basics Of Photography With Natural Lighting

The Single Most Important Thing You Need To Know About Success

4
Lesson 1: Basics Of Photography With Natural Lighting

Lesson 1: Basics Of Photography With Natural Lighting

3
Lesson 1: Basics Of Photography With Natural Lighting

5 Ways Animals Will Help You Get More Business

2
Lesson 1: Basics Of Photography With Natural Lighting

New Cryptocurrency That Will Kill Of Bitcoin

2

地缘政治不确定性 黄金在波动中寻找方向

2026 年 5 月 9 日
国产特斯拉Model Y L 已经出口韩国泰国澳大利亚等市场

国产特斯拉 Model Y L 已经出口韩国泰国澳大利亚等市场

2026 年 5 月 9 日
善待自己,从定期离开屏幕开始

善待自己,从定期离开屏幕开始

2026 年 5 月 9 日

AI 产业链方向短线承压,关注科创创业人工智能 ETF 易方达 (159140)、人工智能 ETF 易方达 (159819) 投资机会

2026 年 5 月 9 日
  • 隐私政策
  • 联系我们
  • 关于周天
  • 登录
  • 注册
投诉建议:+86 13326565461

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

没有结果
查看所有结果
  • 首页
  • 24 小时
  • 世界
  • 商业
  • 基金
  • 期货
  • 股票
  • 行业新闻
  • 黄金

© 2025 广州小舟天传媒有限公司 by 周天财经 - 粤 ICP 备 2025452169 号-1

欢迎回来!

在下面登录您的帐户

忘记密码? 注册

创建新帐户!

填写以下表格进行注册

所有项目需要填写。 登录

重置您的密码

请输入您的用户名或电子邮件地址以重置密码。

登录

用户登录

还没有账号?立即注册

用户注册

已有账号?立即登录