腾讯混元开源语音数字人模型HunyuanVideo-Avatar:图+音频，让图中的主角说话唱

1100

腾讯开源语音数字人模型HunyuanVideo-Avatar，仅需图片和音频即可生成数字人说话或唱歌视频。该模型能理解音频情感和环境，支持头部、半身、全身驱动，音画同步效果出色，支持多种风格、物种和多人场景。核心技术包括角色图像注入、多模态扩散Transformer架构等。用户可在腾讯混元官网体验。

来源：AI怪

识别右侧二维码，进入阅读全文

海报生成中...

复制成功

腾讯混元开源语音数字人模型HunyuanVideo-Avatar:图+音频，让图中的主角说话唱

Claude网页搜索功能全面开放，免费用户可享实时信息

微软开源 Aurora AI 气象模型，助力天气与环境监测

热门AI助手

热门文章

腾讯混元开源语音数字人模型HunyuanVideo-Avatar:图+音频，让图中的主角说话唱

Claude网页搜索功能全面开放，免费用户可享实时信息

微软开源 Aurora AI 气象模型，助力天气与环境监测

相关快讯

WordPress 成立 AI 核心团队，660款插件迈向规范化发展

ChatGPT Advanced Voice 高级语言模型发布

海螺 AI 发布 Hailuo Video Agent：视频创作智能体

Opera Neon推出首款AI Agent浏览器，助力用户智能上网

热门AI助手

热门文章

AI助手标签

AI标签云