Follow Your Pose翻译站点

10个月前发布 286 00

通过姿势与文字的双重指引生成可编辑风格化视频

所在地：

美国

语言：

英语

收录时间：

2025-05-18

官网入口手机查看

Follow Your Pose

官网入口

Follow Your Pose：用姿势+文字生成多风格视频的AI黑科技

当我的素描画在沙漠里跳机械舞

作为一个沉迷AI视频工具的影像创作者，试过用Stable Diffusion生成静态图后，总想着要是能让角色动起来该多好。直到遇见清华大学与腾讯联合研发的Follow Your Pose，才明白什么叫”笔尖的跃动”。这个平台真正让我体验到”以姿为纲”的视频创作快感——上传草图姿势序列，输入”穿着赛博朋克盔甲的武士在月球表面挥剑”，转眼间就生成10秒逐帧匹配的动态视频，连披风飘动的角度都精确还原预设动作。

三大核心玩法解密

这个官网挂着Creative Commons协议的研究项目，藏着三个让我惊掉下巴的绝技：

无中生有的动作捕捉：训练时压根不需要带姿势标注的视频数据！算法通过两阶段学习，先吃透2D关键点与图像的映射关系，再利用PromptBase式的语义理解，把时间轴上的动态连贯性琢磨透彻
多模态混搭魔法：”梵高星月夜风格的机器人”、”新海诚画风的钢铁侠”这类烧脑的跨次元组合，输入自然语言直接生成
姿势编辑实时响应：视频生成中途随时插入新的关键帧，系统自动平滑过渡动作轨迹

技术流必看：在Github开源库中（FollowYourPose代码库），研究者们创新性地采用了两阶段训练方案：

关键点编码器+扩散模型的组合拳，解决姿势到图像的跨模态转换
时间自注意力机制+Temporal Module，让算法从无标注视频中自动学习运动规律

创作自由度突破天际

谁说只能在现实场景蹦跶？我测试时故意搞怪：让蝙蝠侠在海面上做后空翻，结果算法连水面涟漪的物理效果都渲染得有模有样。最有趣的是用Write Wise网文小说写作生成的剧情大纲作提示词——”赛博歌剧院中的机械天鹅之死”，配合预设的芭蕾动作序列，生成的视频直接可以当微电影分镜使用。

测试案例	生成耗时	惊艳指数
“沙漠机械舞”[输入5个关键帧]	约3分钟	🤖🤖🤖🤖
“月球漫步的宇航员”[连续姿势]	4分12秒	🚀🚀🚀🚀🚀

令人纠结的定价谜题

根据官网底部显示的LICENSE-Creative Commons协议判断，目前该项目仍属于学术研究性质。但查询腾讯混元官网发现，其进阶版”Follow-Your-Pose-v2″已支持商业级多人动作同步，可惜官方尚未放出具体套餐价格。我在体验时发现三个隐藏信息点：

代码库自带inference脚本可本地部署
项目主页示例视频含「for research purpose only」水印
论文通讯作者邮箱可直接咨询技术合作

打破次元壁的创作革命

玩了一周后的亲身建议：先准备好骨骼清奇的脑洞！这个工具最适合：

动画师快速验证分镜动作设计
短视频创作者制作虚拟偶像内容
教育机构开发动态可视化课件

虽然生成10秒视频需要3-5分钟（GTX3090环境下），但当看到自己手绘的火柴人变身新海诚画风的武林高手，在星海间使出独孤九剑——这种打破次元壁的感动，确实值得等待。（P.S.记得搭配PromptBase的优质提示词，效果翻倍哟！)

暂无评论

您必须登录才能参与评论！

立即登录

暂无评论...

Follow Your Pose翻译站点

Follow Your Pose：用姿势+文字生成多风格视频的AI黑科技

当我的素描画在沙漠里跳机械舞

三大核心玩法解密

创作自由度突破天际

令人纠结的定价谜题

打破次元壁的创作革命

相关导航

FineVideo

CosyVoice2.0

Make-A-Character

VideoDoodles

Vary-toy

SafeEar

Seed-VC

FunAudioLLM

暂无评论

热门AI工具

热门AI文章

Follow Your Pose翻译站点

Follow Your Pose：用姿势+文字生成多风格视频的AI黑科技

当我的素描画在沙漠里跳机械舞

三大核心玩法解密

创作自由度突破天际

令人纠结的定价谜题

打破次元壁的创作革命

相关导航

FineVideo

CosyVoice2.0

Make-A-Character

VideoDoodles

Vary-toy

SafeEar

Seed-VC

FunAudioLLM

暂无评论

热门AI工具

热门AI文章

AI助手标签

AI标签云