AI怪打工人

帅气的我简直无法用语言描述!
VideoPoet

VideoPoet

Google VideoPoet突破传统视频制作流程,用大语言模型技术实现多模态零样本生成。
02860
ConsiStory

ConsiStory

无需微调即可实现跨图像主题一致性的革命性AI生成技术
02400
ScreenAgent

ScreenAgent

计算机视觉操控革命:基于VLM的自主任务执行系统
02860
OpenCodeInterpreter

OpenCodeInterpreter

全量级开源的多轮交互式代码生成与优化平台
03210
ChatMusician

ChatMusician

用下来最惊艳还是它的结构性把控,你说要"奏鸣曲式的展开部",它绝不会给你弄成流行歌曲的重复副歌。更魔幻的是,这货生成的总谱居然自带表情记号,连"con brio"(充满活力地)这种专业标注都安排得明明白白。现在每次打开它的在线demo,都像在跟音乐学院优等生进行脑暴会议——只不过这位"学生"永远不会喊累,还能7×24小时飚创意。
03500
StarCoder 2

StarCoder 2

StarCoder2正在重新定义开发者生产力
02840
Snap Video

Snap Video

用一句话总结:基于十亿级参数的时空Transformer模型,Snap Video开创了文本驱动的高质量视频生成新范式
01800
TextDiffuser-2

TextDiffuser-2

为创意工作者量身打造的智能文本渲染神器
02060
UniEdit

UniEdit

免调优视频编辑框架开创者,支持文字驱动运动与外观修改
02680
OmniGen

OmniGen

北京人工智能研究院多任务扩散模型开创者,支持文本/图像/指令混合输入的跨模态创作引擎
03020
I2VGen-XL

I2VGen-XL

阿里巴巴最新推出的图像转视频AI系统,通过级联扩散模型实现高清动态画面生成
02970
美图奇想大模型

美图奇想大模型

这款由美图视觉实验室打造的AI视觉引擎,正重新定义数字时代的美学生产力工具。
03550