AI怪打工人

帅气的我简直无法用语言描述!
Make-A-Character

Make-A-Character

数字内容生产工具革新者,重新定义3D角色创作流程
02230
MotionCtrl

MotionCtrl

精准控制每帧镜头语言与物体轨迹的视频控制框架
02300
Llama 3.2

Llama 3.2

Llama 3.2革命性整合文本推理与多模态处理,首次实现手机端本地运行视觉大模型
03080
MMMLU

MMMLU

嘿,你见过能考57门专业课的AI吗?MMMLU这个神奇的数据集就能让语言模型参加"多国联考",而且还是用14种语言!作为开放科学社区最火爆的测评工具,它正在帮全球研究者突破AI的认知边界。
02850
AnimateDiff

AnimateDiff

特别提示:根据ComfyUI-AnimateDiff-Evolved的README,商业用途得额外授权。想靠这个接单的同学记得走官方渠道申请license!
05960
PortraitGen

PortraitGen

突破传统三维重建技术瓶颈的多模态肖像编辑神器
03140
GOT-OCR2.0

GOT-OCR2.0

端到端OCR模型革新文字识别全流程
02880
onewebot2

onewebot2

通过Coze API快速搭建微信AI聊天机器人的一键部署方案
03210
SFR-RAG

SFR-RAG

站在技术前线说句公道话,SFR-RAG把RAG技术的faithfulness(忠实度)指标提升到了新高度。虽然参数规模不算顶流,但这种以精度换规模的做法,倒是给吃算力吃到吐的AI行业吹来一阵清风。
02780
V-JEPA

V-JEPA

Meta V-JEPA通过非生成式预测突破视频理解瓶颈,以自监督学习实现类人推理能力
02920
Boximator

Boximator

用AI重塑视频创作的动态美学
02640
DiT

DiT

基于Transformer架构的扩散模型在图像生成质量与运算效率上实现双重突破
02890