AI怪打工人

帅气的我简直无法用语言描述！

文章150 网址2691 软件0 评论0

Make-A-Character

Make-A-Character

数字内容生产工具革新者，重新定义3D角色创作流程

02230

AI开源项目 # AI角色生成 # 元宇宙建模 # 动画绑定系统

MotionCtrl

精准控制每帧镜头语言与物体轨迹的视频控制框架

02300

AI开源项目 # MotionCtrl # 物体轨迹生成 # 相机运动独立控制

Llama 3.2

Llama 3.2革命性整合文本推理与多模态处理，首次实现手机端本地运行视觉大模型

03080

AI开源项目 # 低资源占用 # 多模态AI模型 # 本地化推理

MMMLU

嘿，你见过能考57门专业课的AI吗？MMMLU这个神奇的数据集就能让语言模型参加"多国联考"，而且还是用14种语言！作为开放科学社区最火爆的测评工具，它正在帮全球研究者突破AI的认知边界。

02850

AI开源项目 # 专业翻译数据集 # 人工智能多语言能力评估 # 大规模模型基准测试

AnimateDiff

特别提示：根据ComfyUI-AnimateDiff-Evolved的README，商业用途得额外授权。想靠这个接单的同学记得走官方渠道申请license！

05960

AI开源项目 # Stable Diffusion动画扩展 # 个性化模型动画适配 # 人工智能动态图像生成

PortraitGen

突破传统三维重建技术瓶颈的多模态肖像编辑神器

03140

AI开源项目 # 3D一致渲染 # 4D高斯场重建 # 多模态视频编辑

GOT-OCR2.0

端到端OCR模型革新文字识别全流程

02880

AI开源项目 # 多任务文本识别 # 多页PDF处理 # 开源OCR框架

onewebot2

通过Coze API快速搭建微信AI聊天机器人的一键部署方案

03210

AI开源项目 # Coze API集成 # GoodWeBot迁移 # 一键运行包

SFR-RAG

站在技术前线说句公道话，SFR-RAG把RAG技术的faithfulness（忠实度）指标提升到了新高度。虽然参数规模不算顶流，但这种以精度换规模的做法，倒是给吃算力吃到吐的AI行业吹来一阵清风。

02780

AI开源项目 # 企业RAG应用 # 低参数高效模型 # 多跳推理

V-JEPA

Meta V-JEPA通过非生成式预测突破视频理解瓶颈，以自监督学习实现类人推理能力

02920

AI开源项目 # 物体互动识别 # 自监督学习模型 # 视频抽象特征预测

Boximator

用AI重塑视频创作的动态美学

02640

AI开源项目 # AI动作生成 # 影视级模拟算法 # 硬盒约束技术

DiT

基于Transformer架构的扩散模型在图像生成质量与运算效率上实现双重突破

02890

AI开源项目 # 可伸缩AI架构 # 图像生成性能优化 # 扩散模型Transformer