AI怪打工人

帅气的我简直无法用语言描述!
Draw an Audio

Draw an Audio

Draw an Audio通过多模态指令系统实现精准的视频到音频合成,开创音效创作新模式
02910
ActAnywhere

ActAnywhere

全球首款实现电影级人景互动的AI视频生成解决方案
03390
FineVideo

FineVideo

开源多模态训练领域的里程碑式资源库
03460
Vary-toy

Vary-toy

专业级视觉语言处理 消费级硬件需求 多模态文档转换 科研效率工具 工业级物体识别
02830
abab-music-1

abab-music-1

MiniMax AI通过海螺智能平台突破创意门槛,让文字、音乐、视频创作像发朋友圈一样简单
03640
Lepton Search

Lepton Search

Lepton Search是一个开源的对话式搜索引擎,开发者可用不到500行代码快速构建类Perplexity的AI驱动搜索工具,支持谷歌/Bing并集成RAG技术。
03600
Follow Your Pose

Follow Your Pose

通过姿势与文字的双重指引生成可编辑风格化视频
03200
IP-Adapter

IP-Adapter

IP-Adapter:无需代码就能实现的跨模态AI图像生成方案
03250
OLMo

OLMo

全栈开源的AI大模型框架,推动技术民主化的关键基石
02910
MetaGPT

MetaGPT

MetaGPT将复杂软件开发流程压缩成一键式智能协作,重新定义AI辅助开发的生产力边界
01770
PDF2Audio

PDF2Audio

能随时随地"听论文"的感觉有多爽?这么说吧,现在我的运动手环都统计到——用PDF2Audio后思维活跃度提升46%,真是学习工作两开花!
03880
SafeEar

SafeEar

一款无需窃听内容即可识破语音伪造的跨时代安全工具
03120