FlowGoogle Flow是一款支持文本、图像、音频等多模态输入的 AI 助手,融合 Gemini 模型,助力更强大的个性化智能体验。0110AI Agent多模态模型# Gemini模型# Google AI产品# 多模态AI助手
MedGemmaGoogle推出的适用于医学文本和图像理解的 Gemma 3 变体,一款面向医学的开放式多模态人工智能模型080多模态模型行业模型# AI医疗模型# Google DeepMind# 医学图像分析
MoneyPrinterTurbo利用AI大模型,一键生成高清短视频:只需提供一个视频 主题 或 关键词 ,就可以全自动生成视频文案、视频素材、视频字幕、视频背景音乐,然后合成一个高清的短视频。0100AI视频模型# AI短视频生成# AI视频创作# AI视频生成
AgentCPM-GUI一个能操作手机的GUI Agent大模型。AgentCPM-GUI是基于多模态大语言模型的开源GUI自动化框架,通过分层智能体架构实现跨平台复杂任务处理,重塑人机交互范式0110端侧模型# AI Agent# AI测试生成# 任务自动化
Komiko(基于AniSora)Bilibili 推出的最强大的开源动画视频生成模型。AniSora 支持一键生成各种动画风格的视频,包括连续剧集、中国动画、漫画改编、VTuber 内容、动漫 PV 等等。0100AI视频模型图片转视频# AI动漫生成# AI视频生成器# 动漫视频生成
MiniCPM-o一个适用于手机上的 GPT-4o 级别的视觉、语音和多模态直播 MLLM。MiniCPM-o 是 MiniCPM-V 衍生出的最新端侧多模态 LLM(MLLM)系列0120端侧模型# 多模态大模型# 多语言翻译# 本地语音识别
Stable Diffusion Models一站式获取Stable Diffusion官方模型与优质变体的资源导航站0200AI绘画模型# AI绘画授权规则# Hugging Face资源导航# Stable Diffusion模型下载
StyleDropStyleDrop正在重新定义AI绘画的可能性——它不再是你和程序员之间的翻译器,而是真正理解创作意图的智能助手0240AI绘画模型# AI绘画解决方案# 品牌视觉设计# 文本到图像生成