AgentCPM-GUI一个能操作手机的GUI Agent大模型。AgentCPM-GUI是基于多模态大语言模型的开源GUI自动化框架,通过分层智能体架构实现跨平台复杂任务处理,重塑人机交互范式0110端侧模型# AI Agent# AI测试生成# 任务自动化
MiniCPM-o一个适用于手机上的 GPT-4o 级别的视觉、语音和多模态直播 MLLM。MiniCPM-o 是 MiniCPM-V 衍生出的最新端侧多模态 LLM(MLLM)系列0120端侧模型# 多模态大模型# 多语言翻译# 本地语音识别