面壁智能推出MiniCPM 4.0端侧大模型 可实现220倍速度提升

面壁智能发布MiniCPM 4.0系列模型,包括8B稀疏版和0.5B轻巧版,主打端侧性能。
速度提升显著,极限情况下达220倍,常规也有5倍提升,得益于稀疏架构和高效双频换挡技术。
效能上,采用全开源系统级上下文稀疏化,大幅减少存储需求。
性能方面,0.5B版本以小博大,8B版本超越Qwen3和Gemma312B。
落地应用通过自研框架,实现模型瘦身90%并提升速度,已适配多种芯片,并在开源框架上部署。

来源:AI怪

关注每日AI行业最新资讯,请前往AI快讯首页