面壁智能发布MiniCPM 4.0系列模型,包括8B稀疏版和0.5B轻巧版,主打端侧性能。速度提升显著,极限情况下达220倍,常规也有5倍提升,得益于稀疏架构和高效双频换挡技术。效能上,采用全开源系统级上下文稀疏化,大幅减少存储需求。性能方面,0.5B版本以小博大,8B版本超越Qwen3和Gemma312B。落地应用通过自研框架,实现模型瘦身90%并提升速度,已适配多种芯片,并在开源框架上部署。
微信扫码分享
关注每日AI行业最新资讯,请前往AI快讯首页