苹果发布FastVLM模型:用iPhone运行视觉语言处理,重新定义多模态AI边界

在人工智能技术持续突破的2025年,苹果公司再次以创新姿态引领行业——其研究团队于5月7日正式发布FastVLM视觉语言模型,通过革命性的FastViTHD架构,实现了85倍视觉编码速度飞跃和7.9倍首token生成加速。这一突破不仅刷新了视觉语言模型的效率纪录,更标志着苹果在端侧AI部署和跨模态技术整合上迈出关键一步。 一、技术突破:从架构革新到端侧部署 FastVLM的核心竞争力源于三大技术创新: 动态特征处理架构 FastViTHD采用混合维度处理策略,通过实时调整特征图分辨率(如动态切换384×384至11…

来源:AI怪 [原文链接]

关注每日AI行业最新资讯,请前往AI快讯首页