多模态推理能力是MLLMs的关键。MME团队发布了一个新的多模态推理基准,评估了包括Gemini 2.5 Pro在内的模型。结果显示,即使是强大的Gemini 2.5 Pro也仅获得60分。这项研究评估了模型的逻辑推理能力,并强调了MLLMs在这一领域的持续挑战。
微信扫码分享
关注每日AI行业最新资讯,请前往AI快讯首页