多模态推理新基准!最强Gemini 2.5 Pro仅得60分,复旦港中文上海AILab等出品

多模态推理能力是MLLMs的关键。MME团队发布了一个新的多模态推理基准,评估了包括Gemini 2.5 Pro在内的模型。结果显示,即使是强大的Gemini 2.5 Pro也仅获得60分。这项研究评估了模型的逻辑推理能力,并强调了MLLMs在这一领域的持续挑战。

来源:AI怪

关注每日AI行业最新资讯,请前往AI快讯首页