多模态推理新基准！最强Gemini 2.5 Pro仅得60分，复旦港中文上海AILab等出品

1470

多模态推理能力是MLLMs的关键。MME团队发布了一个新的多模态推理基准，评估了包括Gemini 2.5 Pro在内的模型。结果显示，即使是强大的Gemini 2.5 Pro也仅获得60分。这项研究评估了模型的逻辑推理能力，并强调了MLLMs在这一领域的持续挑战。

来源：AI怪

识别右侧二维码，进入阅读全文

海报生成中...

复制成功