DeepSeek R1更新到底更新了什么?小更新,大效果!

2025年5月28日,DeepSeek对其R1模型进行小版本升级,重点优化了复杂推理能力(数学/编程准确率提升至96.3%)、长文本处理(支持128K tokens)和响应速度(延迟降低10%-20%),采用MoE架构与GRPO算法强化专业领域表现,并新增思维链可视化功能。实测显示代码生成和数学推理能力对标行业标杆,但开发者指出长文本稳定性仍需改进。此次升级通过工程优化(INT4量化/KV缓存)和新增60万条专业数据,标志着从黑箱模型向可解释AI的演进,可能推动行业更注重推理透明化与垂直领域精度突破。

来源:AI怪 [原文链接]

关注每日AI行业最新资讯,请前往AI快讯首页