DeepSeek-R1-0528重磅升级!国产AI能否续写“国产之光”?

   时间:2025-06-04 12:24 来源:ITBEAR作者:顾青青

在AI界的一次悄然变革中,DeepSeek再次成为焦点。原本万众期待的R2模型尚未露面,DeepSeek却以一种低调而有力的方式推出了新版本——DeepSeek-R1-0528。

这次更新,DeepSeek延续了其一贯的命名风格,只是在原有R1版本的基础上,低调地加上了日期后缀,仿佛是在宣告:这次改动,虽不起眼,却内含乾坤。

与两个月前的DeepSeek-V3-0324类似,这次的DeepSeek-R1-0528同样选择了在节日前夕发布,且依旧保持了开源的特性。然而,名字上的微小变化,却掩盖不了其在性能上的巨大飞跃。特别是在复杂推理、前端开发以及幻觉降低等方面,DeepSeek-R1-0528带来了显著的提升。

据悉,DeepSeek-R1-0528在保持原有DeepSeek V3 Base模型的基础上,通过增加后台算力,使得模型能够像人一样进行更深层次的思考。这种提升,在AIME 2025测试中得到了直观体现:旧版R1平均每题只需12K tokens即可完成,而新版R1-0528则需要23K tokens,才能满意地交卷。这意味着,新版模型在处理问题时,会将题目拆解得更加细致、透彻。

正是这种思考深度的增加,使得DeepSeek-R1-0528在准确率上实现了质的飞跃,从原来的70%飙升至87.5%。有用户实测发现,新版模型在连续思考复杂问题时,甚至能持续运行25分钟之久。这一变化,无疑让DeepSeek-R1-0528在深度思考能力上迈上了新的台阶。

在编程和推理能力方面,DeepSeek-R1-0528同样表现出色。在LiveCodeBench基准测试中,其成绩已经能够与o3-mini(High)和o4-mini(Medium)相媲美,甚至在某些场景下超越了Gemini 2.5 Flash。在物理世界推理能力的测试中,DeepSeek-R1-0528也展现出了强大的实力。

值得注意的是,DeepSeek-R1-0528在提升思考深度的同时,也并未忽视语言对话方面的优化。作为本土AI,它更加贴合国人的需求,在语言处理上更加自然流畅。特别是在降低幻觉率方面,新版模型取得了显著进步。以前常见的“脑补”现象大大减少,输出内容更加靠谱、实用。

DeepSeek-R1-0528在创意写作方面也展现出了非凡的实力。无论是输出论文、小说还是散文,都能一气呵成、逻辑顺畅、情节自然。这一变化,让不少人对AI的写作能力刮目相看。

尽管DeepSeek-R1-0528的发布并未引起如R2般的轰动效应,但其内在的实力提升却是显而易见的。无论是与旧版R1相比,还是与其他大模型相比,DeepSeek-R1-0528都展现出了强大的竞争力。这次低调而有力的更新,无疑让DeepSeek在AI界的地位更加稳固。

 
 
更多>同类内容
全站最新
热门内容