在人工智能界,DeepSeek-R1悄然迎来了新一轮的更新,而这一次,它似乎选择了一种更为低调的方式发布——没有盛大的发布会,也没有铺天盖地的宣传,仅仅是在Hugging Face平台上默默上线了DeepSeek-R1-0528版本。
与之前的V3-0324版本发布时的情况相似,DeepSeek-R1-0528的到来并未伴随Model Card或官方更新公告的同步发布。然而,即便如此,新版本依然迅速吸引了大量关注,并在大模型热搜榜上迅速攀升至榜首位置。
用户们对新版本的讨论热情高涨,纷纷探讨其在性能上的提升,同时也不忘提及对R2和V4大版本更新的期待。有趣的是,鉴于DeepSeek过往喜欢在中国传统节日前后发布新品的习惯,国外网友甚至开始根据国庆和端午的放假时间来推测其未来的发布日期。
而在NVIDIA Q1财报发布的同日,DeepSeek的小幅更新也避免了再次引发关于大模型训练算力的广泛讨论。上一次R1技术报告带来的算力拷问还历历在目,此次的更新显得更为谨慎。
据DeepSeek官方透露,R1-0528版本在推理性能上有了大幅提升,前端开发能力更为强大,工具使用也变得更加智能。从官方提供的案例来看,新版本在物理世界的推理能力确实表现出色,小球破坏砖块墙后的倒塌效果更符合物理规律。
经过实际测试,不少用户发现R1-0528在编程推理能力上也有所提升,尽管并未达到惊艳的程度。然而,真正令人称奇的是其长文本生成能力。在给定简单的提示词后,DeepSeek仅用40秒就完成了一篇行文流畅、科幻氛围浓厚的悬疑小说,其文笔之细腻、情节之逻辑严密,令人叹为观止。
相比之下,一直以来被认为文字功底较强的Gemini 2.5 pro在此次测试中表现平平,其生成的小说显得辞藻堆砌,晦涩难懂。DeepSeek的长文本生成能力无疑为其在大模型领域树立了新的标杆。
在代码生成方面,R1-0528同样展现出了显著的提升。在LiveCodeBench大模型代码能力测试基准上,新版本已经跃升至榜单第四位,与OpenAI的闭源模型形成了有力的竞争。在实际测试中,R1-0528在处理经典问题如五边形小球弹跳时,表现尤为出色,不仅代码一次启动成功,而且物理效果逼真,细节处理到位。
R1-0528在前端审美和功能完整性方面也取得了不小的进步。在与Claude Sonnet 4的对比测试中,两者在画面美观度和功能完整度上打成平手,但R1-0528贴心地加上了使用说明,为用户提供了更为便捷的体验。尽管在取色功能上存在一些小bug,但整体而言,R1-0528已经展现出了与闭源模型相抗衡的实力。
此次DeepSeek-R1-0528的更新,不仅巩固了其在中文长文本生成方面的领先地位,还进一步提升了其在编程推理和前端开发等方面的能力。DeepSeek用实际行动证明,国产大模型不仅可以与闭源模型卷性能,还拥有不可替代的本土化优势。对于想要体验新版本的用户来说,现在就可以前往DeepSeek官网进行尝试。