滚动资讯

大模型竞赛白热化，“四小虎”如何破局DeepSeek压力？

时间：2025-06-27 20:48 来源：ITBEAR作者：顾青青

在AI大模型领域，一场无声的竞争正在激烈上演。自DeepSeek横空出世，引发业界对“大模型六小龙”格局的重新审视后，半年时间转瞬即逝，而那些依然坚守在这一赛道上的玩家，正急于证明自己的实力与价值。

从上海的MiniMax到北京的月之暗面，这些企业纷纷推出新模型与产品，竞争态势愈发白热化。它们不约而同地将DeepSeek、OpenAI、谷歌等顶尖模型作为对标对象，并将目光聚焦于智能体（Agent）这一前沿领域，这是国内外科技巨头都在积极布局的方向。

MiniMax与月之暗面的最新动作尤为引人注目。MiniMax推出了其首款开源推理模型M1，该模型在基准评测中表现出色，性能接近海外最领先模型，尤其在软件工程、长上下文、工具使用等复杂生产力场景中展现出明显优势。在海外权威机构Artificial Analysis发布的模型综合能力榜单中，MiniMax M1位列全球开源模型第二名，仅次于DeepSeek-R1-0528。

与此同时，月之暗面也发布了k系列模型的最新版本Kimi-Researcher，这是一款基于端到端自主强化学习技术训练的新一代Agent模型。在高难度基准人类终极考试（HLE）中，Kimi-Researcher取得了令人瞩目的成绩，超过了包括OpenAI o3、Gemini 2.5 Pro在内的多款顶尖模型。

MiniMax与月之暗面在模型层面的突破，得益于对强化学习的重视与算法创新。M1采用了Lightning Attention混合架构与创新性的CISPO算法，提高了训练效率与模型性能；而Kimi-Researcher则通过端到端自主强化学习技术，摆脱了传统的监督微调和基于规则制或工作流的方式，展现出更强的模型性能。

值得注意的是，新一轮的大模型技术竞争已不再单纯追求参数与算力规模，而是更加注重成本与效率。DeepSeek此前已展现出高性价比优势，成为其他企业效仿的对象。此次MiniMax的M1借助算法架构创新，实现了比DeepSeek-R1更低的算力消耗与更高的训练效率。

多模态与开源也成为大模型竞争的重要策略。从最初的语言模型到多模态，“四小虎”——智谱、月之暗面、MiniMax和阶跃星辰全面追赶，并纷纷走向开源。这一趋势无疑受到了DeepSeek的深远影响。

随着MiniMax和Kimi的发布，意味着“四小虎”均已涉足Agent领域。今年被视为Agent元年，不少AI初创企业纷纷转向智能体方向，甚至有企业已在B端市场取得千万级订单。然而，面向C端的智能体市场尚未有哪款产品能牢牢占据用户心智，这意味着仍有巨大的市场机会等待挖掘。

月之暗面发布的Kimi-Researcher集模型和智能体于一身，定位于专为深度研究任务而生的智能体。与采用多智能体方案的其他智能体不同，Kimi-Researcher采用了基于自身模型的Single-Agent路线，展现出一种不同的解决方案。这一思路与OpenAI基于o3推出的DeepResearch相似，而MiniMax则发布了适用于长程复杂任务的通用智能体。

尽管MiniMax和月之暗面在技术和产品层面取得了显著进展，但它们仍面临着巨大的市场压力。随着DeepSeek和OpenAI等领头羊的持续领先，以及算力资源和资金方面的限制，“四小虎”需要付出更多努力才能留在牌桌上。有业内人士认为，未来可能还会有1-2家企业掉队，最终仅剩2-3家存活下来。

在此背景下，“四小虎”纷纷调整策略以应对挑战。智谱从北京、杭州等地获得20亿元融资，并加速推动商业化进程；月之暗面则回归模型研发重心，计划推出新一代多模态大模型；阶跃星辰收敛产品线，聚焦Agent方向；而MiniMax则宣布品牌拆分，形成多元化产品矩阵，并继续发力出海市场。

尽管面临诸多挑战，但“四小虎”仍在努力证明自己的实力与价值。它们能否在这一竞争激烈的赛道中脱颖而出，让我们拭目以待。

更多>同类内容