在AI大模型领域,一场无声的竞争正在激烈上演。自DeepSeek横空出世,引发业界对“大模型六小龙”格局的重新审视后,半年时间转瞬即逝,而那些依然坚守在这一赛道上的玩家,正急于证明自己的实力与价值。
从上海的MiniMax到北京的月之暗面,这些企业纷纷推出新模型与产品,竞争态势愈发白热化。它们不约而同地将DeepSeek、OpenAI、谷歌等顶尖模型作为对标对象,并将目光聚焦于智能体(Agent)这一前沿领域,这是国内外科技巨头都在积极布局的方向。
MiniMax与月之暗面的最新动作尤为引人注目。MiniMax推出了其首款开源推理模型M1,该模型在基准评测中表现出色,性能接近海外最领先模型,尤其在软件工程、长上下文、工具使用等复杂生产力场景中展现出明显优势。在海外权威机构Artificial Analysis发布的模型综合能力榜单中,MiniMax M1位列全球开源模型第二名,仅次于DeepSeek-R1-0528。
与此同时,月之暗面也发布了k系列模型的最新版本Kimi-Researcher,这是一款基于端到端自主强化学习技术训练的新一代Agent模型。在高难度基准人类终极考试(HLE)中,Kimi-Researcher取得了令人瞩目的成绩,超过了包括OpenAI o3、Gemini 2.5 Pro在内的多款顶尖模型。
MiniMax与月之暗面在模型层面的突破,得益于对强化学习的重视与算法创新。M1采用了Lightning Attention混合架构与创新性的CISPO算法,提高了训练效率与模型性能;而Kimi-Researcher则通过端到端自主强化学习技术,摆脱了传统的监督微调和基于规则制或工作流的方式,展现出更强的模型性能。
值得注意的是,新一轮的大模型技术竞争已不再单纯追求参数与算力规模,而是更加注重成本与效率。DeepSeek此前已展现出高性价比优势,成为其他企业效仿的对象。此次MiniMax的M1借助算法架构创新,实现了比DeepSeek-R1更低的算力消耗与更高的训练效率。
多模态与开源也成为大模型竞争的重要策略。从最初的语言模型到多模态,“四小虎”——智谱、月之暗面、MiniMax和阶跃星辰全面追赶,并纷纷走向开源。这一趋势无疑受到了DeepSeek的深远影响。
随着MiniMax和Kimi的发布,意味着“四小虎”均已涉足Agent领域。今年被视为Agent元年,不少AI初创企业纷纷转向智能体方向,甚至有企业已在B端市场取得千万级订单。然而,面向C端的智能体市场尚未有哪款产品能牢牢占据用户心智,这意味着仍有巨大的市场机会等待挖掘。
月之暗面发布的Kimi-Researcher集模型和智能体于一身,定位于专为深度研究任务而生的智能体。与采用多智能体方案的其他智能体不同,Kimi-Researcher采用了基于自身模型的Single-Agent路线,展现出一种不同的解决方案。这一思路与OpenAI基于o3推出的DeepResearch相似,而MiniMax则发布了适用于长程复杂任务的通用智能体。
尽管MiniMax和月之暗面在技术和产品层面取得了显著进展,但它们仍面临着巨大的市场压力。随着DeepSeek和OpenAI等领头羊的持续领先,以及算力资源和资金方面的限制,“四小虎”需要付出更多努力才能留在牌桌上。有业内人士认为,未来可能还会有1-2家企业掉队,最终仅剩2-3家存活下来。
在此背景下,“四小虎”纷纷调整策略以应对挑战。智谱从北京、杭州等地获得20亿元融资,并加速推动商业化进程;月之暗面则回归模型研发重心,计划推出新一代多模态大模型;阶跃星辰收敛产品线,聚焦Agent方向;而MiniMax则宣布品牌拆分,形成多元化产品矩阵,并继续发力出海市场。
尽管面临诸多挑战,但“四小虎”仍在努力证明自己的实力与价值。它们能否在这一竞争激烈的赛道中脱颖而出,让我们拭目以待。