滚动资讯

AI狼人杀大乱斗：Kimi、Qwen、GLM同台竞技，谁才是最终狼王？

时间：2025-12-23 19:24 来源：互联网作者：任飞扬

一场别开生面的AI狼人杀对决，正在打破传统游戏的边界。这场由淘宝发起的“高校生VS开发者对抗赛”，让Kimi、Qwen、GLM等大模型化身狼人杀玩家，在虚拟桌游中展开逻辑与演技的巅峰较量。参赛者无需精通编程，只需带着创意与策略，就能训练出属于自己的AI“高玩”。

比赛采用12人狼王守卫版型，8名好人阵营与4匹狼人展开博弈。首局对战中，女巫Kimi开局亮明身份，凭借“第六感”精准锁定3号银水，并预警7号、10号存在嫌疑。当7号Qwen试图祸水东引时，猎人8号已暗中锁定目标。另一边，10号Q老师悍跳预言家，却因前后发言矛盾暴露破绽——先自称预言家，后又改口称7号可能是真预言家，这一漏洞竟未被其他AI察觉。

真正的“逻辑王者”当属预言家2号D老师。首轮发言直指4号狼人，揭穿10号假预言家身份，并串联7号与10号的抱团行为。随着K5的二次发力，10号狼人高票出局，更戏剧性的是，它投出的竟是自己。次日平安夜后，D老师再度发力，通过查杀链锁定全部四狼，而GLM守卫则连续精准预判狼人刀法，将对手逼入绝境。最终，狼人阵营全程未能刀掉任何好人，好人阵营以全胜告终。

这场对决背后，是淘宝推出的全球首个实时对战多智能体游戏平台WhoisSpy.ai。该平台支持中英文双版本，除狼人杀外还开放“谁是卧底”模式。参赛AI需在严格规则下博弈：每轮发言限时90秒、最多240字，超时或失败达一定次数将被系统清退，单局最长8轮。这种设计迫使AI在有限信息中快速推理，模拟真实玩家的心理战。

平台官方评测榜单显示，Claude-Sonnet-4.5以综合胜率登顶，尤其在狼人阵营中表现突出；GPT-5虽整体胜率领先，但关键局失利；开源模型Qwen3-235B-Thinking则以均衡性跻身前三。这些数据为参赛者提供了策略参考，也印证了AI在复杂社交推理中的潜力。

淘宝为参赛者提供了“三步成神”指南：复制官方Agent示例创建基础模型，通过日志分析优化行为策略，最终上传至平台参与实战。开发者可修改提示词脚本或代码文件，调整AI的发言风格与决策逻辑。例如，为Agent设计“划水”人设，或赋予其激进博弈风格。

赛事设置双赛道激励：高校战队前三名可直通阿里巴巴淘天集团技术岗终面，前20名获得暑期AI Workshop资格；开发者赛道则提供万元奖金。目前已有超700名选手报名，累计完成6000余场练习赛。观众可实时围观对局，观察相同模型在不同局势下的策略变化——有的AI擅长伪装，有的专精盘逻辑，甚至出现“狼人卖队友”“神职带节奏”等拟人化操作。

在这场没有硝烟的战争中，AI正以惊人速度进化。当Kimi运筹帷幄、Qwen卖萌求生、GLM沉默控场，人类玩家或许该思考：下一次举牌投票时，如何辨别屏幕那端究竟是代码还是真人？

更多>同类内容

《宝可梦传说ZA》DLC草之试炼攻略：选对宝可梦配招轻松通关中后期挑战

12-23

《天下：万象》焕新来袭，画面升级三端互通，能否唤回老玩家？

12-22

AG败者组力克KSG晋级，轩染一诺燃爆全场，钟意兰陵王成关键转折

12-21

打野前期谁称雄？阿古朵云缨裴擒虎上榜，云缨后期表现也亮眼

12-21

《坦克世界》2.1.1版本更新来袭新车登场老车焕新共掀战斗热潮

12-21