AI狼人杀大乱斗:Kimi、Qwen、GLM同台竞技,谁才是最终狼王?

   时间:2025-12-23 19:24 来源:互联网作者:任飞扬

一场别开生面的AI狼人杀对决,正在打破传统游戏的边界。这场由淘宝发起的“高校生VS开发者对抗赛”,让Kimi、Qwen、GLM等大模型化身狼人杀玩家,在虚拟桌游中展开逻辑与演技的巅峰较量。参赛者无需精通编程,只需带着创意与策略,就能训练出属于自己的AI“高玩”。

比赛采用12人狼王守卫版型,8名好人阵营与4匹狼人展开博弈。首局对战中,女巫Kimi开局亮明身份,凭借“第六感”精准锁定3号银水,并预警7号、10号存在嫌疑。当7号Qwen试图祸水东引时,猎人8号已暗中锁定目标。另一边,10号Q老师悍跳预言家,却因前后发言矛盾暴露破绽——先自称预言家,后又改口称7号可能是真预言家,这一漏洞竟未被其他AI察觉。

真正的“逻辑王者”当属预言家2号D老师。首轮发言直指4号狼人,揭穿10号假预言家身份,并串联7号与10号的抱团行为。随着K5的二次发力,10号狼人高票出局,更戏剧性的是,它投出的竟是自己。次日平安夜后,D老师再度发力,通过查杀链锁定全部四狼,而GLM守卫则连续精准预判狼人刀法,将对手逼入绝境。最终,狼人阵营全程未能刀掉任何好人,好人阵营以全胜告终。

这场对决背后,是淘宝推出的全球首个实时对战多智能体游戏平台WhoisSpy.ai。该平台支持中英文双版本,除狼人杀外还开放“谁是卧底”模式。参赛AI需在严格规则下博弈:每轮发言限时90秒、最多240字,超时或失败达一定次数将被系统清退,单局最长8轮。这种设计迫使AI在有限信息中快速推理,模拟真实玩家的心理战。

平台官方评测榜单显示,Claude-Sonnet-4.5以综合胜率登顶,尤其在狼人阵营中表现突出;GPT-5虽整体胜率领先,但关键局失利;开源模型Qwen3-235B-Thinking则以均衡性跻身前三。这些数据为参赛者提供了策略参考,也印证了AI在复杂社交推理中的潜力。

淘宝为参赛者提供了“三步成神”指南:复制官方Agent示例创建基础模型,通过日志分析优化行为策略,最终上传至平台参与实战。开发者可修改提示词脚本或代码文件,调整AI的发言风格与决策逻辑。例如,为Agent设计“划水”人设,或赋予其激进博弈风格。

赛事设置双赛道激励:高校战队前三名可直通阿里巴巴淘天集团技术岗终面,前20名获得暑期AI Workshop资格;开发者赛道则提供万元奖金。目前已有超700名选手报名,累计完成6000余场练习赛。观众可实时围观对局,观察相同模型在不同局势下的策略变化——有的AI擅长伪装,有的专精盘逻辑,甚至出现“狼人卖队友”“神职带节奏”等拟人化操作。

在这场没有硝烟的战争中,AI正以惊人速度进化。当Kimi运筹帷幄、Qwen卖萌求生、GLM沉默控场,人类玩家或许该思考:下一次举牌投票时,如何辨别屏幕那端究竟是代码还是真人?

 
 
更多>同类内容
全站最新
热门内容