AI大模型挑战《宝可梦》:从游戏看AI的感知与学习之旅

   时间:2025-05-13 14:58 来源:ITBEAR作者:苏婉清

在人工智能的发展历程中,各大科技公司总能找到一种独特的方式来展示其最新成果——让AI玩游戏。这一传统做法不仅吸引眼球,还成为了衡量AI智能水平的重要标尺。从围棋界的AlphaGo到近期在《宝可梦》游戏中大放异彩的Gemini 2.5 Pro,AI与游戏的结合再次成为了科技界的热门话题。

十年前,围棋大师李世石与AlphaGo的较量震惊了世界,揭开了AI在游戏领域崭露头角的序幕。随后,谷歌的DeepMind团队在《DOTA2》和《星际争霸2》等复杂游戏中击败了人类职业选手,进一步证明了AI在游戏领域的潜力。2023年,英伟达推出的VOYAGER更是成功玩转《我的世界》,展现了AI在开放世界游戏中的探索能力。

然而,时至今日,让AI玩游戏早已不是新鲜事。那么,为何谷歌的Gemini 2.5 Pro独立通关初代《宝可梦》还能引起如此大的轰动呢?这背后涉及到一个被称为“莫拉维克悖论”的有趣现象:对人类来说简单直观的任务,对AI来说却可能异常复杂。

莫拉维克悖论指出,让电脑像成人一样下棋相对容易,但要让它拥有像一岁孩童般的感知和行动能力却极为困难。对于AI来说,独立通关《宝可梦》这样的休闲游戏,实际上是一个充满挑战的任务。它不仅需要AI理解复杂的游戏规则和属性克制系统,还需要具备感知环境、理解模糊目标以及长线规划行动的能力。

在今年早些时候,另一家AI科技公司Anthropic也尝试让旗下的AI Claude 3.7 Sonnet挑战初代《宝可梦》游戏。然而,这项实验最终以失败告终,Claude 3.7仅成功挑战了三个道馆并获得三枚徽章。尽管对人类玩家来说,这一成就微不足道,但却是Claude经过一年反复迭代才取得的成果。在这一年中,Claude经历了无数次的无意义探索、卡在地图死角以及与路人NPC的无效对话。

相比之下,Gemini 2.5 Pro的通关过程则显得更为高效和智能。它不仅在没有人类提供任何规则信息的条件下完成了游戏,而且总操作步数仅为约10.6万次,远低于Claude获得第三个徽章时的21.5万步。这一成绩不仅让Gemini成为了AI领域的热门话题,也引发了人们对AI智能水平的进一步思考。

值得注意的是,Claude和Gemini的成功并非偶然。它们背后都依赖于先进的大语言模型技术和强大的代理执行框架。这些技术使得AI能够不断接收游戏画面、理解不同阶段的规则,并将决策转换为游戏操作。然而,与之前的AI相比,Claude和Gemini更注重于展示AI的感知和行动能力,而非单纯地在策略游戏中击败人类选手。

在Claude的通关过程中,观众可以清晰地看到AI的每一步决策和思考过程。例如,当Claude在游戏的“月见山”地图中迷路时,它做出了一个非常“人类化”的选择:故意输掉一场战斗以被传送回宝可梦中心,从而按之前验证的路径前往下一个目的地。这种思维方式不仅展示了AI的灵活性,也让人看到了AI在解决复杂问题方面的潜力。

同样地,Gemini在通关过程中也展现出了其强大的感知和学习能力。它不仅能够准确地理解游戏画面中的每一个坐标点信息,还能够根据这些信息制定出合理的行动策略。这种能力使得Gemini能够在没有人类干预的情况下独立完成游戏,从而证明了其独立学习和解决复杂问题的能力。

从围棋到《宝可梦》,AI在游戏领域的不断突破不仅展示了其日益增长的智能水平,也揭示了AI技术的发展方向。未来的AI将不再局限于处理单一问题的专才,而是能够自我学习、解决不同领域问题的通用人工智能。这一转变不仅将改变我们的工作方式和生活方式,还将为人类社会带来前所未有的发展机遇。

对于AI科技公司来说,选择《宝可梦》这样的游戏作为训练对象并非偶然。这款游戏不仅充满了成长、选择与冒险的元素,还考验着AI的感知、理解和行动能力。通过让AI在游戏中不断学习和探索,我们可以更好地了解AI的智能水平和潜在能力,从而为未来的AI应用和发展奠定坚实的基础。

 
 
更多>同类内容
全站最新
热门内容