近期,人工智能领域迎来了一项引人注目的成就:谷歌最先进的AI模型Gemini 2.5 Pro成功挑战并完成了1996年发布的经典电子游戏《宝可梦蓝》。这一消息由谷歌首席执行官桑达尔·皮查伊在一场直播活动中兴奋地宣布,瞬间引起了广泛关注。
据透露,这场名为“Gemini Plays Pokemon”的直播活动是由一位30岁的软件工程师Joel Z发起的,尽管他并非谷歌员工,但谷歌高层对此次尝试给予了全力支持。谷歌AI Studio的产品负责人洛根·基尔帕特里克此前曾透露,Gemini在《宝可梦》系列游戏上取得了显著进展,特别是在获得游戏徽章方面,Gemini已经成功获得了第五个徽章,这一成绩甚至超过了其他表现第二好的模型,后者仅获得了三个徽章,不过值得注意的是,它们使用的是不同的代理框架。
皮查伊在直播中幽默地表示:“我们正在开发API,也就是人工宝可梦智能,让AI能够更好地理解和玩转这款游戏。”这一言论不仅展示了谷歌对AI技术的自信,也透露出他们对未来AI在游戏领域应用的期待。
为何谷歌会选择《宝可梦》这款游戏作为挑战对象呢?其实,早在今年2月,另一家人工智能公司Anthropic就曾宣布其Claude AI模型在《宝可梦红》中的出色表现,并强调了Claude在“深度思考和代理训练”方面的优势。然而,尽管Claude在应对复杂任务时表现出色,但它似乎尚未成功通关《宝可梦红》。这是否意味着Gemini在游戏方面的表现更胜一筹呢?
对此,Joel Z在他的Twitch页面上进行了澄清:“请不要将Gemini和Claude的表现直接进行比较,因为它们使用的是不同的工具和框架,接收到的信息也有所不同。”他强调,两款AI模型都需要借助代理框架来玩游戏,这些框架通过提供带有额外信息的游戏截图来帮助模型做出决策。
在帮助Gemini完成游戏的过程中,Joel Z承认他进行了一些“开发干预”,但他坚决否认这是作弊行为。他表示:“我的干预是为了提升Gemini的整体决策和推理能力,而不是给出具体提示词或攻略。”他进一步解释说,他唯一告诉Gemini的是在与火箭队小兵对话时需要两次才能获得升空钥匙,这是一个在《宝可梦黄》中已被修复的漏洞。
最后,Joel Z表示:“Gemini Plays Pokémon仍在积极开发中,其框架也在不断演变和完善中。”这一表态让人们对Gemini未来的表现充满了期待。