在AI技术的不断推动下,虚拟世界的边界正被无限拓宽。近日,昆仑万维推出了一款名为Matrix-Game的交互式世界模型,它能够让用户仅凭简单的键鼠操作,在《我的世界》等游戏环境中自由探索与创作,生成细节丰富且符合物理规律的虚拟内容。
Matrix-Game的核心在于其实时生成的能力。不同于传统方法中需要手写代码和渲染视觉效果的繁琐过程,Matrix-Game利用AI技术,在用户与环境交互的瞬间,实时生成出连贯且逼真的画面内容。无论是砍伐树木、切换视角,还是跳跃等动作,都能得到稳定且符合自然规律的画面反馈。
为了实现这一功能,Matrix-Game构建了一个名为Matrix-Game-MC的大规模交互世界数据集。该数据集包含了大量Minecraft游戏视频和带有键盘与鼠标控制信号的可控视频数据,这些数据为模型提供了丰富的训练素材,使其能够同时学习复杂环境动态和交互模式。
在模型架构上,Matrix-Game采用了基于扩散模型的核心框架。它首先通过图像到世界建模,将单张图像作为生成交互式视频的起点,并结合用户动作输入,生成虚拟游戏世界的视频内容。随后,通过自回归式视频生成,模型能够持续生成高一致性长视频内容,确保时间上的连贯性。同时,可控交互设计的引入,使得模型能够准确响应用户输入的控制信号,实现交互可控性。
为了系统性评估和比较交互式世界生成模型的性能,Matrix-Game还提出了一套名为GameWorld Score的评测体系。该评测体系从感知质量、控制能力、物理合理性等多个维度对模型进行全方位衡量,确保生成的虚拟世界既逼真又可控。
在实际应用中,Matrix-Game展现出了巨大的潜力。它不仅能够在虚拟游戏世界中快速搭建场景,还能为影视制作、元宇宙内容生产以及具身智能体训练提供高质量的虚拟视频内容或虚拟环境。这一技术的出现,无疑将极大地降低内容生产的成本,提高生产效率。
在Matrix-Game的评测系统中,它全面超越了现有开源基线模型,在视觉质量、时间一致性、动作可控性与物理规则理解四大维度上均取得了领先成绩。用户也更倾向于选择Matrix-Game生成的视频,总体偏好率高达96.3%。这一结果充分证明了Matrix-Game在交互式世界生成领域的领先地位。
随着AI技术的不断发展,空间智能已经成为当下热议的方向。昆仑万维推出的Matrix-Game正是这一领域的杰出代表。它不仅展示了AI在3D世界生成方面的强大能力,还为虚拟世界的探索与创作提供了新的可能。未来,随着技术的不断进步和应用场景的不断拓展,Matrix-Game有望在更多领域发挥重要作用。
同时,国内外大厂巨头也纷纷押注3D AIGC领域,如谷歌DeepMind、腾讯等都在该领域进行前沿布局。这一趋势表明,3D AIGC已经成为未来AI发展的重要方向之一。而Matrix-Game的推出,无疑为这一领域注入了新的活力。