谷歌研究人员推出Genie种知道如何从示例图像创建迷你游戏场景的人工智能
谷歌DeepMind研究人员推出了Genie——世界上第一个生成交互环境人工智能。该人工智能可以查看示例2D平台游戏的图像,然后创建可玩的迷你游戏场景。人工智能不需要额外的输入来做到这一点。
谷歌DeepMind的研究人员推出了Genie,世界上第一个生成交互环境人工智能。人工智能可以在查看示例游戏的图像后创建一个可玩的场景。这为游戏玩家无需编程即可创建可玩游戏打开了大门。
Genie通过查看30,000小时的视频(680万个16秒的剪辑)接受了2D平台游戏的训练。人工智能通过将视频图像和它看到的动作表示为一组数字来简化它所看到的内容,就像人类使用文字来描述游戏场景一样。
经过训练后,Genie只需要一个游戏场景示例即可创建可玩的迷你场景。在幕后,人工智能可以使用复杂的方法来扩展起始图像,以生成图像的缺失部分,因此Genie可以随着玩家的前进绘制游戏世界的新部分。它通过参考所见过的数百万个剪辑,同时赋予角色可玩的动作(例如奔跑或跳跃)来实现这一点。
重要的是,精灵通过观看游戏玩法来学习动作,而不是让人类指出这一点。因此,当有一座有间隙的桥梁时,人工智能会根据所看到的情况知道角色可能需要跳过间隙,并且当人类玩家按下控制器上的向上按钮时就会这样做。
这一切都需要巨大的计算能力来进行训练(在具有数百个芯片的计算机上进行数周的数千万亿次浮点运算)和游戏,而这只能以超慢的每秒1帧的速度完成。
对于具有技术头脑的人来说,视频帧和推断的潜在动作可以使用vandenOord的VQ-VAE进行标记化。用户指定的潜在动作以及标记化视频帧被输入到动态模型中,利用Chang的MaskGIT转换器生成迭代帧标记,这些迭代帧标记用于利用Gupta的MaskViT生成输出视频。Xu采用的ST变换器自始至终都使用了时间注意力和空间注意力,以改进预测并减少内存需求。
因此,在计算机功能强大到可以完全独立创建2D平台游戏的那一天到来之前,请使用手持游戏机享受经典平台游戏(就像亚马逊的这款游戏)。
标签: