一个经过训练的人工智能系统可以在网络游戏中找到公平的公共资金分配政策
发布日期:2022-07-06 16:59:38
导读 伦敦DeepMind的一组研究人员与埃克塞特大学、伦敦大学学院和牛津大学的同事合作,训练了一个人工智能系统,以找到在网络游戏中公平分配公共
伦敦DeepMind的一组研究人员与埃克塞特大学、伦敦大学学院和牛津大学的同事合作,训练了一个人工智能系统,以找到在网络游戏中公平分配公共资金的政策。在他们发表在《自然人类行为》杂志上的论文中,该小组描述了他们训练系统并讨论在他们的努力中提出的问题的方法。
社会如何分配财富是人类几千年来不得不面对的问题。尽管如此,大多数经济学家都会同意,目前还没有建立一个所有成员都对现状感到满意的体系。收入水平一直不公平,最高的人最满意,而最低的人最不满意。在这项最新研究中,英格兰的研究人员采用了一种新方法来解决这个问题——要求计算机采用一种更合乎逻辑的方法。
研究人员首先假设民主社会,尽管存在缺陷,但迄今为止是那些尝试过的社会中最令人愉快的。然后他们在志愿者的帮助下玩了一个简单的资源分配游戏——游戏的玩家共同决定了分享他们共同资源的最佳方式。为了更加真实,玩家一开始就获得了不同数量的资源,并且有不同的分配方案可供选择。研究人员与不同的志愿者群体多次运行该游戏。然后,他们使用来自所有游戏的数据来训练几个人工智能系统,了解人类共同努力寻找解决此类问题的方法。接下来,他们让人工智能系统互相玩类似的游戏,允许在多次迭代中进行调整和学习。
研究人员发现,人工智能系统已经确定了一种自由平等主义的形式,在这种形式中,玩家获得的资源很少,除非他们按比例为社区池做出大量贡献。然后,研究人员通过让一组人类志愿者玩和以前一样的游戏来完成他们的研究,只是这一次,他们可以选择使用几种传统共享方法中的一种,或者使用人工智能系统开发的一种——即设计的那种。AI系统是人类玩家的一致选择。
标签: