AI在阅读理解上首次击败人类
数十年来,研究人员一直追求对计算机系统进行语言理解培训。现在,科技巨头阿里巴巴和微软声称已朝着这一崇高目标迈出了第一步。两种系统均使用斯坦福大学的问答数据集进行了测试,该数据集基于500篇维基百科文章,共收集了100,000个问题,这已成为不同AI研究小组争夺第一个超越标准人类性能的战场。
向系统提供了有关各种主题的文章中的多个段落,然后根据可用信息提示他们回答许多问题。
目前的人类得分为82.3,而由阿里巴巴和微软构建的系统分别获得82.44和82.65分,以其头发的广度击败了他们的生物竞争对手。
“我们很荣幸能见证机器在阅读理解方面超越人类的里程碑。这意味着诸如“下雨的原因”这样的客观问题现在可以通过机器高精度地回答。”阿里巴巴自然语言处理首席科学家罗斯说。
一些新闻媒体已经掌握了新闻,声称人工智能现在可以比人类更好地阅读,甚至可以以前所未有的方式减少对人类输入的需求。
但是,正如许多其他评论员以及公司本身所指出的那样,这不是“真正的”理解。换句话说,这些算法不知道它们在“读”什么。
明显的理解源于系统识别文章中包含的模式和匹配术语的能力。
此外,系统仅被提供了来自维基百科的干净格式的材料,该材料被保证包含答案。用胡言乱语“污染”文本,或要求系统从几个句子中推断出含义,这会破坏流程,这意味着真正的理解仍然离我们很远。
不过,在此之前,研究人员希望尽快在博物馆,客户服务机构中实施类似设计的系统,这是一种旨在为医疗查询提供答案的在线系统。
此外,世界各地的研究团队目前正在训练AI系统,以解决SAT风格的数学问题和基础科学问题。
标签: AI