基于语法的扎根词典学习
发布日期:2022-02-21 09:52:26
导读 人类从几个语法示例中学习新词的基础和组合表示。我们依赖于上下文,例如视觉感知,并且我们知道这些词在构成句子的含义时是如何相互关联的
人类从几个语法示例中学习新词的基础和组合表示。我们依赖于上下文,例如视觉感知,并且我们知道这些词在构成句子的含义时是如何相互关联的。
最近关于arXiv.org的一篇论文依赖于这些关于机器学习语言的想法。
提出了基于语法的基础词汇学习,一种用于基础语言习得的神经符号框架。研究人员研究联合学习基于神经符号的词典条目以及从基于语言数据的单个概念的基础,例如通过同时查看图像和阅读平行的问答对。
系统评估表明,该方法能够以强大的数据效率和对新语言结构和更深语言结构的组合泛化进行学习。
我们提出了基于语法的扎根词典学习(G2L2),这是一种词汇主义方法,用于从扎根数据(例如成对的图像和文本)中学习语言的组合和扎根意义表示。G2L2的核心是词汇条目的集合,它们将每个单词映射到句法类型的元组和神经符号语义程序。例如,闪亮这个词有一个句法类型的形容词;它的神经符号语义程序具有符号形式{\lambda}x。filter(x,SHINY),其中SHINY概念与神经网络嵌入相关联,用于对闪亮对象进行分类。给定一个输入句子,G2L2首先查找与每个标记关联的词典条目。然后,它通过组合基于句法的词汇含义,将句子的含义推导出为可执行的神经符号程序。恢复的意义程序可以在接地输入上执行。为了促进在指数增长的组合空间中学习,我们引入了一种联合解析和预期执行算法,该算法对推导进行局部边缘化以减少训练时间。我们在两个领域评估G2L2:视觉推理和语言驱动的导航。结果表明,G2L2可以从少量数据泛化到新的单词组合。
标签: