人工神经元设备可以缩小神经网络硬件的能耗和尺寸
由于加州大学圣地亚哥分校的研究人员开发了一种新的人工神经元设备,训练神经网络执行任务,例如识别图像或导航自动驾驶汽车,有一天可能需要更少的计算能力和硬件。该设备可以使用比现有基于 CMOS 的硬件少 100 到 1000 倍的能量和面积来运行神经网络计算。
神经网络是一系列连接的人工神经元层,其中一层的输出为下一层提供输入。通过应用称为非线性激活函数的数学计算来生成该输入。这是运行神经网络的关键部分。但是应用这个功能需要大量的计算能力和电路,因为它涉及在两个独立的单元——内存和外部处理器之间来回传输数据。
现在,加州大学圣地亚哥分校的研究人员已经开发出一种纳米尺寸的设备,可以有效地执行激活功能。
“随着神经网络模型变得越来越大和越来越复杂,硬件中的神经网络计算变得越来越低效,”通讯作者、加州大学圣地亚哥雅各布斯工程学院电气和计算机工程教授 Duygu Kuzum 说。“我们开发了一种单一的纳米级人工神经元设备,可以以非常节省空间和能源的方式在硬件中实现这些计算。”
这项新研究是加州大学圣地亚哥分校电气和计算机工程系(由库祖姆领导,他是该大学机器集成计算和安全中心的一部分 )和美国能源部能源前沿研究中心 (EFRC) 的研究人员合作进行的。由物理学教授 Ivan Schuller 领导),专注于开发节能人工神经网络的硬件实现。
左:突触设备阵列(顶部)和激活或神经元设备阵列(底部)的特写。右图:使用两个阵列构建的定制印刷电路板。图片来源:加州大学圣地亚哥分校
该设备实现了神经网络训练中最常用的激活函数之一,称为整流线性单元。这个功能的特别之处在于它需要能够经历电阻逐渐变化的硬件才能工作。而这正是加州大学圣地亚哥分校的研究人员设计他们的设备的目的——它可以逐渐从绝缘状态转换为导电状态,并且需要一点热量的帮助。
这个开关就是所谓的莫特过渡。它发生在纳米级的二氧化钒层中。在该层之上是由钛和金制成的纳米线加热器。当电流流过纳米线时,二氧化钒层会慢慢升温,导致从绝缘到导电的缓慢、受控的转换。
“这种设备架构非常有趣和创新,”第一作者、电气和计算机工程博士 Sangheon Oh 说。Kuzum 实验室的学生。他解释说,通常情况下,莫特转变中的材料会经历从绝缘到导电的突然转换,因为电流直接流过材料。“在这种情况下,我们将电流流过材料顶部的纳米线以加热它并引起非常缓慢的电阻变化。”
为了实施该设备,研究人员首先制造了一系列这些所谓的激活(或神经元)设备,以及一个突触设备阵列。然后他们将这两个阵列集成在定制的印刷电路板上,并将它们连接在一起以创建神经网络的硬件版本。
研究人员使用该网络来处理图像——在这种情况下,是加州大学圣地亚哥分校 Geisel 图书馆的照片。该网络执行一种称为边缘检测的图像处理,可识别图像中对象的轮廓或边缘。该实验表明,集成硬件系统可以执行许多类型的深度神经网络必不可少的卷积运算。
研究人员表示,该技术可以进一步扩展以执行更复杂的任务,例如自动驾驶汽车中的面部和物体识别。Kuzum 指出,如果有行业的兴趣和合作,这可能会发生。
“现在,这是一个概念证明,”库祖姆说。“这是一个很小的系统,我们只将一个突触层和一个激活层堆叠在一起。通过将更多这些堆叠在一起,您可以为不同的应用程序制作更复杂的系统。”
标签: