突破性的光学传感器模仿人眼这是迈向更好人工智能的关键一步
俄勒冈州立大学的研究人员正在通过一种新型的光学传感器取得重大进展,这种新型光学传感器可以更紧密地模仿人眼感知其视野变化的能力。该传感器是图像识别,机器人技术和人工智能等领域的重大突破。OSU工程学院研究员John Labram和研究生Cinthya Trujillo Herrera的发现发表在《应用物理快报》上。
电机工程和计算机科学助理教授拉布拉姆说,以前尝试制造人眼类型的设备(称为视网膜视传感器)是依靠软件或复杂的硬件。但是,新传感器的操作是其基础设计的一部分,该技术使用了钙钛矿半导体的超薄层(近年来已广泛研究其太阳能潜力),当置于光线下时,它会从坚固的电绝缘体变为坚固的导体。
拉布拉姆说:“您可以将其视为单像素处理,而现在需要微处理器来完成。”在国家科学基金会的支持下领导研究工作的拉布拉姆说。
Labram说,新的传感器可能与神经形态计算机完美匹配,后者将为自动驾驶汽车,机器人技术和高级图像识别等应用中的下一代人工智能提供动力。与传统的计算机按一系列指令顺序处理信息的传统计算机不同,神经形态计算机被设计为模拟人脑的大规模并行网络。
Labram说:“人们已经尝试在硬件中复制它,并且已经相当成功。” “但是,即使用于处理信息的算法和体系结构变得越来越像人的大脑,但这些系统接收的信息仍然绝对是为传统计算机设计的。”
换句话说:为了发挥其全部潜能,一台更像人脑的“思维”计算机需要一个像“人眼”的“视觉”图像传感器。
眼睛是一个非常复杂的器官,包含约1亿个感光器。但是,视神经与大脑的连接只有一百万。这意味着在可以传输图像之前,必须在视网膜中进行大量的预处理和动态压缩。
事实证明,我们的视觉特别适合检测运动物体,对静态图像的兴趣相对较小,拉布拉姆说。因此,我们的光学电路优先考虑来自感光器的信号,这些信号检测光强度的变化–您可以凝视某个固定点,直到外围视觉中的物体开始消失,从而证明这一点,这种现象被称为Troxler效应。
Labram说,传统的传感技术,如数码相机和智能手机中的芯片,更适合顺序处理。图像以设定的频率逐像素地扫描传感器的二维阵列。每个传感器产生的信号幅度都随其接收的光强度而直接变化,这意味着静态图像将导致传感器产生或多或少的恒定输出电压。
相比之下,视网膜形态传感器在静态条件下保持相对安静。当检测到光照变化时,它会记录一个短而尖锐的信号,然后迅速恢复到其基线状态。这种行为归因于一类称为钙钛矿的半导体的独特光电性能,这些半导体已显示出作为下一代低成本太阳能电池材料的巨大希望。
在Labram的视网膜形态传感器中,钙钛矿被应用在厚度仅为几百纳米的超薄层中,其本质上是充当电容器,可在光照下改变其电容。电容器将能量存储在电场中。
他说:“测试的方法基本上是,将其在黑暗中放置一秒钟,然后打开灯,然后将它们保持打开状态。” “一旦灯亮着,就会出现这个大的电压尖峰,即使灯的强度恒定,电压也会迅速衰减。这就是我们想要的。”
尽管Labram的实验室目前一次只能测试一个传感器,但他的团队测量了许多设备并开发了一个数值模型来复制它们的行为,从而得出Labram认为理论与实验之间的“良好匹配”。
这使该团队能够模拟一系列视网膜形传感器,以预测视网膜形摄像机如何响应输入刺激。
Labram说:“我们可以将视频转换为一组光强度,然后将其用于仿真中。” “从传感器预测有较高电压输出的区域会变亮,而较低电压区域则保持黑暗。如果摄像机是相对静止的,则可以清楚地看到所有移动的物体都具有强烈的响应。这在哺乳动物的光学传感范例中保持合理。”
使用棒球练习镜头进行的模拟演示了预期的结果:内场的球员显示为清晰可见,明亮的运动物体。相对静止的物体(棒球钻石,看台,甚至外野手)会褪入黑暗。
更加引人注目的模拟显示,一只鸟飞进了视野,然后停在一个看不见的喂鸟器上,几乎消失了。鸟在起飞时重新出现。设置为摇摆的进纸器仅在开始移动时才可见。
Labram说:“好消息是,通过这种模拟,我们可以将任何视频输入这些阵列之一,并以与人眼基本相同的方式处理信息。” “例如,您可以想象机器人跟踪物体运动所使用的这些传感器。在其视场中任何静态的东西都不会引起响应,但是,移动的物体会产生高压。这将立即告诉机器人对象在哪里,而无需任何复杂的图像处理。”
标签: