更新时间:2025-05-17 16:42作者:佚名
麻省理工学院科学家设计的新光子芯片在光学上执行所有深神经网络计算,在纳秒内完成任务,精度超过92。这将彻底改变高需求计算应用程序,并为可以实时学*的高速处理器打开大门。
研究人员展示了一个完全集成的光子处理器,它在芯片上光学地执行了深神经网络的所有关键计算,从而使计算机需要的应用程序(例如LIDAR或高速通信)更快,更节能的深度学*。图像来源:Sampson Wilcox,电子研究实验室。

深度神经网络是当今最先进的机器学*应用程序背后的推动力,它变得如此大而复杂,以至于它推动了传统电子计算硬件的限制。
Photon硬件使用光而不是电力来执行机器学*计算,从而提供了更快,更节能的解决方案。但是,光子设备很难实施某些神经网络操作,这些神经网络操作必须依靠外部电子设备,这会减慢处理速度并降低效率。
经过十年的研究,麻省理工学院和合作伙伴机构的科学家开发了一个突破性的光子芯片,以克服这些挑战。他们展示了一个完全集成的光子处理器,能够充分利用光来执行所有基本的深神经网络计算,而无需外部处理。该光学设备能够完成不到一半纳秒的机器学*分类任务的关键计算,同时获得与传统硬件可比的92以上的精度。
该芯片由互连模块组成,并使用商业铸造工艺制造,可以实现技术的扩展并与电子产品集成。
从长远来看,光子处理器可以将更快,更节能的深度学*带入计算苛刻的应用,例如LIDAR,天文学和粒子物理学科学研究或高速通信。
\'在许多情况下,模型的性能并不是唯一重要的事情,重要的是您可以得到答案的速度。 \'现在,我们拥有一个可以在纳秒时间尺度上运行光学的神经网络的端到端系统,我们可以开始在更高级别上考虑应用程序和算法。 \'
与Bandyopadhyay合作也是:Alexander Sludds(18、19、23、2019、2019);尼古拉斯·哈里斯(Nicholas Harris)(17,2017);达里乌斯·邦达达(Darius Bunandar)(19,2019); Stefan Krastanov(前RLE研究科学家,马萨诸塞大学阿默斯特大学现任助理教授); NTT研究公司Ryan Hamerly的访问科学家和高级科学家; Matthew Streshinsky,诺基亚硅光子学的前负责人,现为Enosemi的联合创始人兼首席执行官; Periplous,LLC总裁Michael Hochberg;电子工程和计算机科学系教授,量子光子学和人工智能小组的首席研究员和该论文的高级作者RLE。研究结果于12月2日在自然光子学上发表。
使用光进行机器学*
深神经网络由多个互连节点或神经元的神经元组成,这些节点或对输入数据进行操作以产生输出。深神经网络的一个关键操作是使用线性代数执行矩阵乘法,将数据从一层传递到另一层时转换数据。
但是,除了这些线性操作外,深度神经网络还可以执行非线性操作,帮助模型学*更多复杂的模式。非线性操作(例如激活功能)为深度神经网络提供了解决复杂问题的能力。
2017年,Englund的研究团队以及Cecil和Ada Greene的物理学教授Marin Solakic的研究人员在单个光子芯片上展示了一个光学神经网络,可以用光执行矩阵乘法。但是当时,该设备无法在芯片上执行非线性操作。光学数据必须转换为电信号,并发送到数字处理器以执行非线性操作。
\'光学中的非线性非常具有挑战性,因为光子不容易相互作用。 \'bandyopadhyay解释了:\'这使触发光学非线性非常耗费,因此构建可以以可扩展方式实现非线性的系统非常具有挑战性。 \'
他们通过设计一种称为非线性光学功能单元(NOFUS)的设备来克服这一挑战,该设备结合了电子设备和光学功能,以在芯片上实现非线性操作。研究人员使用三层设备在光子芯片上建立了光学深神经网络,以执行线性和非线性操作。
完全集成的网络
首先,他们的系统将深神经网络的参数编码为光。然后在2017年论文中介绍的可编程光谱仪阵列,然后对这些输入执行矩阵乘法。然后,数据输入可编程的NOFU,该NOFU通过将少量的光线滴到光电二极管中,从而实现非线性函数,从而将光学信号转换为电流。此过程不需要外部放大器,并且消耗了极低的能量。
\'我们在光域中,直到答案最终读出。 \'Bandyopadhyay说,这使我们能够达到超低潜伏期。
实施如此低的延迟使他们能够在芯片上有效地训练深层神经网络,这是一个被称为现场训练的过程,通常会消耗数字硬件的大量能量。这特别适用于执行光学信号内处理(例如导航或电信)的系统,以及想要实时学*的系统。
光子系统在训练测试中的精度超过96,推理的精度超过92,这与传统硬件相当。此外,芯片可以在不到一半的纳秒中完成关键计算。
这项工作表明,计算(本质上,输入到输出的映射)可以编译为线性和非线性物理的新体系结构,从而在计算和所需的工作负载之间实现了根本不同的比例定律。整个电路都是使用与CMOS计算机芯片的生产相同的基础设施和铸造工艺制造的。这允许使用成熟的技术大规模制造芯片,这些技术在制造过程中引入了很少的错误。
扩展设备并将其与实际的电子设备(例如相机或电信系统)集成在一起将是未来工作的重点。此外,研究人员希望探索可以使用光学优势更快,更节能地训练系统的算法。
从/scitechdaily编译