客服热线:189888977

载光芯片促进了机器学习— 集成光子张量核的并行卷积处理方法

2021-01-25 15:17:48浏览:849来源:中国激光网   

德国明斯特大学, 英国牛津大学,瑞士洛桑联邦理工学院,IBM欧洲研究中心,英国埃克塞特大学以及美国匹兹堡大学的研究人员合作,他们将光子结构与相变材料(PCM)结合在一起,演示了一种特定于计算的集成光子硬件加速器(张量核心),该加速器能够以每秒数万亿的乘法累加运算(每秒10^12 MAC运算或每秒tera-MAC)的速度运行。相关论文发表在《Nature》上。


图注,光运行的矩阵乘法处理器的示意图。 波导交叉开关阵列与光学频率梳一起,可以实现高度并行的数据处理。

尽管已经开发了各种定制的硅计算硬件,即现场可编程门阵列(fpga)、ASICs11和图形处理单元(gpu),以提高计算吞吐量和效率,但是它们仍然依赖于相同的底层电子元件,这些元件在速度和能量方面基本上受到焦耳热、电磁串扰和电容。电容控制能量消耗并限制神经网络硬件加速器的最大运行速度。这是因为,数据的移动(例如,经过训练的网络权重)而不是算术运算,需要芯片级金属互连的充放电。因此,如果计算期间的数据流不是同时寻址的,那么在设备级提高逻辑门的效率可在此类应用中提供较小的回报。即使是最近的发展,例如在模拟域中进行计算的忆阻交叉开关阵列,很有希望,但不具备并行化的矩阵向量乘法(MVM)操作的潜力,除非通过物理的方法复制矩阵元素。此外,它们也受到电子寻址的相同局限性的困扰,由于设备的可变性、循环性和漂移等问题,在制造和实施过程中还面临着其他的挑战。

集成光子学得益于集成电路的模块化和可扩展的制造方法,同时与电子技术相比具有两个关键优势:(1)通过波分复用(WDM)和多通道源(即光频梳)进行大规模并行数据传输;(2)极高的数据调制速度仅受片上光调制器和光电探测器带宽的限制。这些独特的光优势使得信息传输的光网络无处不在,目前正在彻底改变数据中心互连(即服务器到交换机的通信)。然而,这些发展对信息处理领域的数字电子技术提出了严峻的挑战。

尽管目前集成电子技术在计算领域占据主导地位,但一种不受电互连能量带宽权衡限制的专用光处理器可以将光网络的优势带到计算领域。这将通过低延迟(即以光速进行信息处理和传播)以及使用WDM的单个物理光学处理核心中的并行操作产生非常高的计算吞吐量,本质上是通过使用频率空间提供额外的缩放维度。尽管用于高效线性计算的自由空间光学概念(例如,傅里叶变换、卷积、矩阵乘法等)已经存在了几十年并继续启发计算体系结构,但对整个系统的光学相位的精确控制仍然是限制自由空间方法的可扩展性商业化的主要因素。

集成光子学有潜力解决这些挑战。然而,与CMOS兼容制造的集成是至关重要的:在芯片上,高能效的光学存储单元和紧凑的宽带多通道激光源都必须在可扩展的光子架构中结合在一起。最近关于MVM和神经形态计算的集成光子处理器的研究揭示了光子方法的潜在优势,但存在一些关键问题,例如大的封装外形(每个干涉仪单元11,000 μm^2),使用热光加热器来调谐其元件的相位以及组件的共振波长(对于环形谐振器和Mach–Zehnder干涉仪,每个加热器的平均范围分别为1 mW至10 mW)。此外,虽然已提出使用WDM在同一物理硬件中同时处理多个输入,但尚未在芯片上演示。

这里,研究人员设计并通过实验演示了一种可扩展的,与CMOS兼容的光子硬件加速器(称为“光子张量核”),它能够以光数据速率进行许多并行MVM操作,从而使用卷积滤波器处理图像,并使用小规模卷积神经网络(CNN)在MNIST数据库上对其进行测试。该方法采用:(1)使用集成在波导上的非易失性相变材料(PCM)在芯片上局部存储卷积核;(2)使用基于光子芯片的频率梳,采用WDM功能实现真正的内存光子计算。这克服了先前的光学计算方法受到缺乏集成的非易失性光子存储器以及缺乏用于并行卷积计算的多路复用能力的限制。这里所演示的光子张量核能够以每秒两次tera-MAC运算(每秒两万亿(10^12)MAC运算)的速度运行。通过采用最先进的铸造工艺进行适度缩放,甚至可以提高几个数量级,从而实现更快的操作。例如,使用占地较小且行业标准的绝缘体上硅平台,可以轻松将矩阵尺寸放大至40×40,并具有可接受的损耗。在光域中,利用超过13 GHz的高调制速度,计算密度可以达到每平方毫米400 TOPS以上,吞吐量超过每秒1 peta-MAC操作(每秒10^15 MAC操作)。

该方法的主要特点是,由于卷积运算是一种被动传输测量,因此理论上可以以非常低的功率(每MAC 17 fJ,仅考虑光学贡献)以光速进行计算,实验上仅受调制和检测带宽的限制。利用全光学系统固有的波分复用功能,快速并行化实现比电子设备具有更高的计算带宽,因为可以在单个时间步中处理多个像素甚至完整的图像。这种卷积处理方法为消除机器学习硬件中的计算瓶颈提供了有效的方法。

研究结果具有广泛的应用价值。例如,在人工智能领域,在节约能源的同时,可以同时处理更多的数据。使用更大的神经网络可以进行更精确的预测和更精确的数据分析。例如,光子处理器支持在医学诊断中评估大量数据,例如在特殊成像方法中产生的高分辨率3D数据中。进一步的应用是在自动驾驶车辆领域,这依赖于对传感器数据的快速评估,以及提供存储空间、计算能力或应用软件的IT基础设施,如云计算。

(责任编辑:CHINALASER)
下一篇:

专访飞博激光:稳中求变,领航激光应用新纪元

上一篇:

Nat. Commun.: 波导光反应器提高太阳能燃料的光子利用率

  • 信息二维码

    手机看新闻

  • 分享到
打赏
免责声明
• 
此文内容为本网站刊发或转载企业宣传资讯,仅代表作者个人观点,与本网无关。仅供读者参考,并请自行核实相关内容。涉及到版权或其他问题,请及时联系我们 189888977@qq.com