导读
近日,美国东北大学刘咏民教授的课题组与佐治亚理工学院、普渡大学的合作者在光学领域顶级期刊《Nature Photonics》上发表综述文章“Deep learning for the design of photonic structures”,系统回顾了近年来基于深度学习的光子学结构设计这一蓬勃发展的新兴领域的最新研究进展(文章链接:https://www.nature.com/articles/s41566-020-0685-y)。论文第一作者为美国东北大学博士后马蔚(现为浙江大学特聘研究员),通讯作者为美国东北大学刘咏民教授、佐治亚理工学院蔡文山教授和普渡大学Alexandra Boltasseva教授,佐治亚理工学院的Zhaocheng Liu博士和普渡大学的Zhaxylyk A. Kudyshev博士亦对本文的撰写有重要贡献。
研究背景
光子学结构设计是光电子器件和系统设计的核心。许多人工设计的光子学结构,比如超构材料、光子晶体、等离激元纳米结构等,已经在高速光通信、高灵敏度传感和高效能源收集及转换中得到了广泛应用。然而,在该领域中通用的设计方法是基于简化的物理解析模型及相关经验完成的。尽管这种方法可以得到所需的光学响应,但其从本质上说是基于错误的反复尝试(trial-and-error)并且通常依赖于耗时的数值计算来完成,从而导致效率很低并且很可能错过最佳的设计参数。
在过去的几年中,统计机器学习方法在语言识别、机器视觉、自然语言处理等领域发展迅速。利用多层神经网络的深度学习更是近年来该领域的最火热的方法之一。深度学习通过数据驱动的思想建模,不直接引入人为设定的规则,而是从大量数据中学习得到研究目标的规律与特征。这为解决上述光子学结构设计面临的问题提供了崭新的方向。本综述论文从不同的深度学习模型结构出发,分类介绍了不同模型在光子学设计领域中的适用范围和选择依据,同时对比了深度学习模型与常规反向设计方法的区别与优劣,最后对该领域未来的发展趋势做出了展望。
图一. 以数据驱动的建模思想作为基础,对于超构材料、光子晶体、等离激元纳米结构及硅光器件可以设计相应的深度学习模型建立其光学响应(偏振、波长、相位、轨道角动量等)与结构设计(材料、几何形状、空间分布等)之间的联系。
创新研究
1.多层感知机模型
多层感知机是最基本的一种神经网络模型,由多层的全连接神经元组成,通过训练后,可以有效建立起输入到输出的映射关系。在光子学结构设计中,往往采用两个首尾相连的双向神经网络结构,同时实现光学响应的正向预测和光子结构的反向设计,图二给出了利用多层感知机对等离激元纳米结构、手性超构材料、多层纳米小球、光学拓扑绝缘体及硅基光电子器件等光子学结构的设计结果。
图二. 基于多层感知机的深度学习模型在光子学结构设计中的应用。
2.其他先进的深度学习模型
多层感知机虽然结构简单且训练容易,但由于仅仅采用了全连接的结构,并不能适用于所有的光子结构设计问题。本小节回顾了其他一些更先进的深度学习模型结构及其在光子结构设计中的应用,例如卷积神经网络可以有效捕捉局部关联的特征,循环神经网络适用于时间序列特性的预测,深度生成模型可以通过概率生成的方式实现结构化输出,解决设计中的一对多问题。图三给出了这些先进深度学习模型框架在光子学设计中的应用。
图三. 卷积神经网络、循环神经网络、深度生成模型等先进深度学习模型在光子学结构设计中的应用。
3.深度学习模型与其他优化算法的融合
深度学习模型本身是数据驱动的模型,一旦训练完成便可以针对需求进行快速的设计和优化,这与常规的数值优化算法是完全不同的。因此可以利用常规数值优化算法针对单个目标迭代优化的方式,与深度学习数据驱动的方式相结合。比如利用生成对抗网络与拓扑优化结合、自编码器与遗传算法结合等,可以更高效、准确地解决光子学结构的设计问题。
图四. 深度学习模型与其他优化算法相结合解决光子学结构的设计问题。
总 结
本综述文章介绍了深度学习在光子学结构设计中的应用。作为数据驱动的模型范式,深度学习在光子学结构设计、光学性能预测及优化中都有着出色表现,但同时也面临着新的挑战与机遇。例如,如何利用深度学习模型的泛化能力去表征除了光谱之外更复杂的光学特性,如何解决或缓解深度学习模型对训练数据量的要求,如何将深度学习与其他优化算法相结合去发掘更大设计空间中的全局最优解等等。相信随着后续的深入研究,深度学习在光子学结构设计中将被更广泛使用,从而形成一套高速、准确的光子学设计新框架,同时有望突破常规经验设计无法完成的设计任务。