“光子关联学习芯片有望让自动驾驶节约百倍的算法训练成本,同时拥有激光雷达(LIDAR)般的响应推理速度。”
—— 程增光(光本位联合创始人 复旦大学研究员)

图源:程增光
「大多数人工智能系统中使用的神经网络在学习过程中需要大量数据示例——训练一个可以识别猫的模型可能使用多达 10,000 张猫/非猫图像——计算和处理成本很高。在使用关联学习处理的光学AI芯片后,在使用仅10副猫图像经过5轮的训练后,该系统便能够区分猫和非猫图像。这一结果表明,人工关联学习系统可以快速地适应这一简单任务,而不需要像一些传统的人工神经网络(ANN)那样需要数千张图像的训练集。同时,其速度比在电学处理器上运行的传统机器学习算法快1000倍。」
一个多世纪前,伊万·巴甫洛夫在一项经典条件反射实验中展示了狗如何学会将铃声与食物联系起来,从而通过铃声产生流涎。今天,尽管其他学习概念,特别是基于反向传播的人工神经网络 (ANN)已经蓬勃发展,但很少发现将巴甫洛夫式联想学习用于人工智能(AI)应用。然而,在“传统”人工神经网络上使用反向传播方法进行训练,尤其是在深度神经网络中,需要消耗巨大的算力和能耗。
近日,牛津大学、复旦大学、英国埃克塞特和德国明斯特大学的研究人员合作开发了一种片上光学AI处理芯片,该芯片能够检测数据集中的相似性,速度比在电学处理器上运行的传统机器学习算法快1000倍。光本位联合创始人、首席科学家程增光研究员为该研究共同第一作者。他们通过实验证明了一种使用关联学习器件的无反向传播学习(Backpropagation-Free)形式。
基于硅基集成光子平台,将硫系相变材料薄膜与片上级联定向耦合器相结合构建了关联学习单元(Associative Monadic Learning Element, AMLE)。然后,将多个AMLE集成到硅光平台,形成扩展的关联学习处理的光学AI芯片,该硬件提供了一个基于关联学习的独特机器学习框架,尤其是可以使用无反向传播架构来解决一般学习任务。该方法减少了传统神经网络方法中训练所带来的计算负担,从而提高了速度,同时光子信息处理还提供了更高的带宽。
大多数人工智能系统中使用的神经网络在学习过程中需要大量数据示例——训练一个可以识别猫的模型可能使用多达 10,000 张猫/非猫图像——计算和处理成本很高。关联学习单元 (AMLE) 不是依靠神经网络青睐的反向传播来“微调”结果,而是采用一种基于记忆材料(硫系相变材料)的学习模式,将数据集中的相似特征关联在一起——模仿巴甫洛夫在案例中观察到的条件反射“匹配”。通过将4-AMLE芯片作为简单的三层关联学习网络的一部分,该团队将该芯片用于简单的“猫与狗”识别测试。在使用仅10副猫图像经过5轮的训练后,该系统能够区分猫和非猫图像。这一结果表明,人工关联学习系统可以快速地适应这一简单任务,而不需要像一些传统的人工神经网络(ANN)那样需要数千张图像的训练集。
AMLE 输入与正确的输出配对以监督学习过程,并且可以使用光信号重置记忆材料。在测试中,仅用五对图像训练后,AMLE 就可以正确识别猫/非猫图像。
与传统电子芯片相比,新型光学芯片具有相当可观的性能,这归因于设计上的两个关键差异:
1. 一种独特的网络架构,将关联学习作为构成要素,而不是使用神经元和神经突触。
2. 使用“波分复用”在单个通道上发送不同波长的多个光信号,以提高计算速度。
德国明斯特大学的合作者Wolfram Pernice教授说道:“该器件自然地捕捉数据集中的相似性,同时使用光并行处理以提高整体计算速度——这远远超过了传统电子芯片的能力。”
共同第一作者、复旦大学微电子学院程增光研究员解释说,关联学习方法可以补充传统神经网络,而不是取代它们。
“对于不需要对数据集中高度复杂的特征进行大量分析的问题,它更有效”,程教授说。“许多学习任务都是基于数据量,而非高的复杂度——在这些情况下,关联学习可以更快地完成任务,并且计算成本更低。”
“越来越明显的是,人工智能将成为人类历史下一阶段见证的许多创新的源动力。这项工作为实现挖掘数据关联的高速光学处理器以应用于特定类型的人工智能计算铺平了道路,尽管未来仍有许多令人兴奋的挑战。”领导这项研究的Harish Bhaskaran教授说。
该成果以“Monadic Pavlovian associative learning in a backpropagation-free photonic network”发表在 Optica上。
1. ALME器件工作机理
在生物系统中,一个基本的关联学习过程(经典条件反射)可以使用神经回路来描述(图1a)。为了使运动神经元产生动作电位,它必须接收到感觉信号。巴甫洛夫在他的实验中表明,可以通过将铃声与食物联系起来“刺激”狗的唾液分泌,即两种感觉刺激相关联以产生相同的反应,这是一种关联学习机制。一旦建立了两个信号之间的关联,当其中任一信号通过突触权重发送到运动神经元时,就会触发响应,此时的网络已经学会了这个响应。因此,这种简化的神经回路有两个主要作用:关联两个输入信号,以及在原位存储这些关联的记忆。
作者将上述功能引入关联学习器件(AMLE)中实现光子关联学习功能。该器件具有两个耦合波导和位于下部波导上的相变材料 Ge2Sb2Te5 (GST) 薄膜,可有效调制波导之间的耦合(图1b)。GST 以非晶和结晶两种状态存在,可以控制波导之间的耦合量。当相变材料是结晶态时,输入s1和s2之间没有关联(图1c)。然而,当两个输入(学习脉冲)同时到达时,材料具有足够的吸收来使 GST 非晶化,从而改变波导之间的耦合。随着材料的非晶化,输入s1和s2开始“关联”,如图 1d所示。

图1. AMLE器件结构和工作原理
图源:Optica 9(7), 792-802 (2022), Fig. 1
2. 光子关联学习的实验验证
作者通过实验表征了AMLE器件的动态响应。当输入信号s1和s2在泵浦波长λ0以固定相位延迟π/2时同时发送时,AMLE进行关联学习,伴随着波导透过率的变化。随着输入泵浦脉冲功率的增加,波导透过率的变化进一步变大,表明关联学习的增强。这一实验表明,两个输入可以被训练达到相互关联,从而触发响应,即学习关联。同时,这些学习到的关联也可以通过一系列低能量脉冲来反转,达到去关联(遗忘)的状态(图2a-b)。作者对AMLE进行了80个学习/遗忘周期,监测为50分钟,表明了该学习过程的高稳定性和可重复性(图2c)。

图2. AMLE器件关联学习过程
图源:Optica 9(7), 792-802 (2022), Fig. 2
3. 光子关联学习的芯片集成
巴甫洛夫关联学习和机器学习中的监督学习在本质上是可比的,两者都涉及将输入 (IN) 与正确的输出 (Teacher) 配对以监督学习过程。然而,在传统的监督学习架构中,输入到期望输出的映射相对复杂,而且耗时耗能——Teacher信号逐层向后传播以共同调整网络权重,使得实际输出更好地接近每次学习迭代后的期望输出(Teacher)。相比之下,AMLE 的学习过程要简单得多(并且更快、更节能)。为了阐明这一点,作者设计并制备了扩展的 AMLE 芯片网络,如图3所示。他们使用级联的 Mach-Zehnder 调制器 (MZM) 和集成NiCr 热光加热器来提供一种可靠的稳定光学移相的方法,并将它们馈送到 AMLE 的输入端。MZM还允许使用波长复用将多个信号馈送到多个AMLE的输入,然后这些信号在关联层与Teacher信号配对以产生累积的输出响应。

图3. 光子关联学习网络架构和芯片
图源:Optica 9(7), 792-802 (2022), Fig. 3
4. 典型人工智能应用
该AMLE网络芯片在模式识别和图像识别中分别获得了应用验证。在图4中,AMLE 网络芯片被用来执行快速模式识别任务,以验证一旦 AMLE 形成关联,就可以实现同时并行识别。通过分别发送Teacher信号和输入信号将位模式“0110”编程到 AMLE上。然后使用不同波长(C33到C36)对于每个AMLE单元进行输入,输出的结果用以判定信号与位模式是否匹配。需要指出的是,实验中的检测速度仅受需要平均的脉冲数目,调制器和光电探测器的速度限制。
作者进一步展示了基于 AMLE 的关联学习网络来实现一般图像识别,如图5所示。作者使用来自fast.ai的“Dogs vs Cats”数据集来检测关联学习网络的图像分类能力。首先使用猫图像来训练网络,得到抽象化的猫模型特征输出。每次训练迭代后,网络区分猫外观的能力会提高,可以成功分类猫和狗(非猫)的图像。与传统的基于数字的AI方法相比,关联学习系统从更高层次抽象概括猫的典型特征,从而在逻辑上提出一个命题,即图像必须具有清晰、独特和可理解的物理属性才能构成猫的形象。在这个示例中,关联学习图像识别采用符号主义(Symbolic)AI,而传统的图像识别则使用连接主义(Connectionist) AI。关联学习的方法通常更简单、更快,适用于特征不复杂,或特征预处理后的边缘机器学习任务。

图4. 光子关联学习网络应用于模式识别
图源:Optica 9(7), 792-802 (2022), Fig. 4
5. 商业化应用场景
AMLE网络芯片在高层次抽象概括物体的典型特征上体现出了优于主流人工神经网络百倍的训练成本优势。同时,在推理速度上,AMLE也有着1000倍于传统电子芯片的飞跃式的提升。在特征明显、迭代快、对时延要求高的应用场景,如自动驾驶、量化交易里,AMLE可以大幅降低成本,提高效率。
程增光说: “光子关联学习芯片有望让自动驾驶节约百倍的算法训练成本,同时拥有激光雷达(LIDAR)般的响应推理速度。”
光本位有信心将一系列尖端科研成果转化为下游场景的解决方案,把更高效的光子AI芯片推向主流市场。
