以色列公司发布新芯片,TinyML跨出重要一步
来源 | 半导体行业观察2022-04-18 15:02:57
TinyML或优化机器学习(ML)模型以在资源受限的设备上运行,是ML发展最快的子领域之一...
TinyML或优化机器学习 (ML) 模型以在资源受限的设备上运行,是 ML 发展最快的子领域之一。为了实现 TinyML(或有时称为 TinyAI)所需的这种超低功耗、高性能计算,工程师们探索了许多令人兴奋的新技术。
TinyML 在边缘计算中的地位概述
利用这一趋势,以色列公司 Polyn 上周宣布其最新的神经形态模拟信号处理器 TinyML/TinyAI 处理器已成功封装和评估。
在本文中,我们将了解 Polyn 提供的技术,以了解它可能对整个 TinyML 产生的影响。
在追求更低功耗、更高性能的人工智能计算硬件的过程中,令人兴奋的新兴技术之一是神经形态计算。神经形态计算的概念是,人脑是人类已知的最节能的计算设备。在尝试运行 AI 应用程序时,创建尽可能模拟大脑生物过程的计算硬件将是有利的。虽然这听起来是一项艰巨的任务,但工程师可以通过硬件和软件的结合来尝试这种娱乐方式。
神经形态解决方案的实现
从硬件的角度来看,神经形态芯片试图通过充当神经元、轴突的电路元件以及它们之间的加权连接来模仿大脑。为了进一步模拟大脑,该硬件通常通过模拟电路实现,这也有助于提高性能和电源效率。然后,神经形态计算依赖于专门的神经网络,例如尖峰神经网络和电信号调制来模拟大脑信号的变化。有了这个基本的了解,我们来看看 Polyn 的新技术。Polyn 的 NeuroSense 和 NASP 技术
本周,Polyn 宣布其专有的名为NeuroSense的神经形态计算芯片已首次被封装和评估,这受到高度关注。NASP 技术被称为其神经形态模拟信号处理器 (NASP)技术,旨在成为实时边缘传感器信号处理器。
NASP 演示芯片
根据 Polyn 的说法,他们的技术利用了一个独特的平台,该平台将经过训练的神经网络作为输入,并使用数学建模将网络合成为真正的神经形态芯片。它的 NASP 芯片使用模拟电路,其中神经元使用运算放大器实现,而轴突则由薄膜电阻器实现。他们声称其平台生产的合成芯片已经完全布局并准备好制造。
这种新封装和评估的 NeurorSense 芯片采用 55 nm CMOS 技术实现。此外,据说它充当边缘信号传感器,能够使用神经形态计算处理原始传感器数据,而无需对模拟信号进行任何数字化。出于这个原因,该公司将其称为第一款无需模数转换器 (ADC) 即可直接在传感器旁边使用的神经形态模拟 TinyML 芯片。虽然许多技术规格尚不清楚,但据称,对于始终在线的应用,Polyn 的 NASP 提供 100 uW 的功耗,具有传统算法的“两倍精度”。
目前,Polyn
对其发展感到鼓舞,称其芯片的成功封装和评估验证了其技术和整个 NASP 系统。未来,Polyn 表示,它希望在 2023
年第一季度向客户提供该芯片,作为一种集成了光电体积描记术 (PPG) 和惯性测量单元 (IMU) 传感器的可穿戴设备。按照Polyn所说,许多应用程序可以从
AI 中受益,尤其是从神经网络范式中受益,但这种强大的数学方法的实际实现在以传统方式在标准 CPU 或 GPU
上执行时会出现过多的功耗。如果应用程序使用大量数据,并且经常访问内存,则会导致冯诺依曼架构出现瓶颈。对于具有连续信号流的情况,专用处理器效率更高。一个很好的例子是具有心率 (HR) 跟踪和人体活动识别 (HAR) 的可穿戴设备,其中 PPG/IMU 传感器不断生成数据,其处理会消耗大量电池电量。对于执行真正始终在线测量的设备,神经形态模拟信号处理 (NASP) 是一个理想的解决方案,与传统算法相比,它具有 100uW 的超低功耗和两倍的精度。提高的精度还可以简化整个系统,并降低相关成本。另一个耗电的应用是预测性维护
(PDM) 传感器节点。工业物联网 (IIoT) 利用物联网设备和传感器来监控机器和环境,以确保设备和流程的最佳性能。PDM
监控机器的健康状况以识别(也称为预测)组件的可能故障是最近受到很多关注的物联网技术。为了实现有效的 PDM,需要通过机器学习 (ML)
算法收集、处理和分析大量数据。如果所有这些数据都必须发送到一个中心进行分析,那么数据通信和处理将比它的价值更麻烦。传感器数据预处理可以显着减少发送到云端的数据量,节省资金并改善延迟。NASP 解决了所有这些情况,以及直接在传感器上对原始数据进行智能优化(预处理)的许多其他用途。它不仅可以解决现有应用程序的问题,还可以为整个行业开辟新的机遇。NASP 是一个真正的 Tiny AI 解决方案,旨在优化原始数据并减少 CPU 负载和转发到云的数据量。NASP 芯片位于传感器旁边,形成 Tiny AI 逻辑层。它是一种推理解决方案,使用已经训练好的机器学习模型进行预测。在 NASP 概念中,数据处理芯片是由 NASP 自动化工具从已经训练好的神经网络中合成的。基于 POLYN 多年的专业知识,“仅推理”方法对于语音提取、声音/振动处理、可穿戴设备测量等应用非常有效。它在功率、准确性和延迟方面提供了巨大的优势。神经网络计算的主要优点是并行操作。最大的优势是神经形态计算,特别是通过硬件和软件设计实现最大并行性,努力模仿人脑并实现其计算到功耗的功效。除了低功耗和提高计算工作负载的性能外,神经网络还提供容错能力,这意味着如果传感器数据不一致,系统仍然可以产生结果。同时进入 NASP 芯片输入层的所有传感器信号被并行传输到后续层。没有执行周期,也没有指向/来自内存的指令。人脑不仅是一个超低功耗的并行操作系统,还是一个模拟系统,处理各种信号而不需要将它们转换成二进制格式。对于信号感知等任务,模拟系统更可取。据半导体研究公司称,预计未来十年将出现大量模拟信号,这需要硬件方面的根本性突破,以产生更智能的世界机器接口。NASP 正是这些突破之一,旨在感知模拟信号和数字信号,最重要的是,为各种传感器增加“智能”。NASP 芯片包含人工神经元(执行计算的节点)和使用电路元件实现的轴突(节点之间的权重连接):神经元使用运算放大器实现,轴突使用薄膜电阻器实现。NASP芯片设计体现了稀疏神经网络的方法,只有推理所需的神经元之间的必要连接,这意味着该解决方案显着有效地减少了神经连接。与每个神经元连接到每个相邻神经元的内存设计相比,NASP
方法简化了芯片布局。这种设计特别适用于连接非常稀疏的卷积神经网络 ( CNN),以及
RNN、Transformers和Autoencoders 。对芯片设计进行神经网络调整是每个片上神经网络解决方案的重要组成部分。当今市场上可用的可编程解决方案具有架构限制,会对神经网络施加额外的转换。有时,原始神经网络在移植过程中会经历几乎 100% 的转换,这是一种代价高昂的方法。为了解决这个问题,NASP 模型包括芯片设计自动化工具,即 POLYN 的 T 编译器和综合工具,可将任何经过训练的神经网络转换为最佳数学模型,以进一步生成芯片布局,同时完全符合 POLYN 的客户神经网络,并节省相关的努力和成本。出于多种原因,如果没有模拟计算的复兴,该行业将接受的数字化转型将是不可能的。一是节能理念。过多的功耗与感官系统中的数据计算不兼容。下一个趋势是人工智能越来越向边缘移动,并在今天应用于传感器节点。需要优化数十亿物联网设备之间的通信,并从云端卸载数据处理,从而提高 TCO 和效率。与擅长处理复杂信息并随时间动态变化的人脑一样,神经形态模拟信号处理器擅长实时计算,从而有助于数字和模拟技术世界的有益啮合。