新聞中心

EEPW首頁 > 高端訪談 > 瑞彩祥云

瑞彩祥云

作者:王瑩時間:2019-05-29來源:電子産品世界收藏

  ——訪电子中国 产业解决方案中心

本文引用地址:/article/201905/401006.htm

      高级总监徐征作者/王莹《电子产品世界》编辑

      编者按:潛力巨大,加上近年人工智能的興起,(人工智能)成爲了新的熱點。MCU作爲傳統的嵌入式處理器,似乎難以涉足高算力的AI應用。不過,在嵌入式行業首開先河,提出了e-AI(嵌入式人工智能)解決方案,並帶來了兩大核心技術——DRP動態可配置處理器技術和SOTB超低功耗工藝,以期爲的應用提供重要的附加價值。

  1 e-AI解决方案出炉

      目前绝大部分产品的AI学习与推理是在云端进行的。在OT(操作技术)里面的终端产品或者设备,要到云端去做学习与分析,可能会造成网络延迟、带宽拥挤、网络安全性和功耗等问题。为此,提出了e-AI解決方案(如圖1),可以通過終端學習AI模型,實現實時、安全和低功耗的終端智能化。

1559527066861559.png

  2017年7月,瑞薩首次公布e-AI方案,通过e-AI翻译器,把客户的AI模型翻译成C语言,然后在瑞薩RX系列MCU里实现AI终端的推理功能(如图2)。

  2018年10月,第二代e-AI方案问世,通过把瑞薩独有的DRP技术做在芯片中,去实现DRP的e-AI解决方案。DRP即动态可配置处理器,顾名思义,客户可以按自己的需要,按不同的时间把DRP的硬件逻辑编程,实现并行的数据处理。DRP技术非常适合图像处理。

  接下来,瑞薩在2019年第四季度将推出第三代e-AI解决方案,这是配置能力更强大的 DRP AI芯片,在器件中额外配置了AI MAC(乘加電路),特别适合卷积神经网络(CNN)。

  第四代产品DRP AI 2也在规划当中,目的是实现在终端的增量学习功能。

      2 DRP巧妙提升算力

      DRP是瑞薩独有的技术。在同等功耗的前提下, 载有DRP技术的处理器比目前市场上常用的MCU、DSP或FPGA的处理能力高十倍或百倍,这意味着在相同的处理能力下,DRP的功耗比其他处理器低很多。

  DRP的目標應用場景包括智能工廠、智能家居和智能基礎設施。例如在工業控制的預維護中,e-AI應用方案可以通過一些學習完的數據,通過在電機上的加速度傳感器去分析判斷從傳感器收集來的信息是否正常,然後再傳送到控制中心或控制系統。這樣可以大大改善生産效率,避免停機,同時也可以降低維護維修的成本。

  另外一個應用場景是生物認證,例如機場或者口岸的出入境檢查站,或者是辦公樓的門禁系統。

  DRP的结构主要包含多组并行阵列可编程的处理单元,加上存储器和DMA控制器(如图3)。DRP是动态可配置处理器,可以根据用户编程,能够做到从一个时钟周期到下一个时钟周期动态地改变其处理電路的配置,实现并行处理不同的算法。对于图像处理这种应用是非常适合的,可以做到每个时钟周期少于1 ns。

1559527160362427.png

  AI的深度神经网络(DNN)包含几个不同的处理层,诸如卷积层、池化层和全连接层等。因为DRP的独有特性能够满足卷积神经网络(CNN)所需要的多并行处理要求, 因此非常适合作为卷积神经网络的AI加速器。

  即将推出的第三代DRP配置了AI MAC(如图4),里面有多组快速处理单元,能实现有效的快速计算。卷积层里本身需要处理大量的数据,同时卷积层里的数据需要不断成立权重,然后再重复去计算,因而需要快速地去做乘法或加法。AI MAC结构可以满足卷积层里大量的复杂计算。

  除了AI MAC硬件部分,第三代DRP也可以处理其他处理层的数据,例如也可以做动态可编程,可以把汇聚层里系统的计算合起来用。

  通过对比一个500 MHz时钟频率的CPU,和第二代DRP,进行Canny边缘侦测算法的运算。500 MHzCPU需要140 ms;但DRP尽管只有40 MHz,却只用了10.4 ms,可见处理速度快十倍以上。

  3 SOTB工艺实现了超低功耗

      SOTB(Silicon On Thin Buriedoxide)是瑞薩研发的超低功耗的工艺技术,可以实现无掺杂的晶体管。无掺杂结构可以降低晶体管淤积特性变化。对比传统的平面式晶体管的淤积特性变化,这种无掺杂通道和结构可以将特性变化减低2/3。减小晶体管的淤积特性变化,就可以在超低电压下,例如0.5 V进行稳定的操作,同时也可以大大降低工作电流与待机电流。

  SOTB在特定条件下,电流的消耗只是传统MCU的1/10。如果说传统方案是低功耗方案,SOTB就是超低功耗的方案,有望实现无电池系统。例如,传统MCU通过3 V的纽扣电池供电,间隔性侦测傳感器的信号采集,再把信息上传到云端。如果这些任务占用1%的工作周期,一个月后系统就可能没电了。如果换到0.1%的工作周期,这个系统能工作一年左右。但是如果采用SOTB技术做成的MCU,在特定条件下可以连续工作十年。因为SOTB本身需要的电流非常低,3 ?A就足够了。

  SOTB的路線圖有三個階段。

  第一階段,在2019年下半年將會在中國市場正式發布,屆時會做産品的介紹推廣。目標應用場景是一些需要經常更換電池,或電氣維護的應用。

  第二階段是2021年左右,計劃會把無線技術,諸如藍牙加進來,來擴展應用場景,包括智能家電或智能樓宇,以及個人健康産品。

  長遠目標主要是在第三階段,不但把無線技術加進去,同時也會把e-AI/DRP解決方案帶到器件裏,做成一個完整的方案,屆時應用場景會變得更加多樣,包括智慧農業、智能交通等。

  4 嵌入式AI的应用案例

      瑞薩还展示了三个应用案例。

  第一個是3D手勢識別,通過RX231的e-AI解決方案,提供手勢數據的學習工具、錄制工具、AI的學習工具。客戶只需做很小的代碼改動,無需重新編寫複雜的算法,就可以達到很高分辨率的3D手勢識別和控制。

  第二是馬達異常偵測。采用32位MCU——RX66T來實現電機控制,以及e-AI推理功能。通過配置在電機上的加速度傳感器收集信號,再通過學習的數據來判斷收集回來的信息是否異常,同時把計算的故障率在電腦上顯示出來。

  第三是通過DRP實現實時圖像處理器。主控制器是RZ/A2M,其中配置了DRP。圖像處理可能會分成很多不同的算法,收集完影像後還需要去分析,還要做影像的解碼,牽涉到很多不同的算法,DRP的主芯片可以滿足圖像處理的複雜計算要求。可以並行處理不同的算法。

  瑞薩还提供了一组数字:相比Arm Cortex-A9528 MHz处理器,带有DRP处理能力的RZ/A2M快了13倍。DRP另外一个优势是低功耗,因为第二代DRP的主频只有66 MHz,第三代为250 MHz,但是主频低并不代表性能会相对降低,低主频可以达到低功耗的效果,因为DRP可以实现并行数据处理,所以它的处理能力比主频高很多的MCU或MPU处理能力更强大,比A9处理器的处理能力快13倍。

  5 热点問答

      问:DPR跟FPGA或其他技术有何明显的区别?

  答:DRP可以理解成一個FPGA與GPU的混合體。

  FPGA是一个可编程的硬件,要运算一个非常复杂的算法,里面需要很多逻辑電路,整个器件需要做得很大。瑞薩独有的DRP硬件技术,优点在于是动态可编程的,通过DRP编译器,可以把C语言编译成DRP的硬件逻辑去运行算法。下一秒钟,又可以马上再把同一个逻辑電路重新编排,去运算另一种算法。

  与FPGA相比,运行同一个很大的算法,就可以把这个大算法切开为十个不同的小算法,去并行处理。这样整个逻辑電路不需要像FPGA做得那么大,只有FPGA的1/5或1/10即可(具体取决于用户怎么去编硬件逻辑)。

  同時DRP又是FPGA和GPU的混合産品。因爲DRP本身除了可以編程,也比較像GPU,可以做並行處理。但是GPU不能重新再編程。

  有個生動的比喻,DRP就像動畫片裏的變形金剛,針對不同的場景,既可以是MCU,也可以是GPU。

  問:e-AI解決方案與DRP、SOTB技術的關系如何?

  e-AI是AI的一個概念。e-AI在器件層的落腳點,第一步是DRP,未來會有SOTB來支持e-AI在5G、IoT或者可穿戴領域的應用。

  現在的DRP更多的還是在傳統領域中應用,未來再加上SOTB的配合,會有更廣闊的低功耗AIoT應用。

  問:DRP是否會用于所有MCU?

  答:DRP本身是一個硬件架構,但DRP也不可能單獨去工作,需要把它放進MPU或者MCU裏,中間有一個DMA控制器(注:作爲MCU與DRP中間的交換溝通)。

  瑞薩不会把DRP放进全系列的MCU或MPU中,是有选择性的,这是因为整个市场是多样性的。因此瑞薩传统的GPMCU(通用MCU)还会继续推广。

  DRP的目的是促进AI学习或推理功能,是用于处理能力较高的处理器中,所以会选择放在瑞薩中高端的LC、AC系列MPU中。例如,DRP第二代可放入528MHz主频的MPU中。未来的第三代DRP性能更强大,MPU里会带有双核1 GHz处理器,以完成AI的学习与推理功能。

      本文来源于科技期刊《电子产品世界》2019年第6期第1页,欢迎您写论文时引用,并注明出



關鍵詞: 201906 AIoT 物聯網 瑞薩

評論


相關推薦

技術專區

關閉