導讀:NeuPro處理器系列將AI的應用擴展到機器視覺(machine vision)以外的基于邊緣的應用,包括自然語言處理,實時翻譯,認證,工作流管理以及許多其它基于學習的應用,使設備變得更加智能并減少人為干預。該架構由基于硬件和基于軟件的引擎組合而成,可實現(xiàn)完整的,可伸縮性的和可擴展性的AI(人工智能)解決方案。針對每個應用層使用硬件,軟件和可配置的性能選項的精確混合來實現(xiàn)對功耗,性能和面積(PPA, power, performance, and area)的最優(yōu)化處理。
圖1、CEVA的AI處理器深入深度學習的邊緣
CEVA的NeuPro人工智能(AI)處理器系列專為網(wǎng)絡邊緣的深度學習(deep learning)推理而設計,面向尋求采用簡化方式快速利用深度神經(jīng)網(wǎng)絡技術提供的重大可能性的智能和邊緣連接設備供應商。這款專用的AI處理器的性能得到了大幅提升,其范圍包括從入門級處理器的2 Tera OPS(TOPS,每秒萬億OPS(操作指令))處理速度到最高級配置的12.5 TOPS處理速度。
圖2、CEVA的NeuPro人工智能(AI)處理器架構
NeuPro處理器系列將AI的應用擴展到機器視覺(machine vision)以外的基于邊緣的應用,包括自然語言處理,實時翻譯,認證,工作流管理以及許多其它基于學習的應用,使設備變得更加智能并減少人為干預。該架構由基于硬件和基于軟件的引擎組合而成,可實現(xiàn)完整的,可伸縮性的和可擴展性的AI(人工智能)解決方案。針對每個應用層使用硬件,軟件和可配置的性能選項的精確混合來實現(xiàn)對功耗,性能和面積(PPA, power, performance, and area)的最優(yōu)化處理。
CEVA的NeuPro人工智能(AI)處理器系列包括:
NP500是最小的處理器,包括512個MAC單元,面向物聯(lián)網(wǎng),可穿戴設備和相機應用;
NP1000包含1024個MAC單元,面向中檔智能手機,ADAS,工業(yè)應用和AR / VR頭盔等應用;
NP2000包括2048個MAC單元,瞄準高端智能手機,監(jiān)控,機器人和無人機等的應用;
NP4000包括4096個MAC單元,用于企業(yè)監(jiān)控和自動駕駛等應用所需的高性能邊緣處理;
圖3、CEVA的NeuPro人工智能(AI)處理器系列
每個處理器由NeuPro引擎和NeuPro VPU組成。 NeuPro引擎包括神經(jīng)網(wǎng)絡層的硬連線實現(xiàn),其中包括卷積,完全連接,資源池和激活等功能。 NeuPro VPU是一款經(jīng)濟高效的可編程矢量DSP,可處理CDNN軟件,并為AI工作負載的新進展提供基于軟件的支持。 NeuPro同時支持8位和16位神經(jīng)網(wǎng)絡,實時優(yōu)化決策,實現(xiàn)精度和性能之間的最佳平衡。 MAC單元在運行時的利用率達到90%以上,以確保高度優(yōu)化的神經(jīng)網(wǎng)絡性能。處理器整的體設計大大降低了DDR所需的帶寬,改善了任何AI應用的功耗水平。
圖4、CEVA的神經(jīng)網(wǎng)絡軟件框架CDNN相結合
NeuPro系列與CEVA的神經(jīng)網(wǎng)絡軟件框架CDNN相結合,為開發(fā)人員提供了一個深度學習解決方案,用于生成專有的神經(jīng)網(wǎng)絡并將其移植到處理器。 CDNN支持完整的色域類型和網(wǎng)絡拓撲。
圖5、卷積神經(jīng)網(wǎng)絡加速器設計
結合NeuPro處理器產(chǎn)品線,CEVA還將提供NeuPro硬件引擎作為卷積神經(jīng)網(wǎng)絡(CNN,Convolutional Neural Network)的加速器。當與CEVA-XM4或CEVA-XM6視覺平臺相結合時,它為尋求單一統(tǒng)一平臺的客戶提供了一個選擇,可以用于成像,計算機視覺和神經(jīng)網(wǎng)絡等的工作負載中。 NeuPro將在于2018年第二季度可以為特定客戶提供授權使用,而在2018年第三季度提供一般授權。
圖6、CEVA的人工智能(AI)解決方案