Socionext Taiwan

聯絡我們
繁中
/
ENGLISH
2020/03/17
Socionext成功測試載有DNN引擎的低功耗AI晶片

頂尖影像應用 SoC 方案供應商Socionext Inc.宣佈成功發開一款集成有量化深度神經網路(DNN)技術的原型晶片,可為小型、低功耗邊緣計算設備提供先進的AI處理。

 

受日本新能源與產業技術綜合開發機構(NEDO)委託,Socionext參與了以《先進的低功耗AI-Edge LSI技術開發》為課題的項目研究,成功完成了結合量化DNN技術的晶片測試,並確認了其運行和性能。該測試晶片搭載有“量化DNN引擎”,能以高速、低功耗執行深度學習推理處理。

 

目前,基於通用GPU的邊緣計算處理器無法滿足日益增長的AI智慧處理需求。以搭載有圖像識別和分析功能的邊緣運算設備為例,其系統功耗和發熱量與通用GPU相比有明顯增加,不得不通過提升成本擴容設備等方式滿足AI處理需求。

 

量化DNN引擎

為提高AI處理性能並減少系統功耗,Socionext開發了一款採用“量化DNN技術”的專有體系架構,它減少了深度學習所需的參數和啟動位。該體系架構將1-bit (binary)、2-bit (ternary) 低位元速率技術、傳統8-bit技術及公司獨創的參數壓縮技術結合,以較少的計算資源執行大量計算處理,並減少資料量。

 

除此以外,Socionext還開發了一種新穎的片上存儲技術,可提供高效的資料傳輸,從而減少深度學習通常所需的大容量片上或外部記憶體。

 

通過結合上述新技術,Socionext將AI晶片及“DNN引擎”原型化,並確認了其功能和性能。 原型化晶片通過“YOLO v3”以不到5W的低功耗及30fps的速度實現了目標檢測,其效率是通用GPU的10倍。 此外,該晶片還配備了高性能、低功耗的Arm Cortex-A系列CPU,無需外部處理器即可以單晶片執行整個AI處理。

 

深度學習軟體發展環境

除硬體開發外,Socionext還構建了深度學習軟體發展環境,通過結合TensorFlow作為基本框架,允許開發人員用原始低bit位進行量化感知訓練(Quantization Aware Training)和訓練後量化(Post Training Quantization)。 開發新晶片時,使用者可以選擇最佳量化技術並將其應用於各種神經網路中執行高精度處理,例如在小型低功耗邊緣設備上增設最先進的電腦視覺功能,應用於高級駕駛員輔助系統(ADAS)、監控攝影機和工廠自動化等場景。

 

Socionext目前正在通過對該原型晶片進行評估進一步調整電路優化其性能。將繼續與合作夥伴一起共同開發並交付AI-Edge LSI最終產品,完成NEDO的委託項目。

 

PIC: Prototype Chip with Quantized DNN Engine

 

NEDO項目名稱

《創新型AI晶片及下一代計算技術開發》

《創新型AI邊緣計算技術開發》

《先進的低功耗AI-Edge LSI技術開發》



Top