您所在的位置: 首頁科學研究科研成果科研論文 → 正文

劉雙龍教授在人工智能加速器研究領域取得新進展

作者:陳濤時間:2021-10-15 17:13瀏覽次數:

近日,人工智能領域國際頂尖期刊IEEE Transactions on Neural Networks and Learning Systems (TNNLS)在線發表了我校物理與電子科學2劉雙龍教授的最新研究成果“High-Performance Acceleration of 2D and 3D CNNs on FPGAs using Static Block Floating-Point”。劉雙龍教授研究組,圍繞面向邊緣計算的人工智能算法的硬件加速技術展開研究,近年來取得了一系列突破性成果,先後在國際頂級期刊IEEE Trans. on Neural Networks and Learning Systems (TNNLS),IEEE Trans. On Computers (TC),ACM Trans. on Reconfigurable Technology and Systems (TRETS)等發表一系列人工智能加速器方面的研究成果。

人體行為識別(Human Action Recognition,HAR)是人工智能的一個重要應用方向。與捲積神經網絡(CNN)應用於2D圖像不同,當CNN用於視頻中人體動作的識別時,需要採用3D-CNN結構,以計算空間和時間維度特征,捕獲在多個連續幀編碼的運動信息。3D捲積通過堆疊多個連續的幀組成一個立方體,然後在立方體中運用3D捲積核。由此可見,3D-CNN的運算複雜度遠大於2D-CNN,因此對計算力和存儲的需求更高。

該研究論文中,項目組首次提出使用塊浮點計算技術(block floating-point,BFP)對應用於人體動作識別的3D-CNN進行硬件加速,並設計了基於該技術的並行計算的硬件架構(圖1)。該項研究相比使用定點數計算的加速器,在不增加數值位寬的情況下大幅度提升了計算精度(圖2),從而在保證計算速度的情況下提高了動作識別的準確率。同時該研究也比較了在不同識別準確率下加速器的處理時間,以適用於不同的應用場景。

圖1利用塊浮點計算技術的3D-CNN硬件加速器

圖2不同數值精度下採用塊浮點技術的識別準確率比較

劉雙龍教授為本論文的唯一通信作者,湖南師範大學為該論文的唯一通訊單位,帝國理工2計算機系博士研究生範鴻翔為本文第一作者。該工作獲得了國家自然科學基金、湖南省自然科學基金和長沙市自然科學基金的資助。

論文鏈接:

https://ieeexplore.ieee.org/document/9570135

DOI: 10.1109/TNNLS.2021.3116302

上一條:陳明星教授課題組在錶面低維體系電子結構的計算研究方面取得系列進展

下一條:劉紅榮教授團隊在短尾噬菌體非對稱重構研究領域取得突破

關閉