近日,我國(guó)團(tuán)隊(duì)在智能計(jì)算硬件方面取得突破,在國(guó)際上首創(chuàng)基于存算一體技術(shù)的高效排序硬件架構(gòu)。該成果由北京大學(xué)集成電路學(xué)院教授楊玉超、北京大學(xué)人工智能研究院研究員陶耀宇組成的團(tuán)隊(duì)完成,已發(fā)表于《自然?電子》。
排序是人工智能系統(tǒng)中最常用、最耗時(shí)的基礎(chǔ)操作之一,廣泛運(yùn)用于自然語(yǔ)言處理、信息檢索、圖神經(jīng)網(wǎng)絡(luò)、智能決策等環(huán)節(jié)。例如,在智能駕駛場(chǎng)景中,車輛在高速公路等簡(jiǎn)單環(huán)境只需對(duì)周邊幾臺(tái)車的行進(jìn)路線進(jìn)行排序,整個(gè)耗時(shí)可控制在毫秒級(jí)別。但在復(fù)雜的城市環(huán)境,周邊有數(shù)百個(gè)乃至更多各類交通參與者,排序的復(fù)雜程度和硬件延遲則大幅提高。又如,在抖音等平臺(tái)大規(guī)模檢索與推薦系統(tǒng)中,用戶點(diǎn)擊、評(píng)分、相似度在計(jì)算后,常需要對(duì)海量的候選內(nèi)容進(jìn)行快速排序,找出最相關(guān)項(xiàng),排序性能直接影響系統(tǒng)的響應(yīng)時(shí)間和可擴(kuò)展性。
在傳統(tǒng)計(jì)算架構(gòu)下,大規(guī)模的非線性排序難以在端側(cè)或邊緣設(shè)備高效完成,這一過(guò)程消耗大量時(shí)間與功耗,極大制約了具身智能、智能駕駛等新興技術(shù)的發(fā)展與普及。
近年來(lái),“存算一體”被認(rèn)為是突破傳統(tǒng)硬件架構(gòu)計(jì)算瓶頸的關(guān)鍵技術(shù),已經(jīng)在矩陣計(jì)算等規(guī)則性強(qiáng)的數(shù)值計(jì)算中取得顯著成果。然而由于排序存在邏輯復(fù)雜、操作非線性、數(shù)據(jù)訪問(wèn)不規(guī)則,缺乏通用、高效的硬件排序原語(yǔ)等諸多障礙,目前國(guó)際主流的存算一體架構(gòu)均無(wú)法解決大數(shù)據(jù)排序問(wèn)題。這一難題,是下一代人工智能計(jì)算硬件發(fā)展的前沿焦點(diǎn)與核心卡點(diǎn)。
科研團(tuán)隊(duì)圍繞“讓數(shù)據(jù)就地排序”的第一性原理目標(biāo),在存算一體架構(gòu)上攻克了多個(gè)核心技術(shù)難題。比如,開創(chuàng)性地引入了“憶阻器陣列”,實(shí)現(xiàn)了低延遲、多通路的硬件級(jí)并行排序電路設(shè)計(jì)。又如,在算子層面,優(yōu)化了面向人工智能任務(wù)的算法—架構(gòu)協(xié)同路徑,同時(shí)兼容現(xiàn)有矩陣計(jì)算。
“排序的核心是比較運(yùn)算,需要精準(zhǔn)地實(shí)現(xiàn)‘條件判斷+數(shù)據(jù)搬移’,在復(fù)雜的應(yīng)用場(chǎng)景中,還要對(duì)不同因素的優(yōu)先級(jí)進(jìn)行比較,因此排序的邏輯非常復(fù)雜。一般排序過(guò)程需要構(gòu)建支持多級(jí)‘比較—選擇’的比較器單元,而傳統(tǒng)存算一體架構(gòu)主要面向‘乘加’‘累加’等操作,難以支持這樣的復(fù)雜運(yùn)算,我們成功解決這一難題,設(shè)計(jì)了一種‘無(wú)比較器’的存算一體排序架構(gòu)?!闭撐牡谝蛔髡?、北京大學(xué)集成電路學(xué)院博士生余連風(fēng)介紹。
實(shí)測(cè)結(jié)果顯示,該硬件方案在典型排序任務(wù)中提升速度超15倍,面積效率提升超過(guò)32倍,具備并行處理百萬(wàn)級(jí)數(shù)據(jù)元素排序任務(wù)的潛力,功耗僅為傳統(tǒng)CPU或GPU(并行計(jì)算)處理器的1/10。
論文通訊作者陶耀宇說(shuō),“排序計(jì)算在人工智能中是高頻、通用、基礎(chǔ)且極難處理的一類操作,這一難題的突破意味著存算一體從‘適合特定應(yīng)用’走向‘可支持更廣泛的通用計(jì)算’,為人工智能相關(guān)任務(wù)構(gòu)建了全鏈路的底層硬件架構(gòu)支持?!?/p>
在測(cè)試中,該技術(shù)展現(xiàn)出高速度與低功耗的顯著優(yōu)勢(shì),具有廣泛的應(yīng)用前景,可用于智慧交通圖像排序系統(tǒng)、金融智能風(fēng)控評(píng)分引擎、邊緣監(jiān)控設(shè)備的目標(biāo)優(yōu)先識(shí)別模塊等場(chǎng)景。
“根據(jù)初步測(cè)算,若該技術(shù)在智能終端、工業(yè)控制、數(shù)據(jù)中心等核心應(yīng)用場(chǎng)景中推廣,僅在邊緣AI芯片市場(chǎng)就可形成百億元級(jí)年產(chǎn)值潛力,大幅提升傳統(tǒng)算力系統(tǒng)的性能。更重要的是,在社會(huì)層面,該技術(shù)有望推動(dòng)新一代智慧交通、智慧醫(yī)療、智能制造、數(shù)字政府系統(tǒng)更加高效運(yùn)行,釋放數(shù)據(jù)價(jià)值?!碧找罱榻B。
友情鏈接: 政府 高新園區(qū)合作媒體
Copyright 1999-2024 中國(guó)高新網(wǎng)chinahightech.comAll Rights Reserved.京ICP備14033264號(hào)-5
電信與信息服務(wù)業(yè)務(wù)經(jīng)營(yíng)許可證060344號(hào)主辦單位:《中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào)》社有限責(zé)任公司