960 顆類(lèi)腦芯片,浙大「悟空」出世
浙江大學(xué)腦機(jī)智能全國(guó)重點(diǎn)實(shí)驗(yàn)室發(fā)布最新研制的新一代神經(jīng)擬態(tài)類(lèi)腦計(jì)算機(jī)—Darwin Monkey(」悟空」)。該類(lèi)腦計(jì)算機(jī)搭載了 960 顆實(shí)驗(yàn)室自研的達(dá)爾文 3 代類(lèi)腦計(jì)算芯片,支持的脈沖神經(jīng)元規(guī)模超過(guò) 20 億,神經(jīng)突觸超過(guò)千億,其神經(jīng)元數(shù)量已接近獼猴大腦規(guī)模,在典型運(yùn)行狀態(tài)下功耗約為 2000 瓦。
這是國(guó)際上首臺(tái)神經(jīng)元規(guī)模超過(guò) 20 億的基于專(zhuān)用神經(jīng)擬態(tài)芯片的類(lèi)腦計(jì)算機(jī),同時(shí)也是浙江大學(xué)類(lèi)腦計(jì)算團(tuán)隊(duì)繼 2020 年 9 月份研制成功我國(guó)首臺(tái)億級(jí)神經(jīng)元類(lèi)腦計(jì)算機(jī) Darwin Mouse(「米奇」)之后的又一重要突破。
達(dá)爾文 3 代類(lèi)腦計(jì)算芯片
Darwin Monkey 所采用的達(dá)爾文 3 代類(lèi)腦計(jì)算芯片是由浙江大學(xué)牽頭、聯(lián)合之江實(shí)驗(yàn)室于 2023 年初研制成功,單顆芯片支持超過(guò) 235 萬(wàn)脈沖神經(jīng)元與億級(jí)神經(jīng)突觸,并支持類(lèi)腦計(jì)算專(zhuān)用指令集和神經(jīng)擬態(tài)在線(xiàn)學(xué)習(xí)機(jī)制。與其它類(lèi)腦芯片相比,達(dá)爾文 3 代類(lèi)腦計(jì)算芯片在神經(jīng)元規(guī)模、突觸存儲(chǔ)密度、推理學(xué)習(xí)任務(wù)的效率等方面具有優(yōu)勢(shì)。
類(lèi)腦計(jì)算機(jī)「悟空」搭載的達(dá)爾文 3 代類(lèi)腦計(jì)算芯片
在神經(jīng)元模型的靈活性方面,研究者提出了一種專(zhuān)用的指令集體系結(jié)構(gòu)(ISA),能夠高效靈活地描述不同的神經(jīng)動(dòng)力學(xué)模型和學(xué)習(xí)規(guī)則,利用高并行性的計(jì)算操作實(shí)現(xiàn)多組運(yùn)行參數(shù)加載和狀態(tài)變量更新,解決模型構(gòu)建靈活性和運(yùn)行效率之間的矛盾。
在突觸連接的規(guī)模與密度方面,研究組設(shè)計(jì)了一種高效連接表示機(jī)制,有效壓縮了描述突觸連接所需的信息,提升了整體片上存儲(chǔ)的使用效率,增加了突觸密度和規(guī)模, 使得單芯片能夠支持 200 萬(wàn)以上神經(jīng)元和 1 億以上神經(jīng)突觸。
在片上學(xué)習(xí)能力方面,達(dá)爾文 3 代類(lèi)腦芯片具備靈活的片上學(xué)習(xí)和芯片級(jí)擴(kuò)展能力,能夠高效實(shí)現(xiàn)不同類(lèi)型的神經(jīng)元和突觸模型,運(yùn)行大規(guī)模脈沖神經(jīng)網(wǎng)絡(luò)。
Darwin Monkey 類(lèi)腦計(jì)算機(jī)
據(jù)介紹,整臺(tái) Darwin Monkey 類(lèi)腦計(jì)算機(jī)由 15 臺(tái)刀片式神經(jīng)擬態(tài)類(lèi)腦服務(wù)器組成,每一臺(tái)刀片式類(lèi)腦服務(wù)器內(nèi)部集成了 64 顆達(dá)爾文 3 代類(lèi)腦計(jì)算芯片。

類(lèi)腦計(jì)算機(jī)「悟空」
值得一提的是,在類(lèi)腦計(jì)算芯片的基礎(chǔ)上,為了構(gòu)建超大規(guī)模的類(lèi)腦計(jì)算機(jī) Darwin Monkey,研究團(tuán)隊(duì)突破了以下關(guān)鍵技術(shù):
構(gòu)建大規(guī)模神經(jīng)元系統(tǒng)互連與集成架構(gòu),支持以多維網(wǎng)格為基本拓?fù)浣Y(jié)構(gòu)的層次化、可擴(kuò)展芯片間互連。
實(shí)現(xiàn)自適應(yīng)時(shí)間步控制方法,支持大規(guī)模神經(jīng)元之間的任務(wù)協(xié)同運(yùn)行。
采用國(guó)產(chǎn)晶圓基板工藝,基于 CoWoS-S 2.5D 先進(jìn)封裝技術(shù),實(shí)現(xiàn)晶圓級(jí)類(lèi)腦計(jì)算芯片。
提出分層的系統(tǒng)資源管理框架,設(shè)計(jì)多級(jí)內(nèi)存系統(tǒng)中的數(shù)據(jù)換入換出策略,實(shí)現(xiàn)對(duì)大規(guī)模神經(jīng)元系統(tǒng)資源的管理與調(diào)度。

晶上系統(tǒng) SoW 集成方式的神經(jīng)擬態(tài)類(lèi)腦服務(wù)器
刀片式類(lèi)腦服務(wù)器的集成方式除了基于傳統(tǒng) PCB 板級(jí)互連的方式之外,為了突破芯片間互連速度與系統(tǒng)能效的瓶頸,團(tuán)隊(duì)聯(lián)合浙大集成電路學(xué)院,利用 2.5D 先進(jìn)封裝技術(shù)研制出晶圓級(jí)超集成類(lèi)腦計(jì)算芯片 DarwinWafer,搭建了基于 DarwinWafer 的晶上系統(tǒng)刀片服務(wù)器,整個(gè) SoW 刀片式服務(wù)器主體僅僅包含一張集成 64 顆達(dá)爾文 3 代類(lèi)腦計(jì)算芯片裸片的 12 寸晶圓,擺脫了傳統(tǒng)光罩的物理約束,實(shí)現(xiàn)導(dǎo)線(xiàn)微納尺度的互連優(yōu)化。
為了充分釋放類(lèi)腦計(jì)算機(jī)的能力,團(tuán)隊(duì)還研制了新一代達(dá)爾文類(lèi)腦操作系統(tǒng)。該系統(tǒng)采用分層資源管理架構(gòu),通過(guò)構(gòu)建負(fù)載感知調(diào)度算法與動(dòng)態(tài)時(shí)間片劃分機(jī)制等技術(shù),在考慮通信帶寬與任務(wù)特征的基礎(chǔ)上,實(shí)現(xiàn)了神經(jīng)擬態(tài)任務(wù)的高效并發(fā)調(diào)度與系統(tǒng)資源的動(dòng)態(tài)優(yōu)化。
Darwin Monkey 的應(yīng)用場(chǎng)景
Darwin Monkey(悟空)類(lèi)腦計(jì)算系統(tǒng)具備大規(guī)模、高并行、低功耗等特點(diǎn),團(tuán)隊(duì)負(fù)責(zé)人、浙江大學(xué)腦機(jī)智能全國(guó)重點(diǎn)實(shí)驗(yàn)室主任潘綱教授稱(chēng)其將為現(xiàn)有的計(jì)算場(chǎng)景提供新的計(jì)算范式,為人工智能發(fā)展提供新的算力基座。
首先,類(lèi)腦計(jì)算系統(tǒng)既能解決現(xiàn)有深度網(wǎng)絡(luò)及大模型高能耗、高計(jì)算量的問(wèn)題,其無(wú)人監(jiān)督的在線(xiàn)方式學(xué)習(xí)機(jī)制也能為人工智能發(fā)展帶來(lái)進(jìn)步。
其次,作為腦模擬的天然平臺(tái),Darwin Monkey 可以作為腦研究的仿真工具,減少真實(shí)的生物實(shí)驗(yàn)。這種新的實(shí)驗(yàn)手段,便于探索大腦工作機(jī)理,更好地理解大腦。
第三,人類(lèi)的推理能力和效率遠(yuǎn)超當(dāng)前人工智能,Darwin MonKey 計(jì)算機(jī)仿腦的工作機(jī)制和超越人腦的運(yùn)算速度,將為未來(lái)類(lèi)腦 AI 的研究提供強(qiáng)大的支持。
目前團(tuán)隊(duì)在 Darwin Monkey 類(lèi)腦計(jì)算機(jī)上已成功部署多項(xiàng)智能應(yīng)用,不僅通過(guò)運(yùn)行 DeepSeek 類(lèi)腦大模型完成邏輯推理、內(nèi)容生成和數(shù)學(xué)求解等智能任務(wù),還初步模擬了包括秀麗線(xiàn)蟲(chóng)、斑馬魚(yú)、小鼠以及獼猴等不同神經(jīng)元規(guī)模的動(dòng)物大腦。
評(píng)論