突破世紀(jì)難題,我國(guó)成功研制出這一芯片!發(fā)表時(shí)間:2025-10-16 10:24 近日,北京大學(xué)人工智能研究院孫仲研究員團(tuán)隊(duì)聯(lián)合集成電路學(xué)院研究團(tuán)隊(duì),成功研制出一款基于阻變存儲(chǔ)器的高精度、可擴(kuò)展模擬矩陣計(jì)算芯片。
該芯片首次在精度上達(dá)到可與數(shù)字計(jì)算媲美的水平,將傳統(tǒng)模擬計(jì)算的準(zhǔn)確度提升了五個(gè)數(shù)量級(jí),并實(shí)現(xiàn)了24位定點(diǎn)精度。
這一成果意味著我國(guó)科研團(tuán)隊(duì)在模擬計(jì)算領(lǐng)域?qū)崿F(xiàn)了真正意義上的突破,也為后摩爾時(shí)代的計(jì)算架構(gòu)轉(zhuǎn)型提供了全新的技術(shù)方向。
相關(guān)成果已發(fā)表于國(guó)際頂級(jí)學(xué)術(shù)期刊《Nature Electronics》。(期刊鏈接:使用電阻式隨機(jī)存取存儲(chǔ)器芯片求解精確且可擴(kuò)展的模擬矩陣方程 |自然電子)
![]() 圖源:AI生成
傳統(tǒng)的模擬計(jì)算雖然速度快,但精度低、難擴(kuò)展。精度一直模擬計(jì)算的核心瓶頸,長(zhǎng)期以來被認(rèn)為是全球性的世紀(jì)難題。
數(shù)字計(jì)算憑借高精度和可編程性逐漸占據(jù)主導(dǎo)地位,但它的計(jì)算速度受到“內(nèi)存墻”限制,算力密度與能效提升空間有限,已成為人工智能、科學(xué)計(jì)算和6G通信等高負(fù)載任務(wù)的瓶頸。
為了打破這一困局,孫仲團(tuán)隊(duì)提出了一種融合創(chuàng)新的新方案。
他們結(jié)合模擬低精度矩陣求逆與高精度矩陣向量乘法運(yùn)算,構(gòu)建出基于阻變存儲(chǔ)器陣列的高精度、可擴(kuò)展全模擬矩陣方程求解器。
這一架構(gòu)采用晶圓廠制造的三位阻變存儲(chǔ)芯片,并通過分塊矩陣算法實(shí)現(xiàn)24位定點(diǎn)精度,相當(dāng)于32位浮點(diǎn)數(shù)(FP32)精度。
在實(shí)驗(yàn)中,芯片成功完成了16×16矩陣求逆運(yùn)算,矩陣方程求解經(jīng)過10次迭代后,相對(duì)誤差可低至10??量級(jí)。僅需三次迭代即可達(dá)到與FP32數(shù)字處理器相當(dāng)?shù)木缺憩F(xiàn)。
![]() 圖源:期刊正文
性能方面的提升同樣令人驚訝。測(cè)試顯示,在求解32×32矩陣求逆時(shí),這款芯片的算力已超越高端GPU的單核性能,當(dāng)矩陣規(guī)模擴(kuò)大至128×128時(shí),計(jì)算吞吐量更是達(dá)到頂級(jí)數(shù)字處理器(GPU)的1000倍以上,能效提升超過100倍。
換句話說,傳統(tǒng)GPU干一天的活,這顆芯片一分鐘就能完成。
未來的6G通信中,該芯片能讓基站以更低的能耗實(shí)時(shí)處理海量天線信號(hào),顯著提升網(wǎng)絡(luò)容量與能效;在人工智能領(lǐng)域,它有望加速大模型訓(xùn)練中計(jì)算密集的二階優(yōu)化算法,顯著縮短訓(xùn)練時(shí)間。
同時(shí),這種低功耗特性使其具備在終端設(shè)備上直接運(yùn)行復(fù)雜AI模型的能力,減少對(duì)云端算力的依賴,推動(dòng)邊緣計(jì)算向更高階段發(fā)展。
![]() 圖源:期刊正文
除了北大的突破外,復(fù)旦大學(xué)團(tuán)隊(duì)也傳來捷報(bào)。
他們研發(fā)出全球首顆二維-硅基混合架構(gòu)芯片,相關(guān)成果發(fā)表在《Nature》雜志上。這款芯片將二維超快閃存與成熟的CMOS工藝深度融合,攻克了二維信息器件工程化和存儲(chǔ)速率的技術(shù)難題,首次實(shí)現(xiàn)了混合架構(gòu)的工程化流片。(原文:通過系統(tǒng)集成實(shí)現(xiàn)的全功能 2D 閃存芯片 |自然界)
根據(jù)復(fù)旦大學(xué)的介紹,這顆芯片的性能“碾壓”當(dāng)前的Flash閃存技術(shù),全片測(cè)試顯示支持8位指令操作、32位并行與隨機(jī)尋址,良率高達(dá)94.34%,展現(xiàn)出極強(qiáng)的工程落地能力。 |