核心提示:近年間,存算一體技術(shù)成為半導(dǎo)體產(chǎn)業(yè)的最新熱點(diǎn),既在ISSCC、IEDM等頂級(jí)學(xué)術(shù)會(huì)議上引發(fā)熱點(diǎn)討論,半導(dǎo)體
存算一體火了。
近年間,存算一體技術(shù)成為半導(dǎo)體產(chǎn)業(yè)的最新熱點(diǎn),既在ISSCC、IEDM等頂級(jí)學(xué)術(shù)會(huì)議上引發(fā)熱點(diǎn)討論,半導(dǎo)體國際巨頭如三星、SK海力士、臺(tái)積電、英特爾、美光、IBM等也紛紛推出最新研究成果。
舉個(gè)例子,在今年的ISSCC 2022上,臺(tái)積電一口氣發(fā)布了6篇存算一體技術(shù)的相關(guān)論文,覆蓋多種新型存儲(chǔ)器類別,其投入之巨可見一斑。
創(chuàng)業(yè)市場同樣風(fēng)起云涌。
僅以國內(nèi)市場為例,近年間,一大批如知存科技、九天睿芯、億鑄科技、智芯科微電子、千芯科技和蘋芯科技等專注于存算一體的新興創(chuàng)企紛紛斬獲融資或披露進(jìn)展,市場關(guān)注度持續(xù)攀升。
存算一體,產(chǎn)業(yè)最新風(fēng)口
近年來,自動(dòng)駕駛、數(shù)據(jù)處理中心以及AR/VR元宇宙等高密度計(jì)算場景的蓬勃發(fā)展,帶動(dòng)了以AI芯片為首的一大批新型半導(dǎo)體技術(shù)的爆發(fā)。
然而,隨著AI芯片走向100Tops、1000Tops甚至更高的算力水平,傳統(tǒng)馮·諾伊曼架構(gòu)卻成了制約市場應(yīng)用的最大瓶頸。
在馮·諾伊曼架構(gòu)之下,芯片的存儲(chǔ)區(qū)域和計(jì)算區(qū)域是分離的,計(jì)算時(shí),數(shù)據(jù)需要在兩個(gè)區(qū)域之間來回搬運(yùn)。 隨著神經(jīng)網(wǎng)絡(luò)模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長,“數(shù)據(jù)搬運(yùn)”已經(jīng)成為高效能計(jì)算性能和功耗的瓶頸,業(yè)內(nèi)俗稱“存儲(chǔ)墻”。據(jù)統(tǒng)計(jì),大算力的AI應(yīng)用中,數(shù)據(jù)搬運(yùn)操作消耗90%的時(shí)間和功耗,數(shù)據(jù)搬運(yùn)的功耗是運(yùn)算的650倍。
存算一體是解決存儲(chǔ)墻問題的最佳方案之一。
存算一體,顧名思義,就是將計(jì)算單元和存儲(chǔ)單元合二為一,用存儲(chǔ)單元完成計(jì)算工作,從而大幅度減少數(shù)據(jù)搬運(yùn)的過程。
理論上,這項(xiàng)技術(shù)最高能將芯片計(jì)算速度與能效提高超過兩個(gè)數(shù)量級(jí)。
馮·諾伊曼架構(gòu),承載了過去80年間,計(jì)算機(jī)技術(shù)的爆炸式發(fā)展,奠定了整個(gè)微電子時(shí)代的基礎(chǔ)。
挑戰(zhàn)它,甚至戰(zhàn)勝它,意味著一個(gè)萬億級(jí)別的全新時(shí)代,正在來臨。
低功耗、大算力,魚與熊掌必須兼得
當(dāng)前的存算一體技術(shù)路徑中,既有使用Flash、SRAM等傳統(tǒng)存儲(chǔ)器的方案,也有使用ReRAM(RRAM)、PCM、MRAM等新型存儲(chǔ)器的方案。
不同方案的適用場景不盡相同。舉個(gè)例子,F(xiàn)lash方案的運(yùn)算功耗極低,能夠適用于超低功耗的極端邊緣應(yīng)用場景,如超低功耗的語音物聯(lián)網(wǎng);但其半導(dǎo)體工藝難以兼容先進(jìn)節(jié)點(diǎn)。
相反,SRAM方案讀寫速度快,兼容先進(jìn)工藝節(jié)點(diǎn),能滿足高性能計(jì)算需求,但其存儲(chǔ)密度難以提升,在存儲(chǔ)密集場景下難免出現(xiàn)數(shù)據(jù)搬運(yùn)的老問題,這會(huì)損失一部分存算帶來的優(yōu)勢提升,另外SRAM的漏電大的特性也會(huì)導(dǎo)致SoC芯片的靜態(tài)待機(jī)功耗大幅提高。
低功耗、大算力、可落地,是否有方案能夠解決這“魚與熊掌不可兼得”的困難問題?
新型存儲(chǔ)技術(shù)之一的ReRAM技術(shù),也許是答案。
ReRAM全稱為阻變存儲(chǔ)器,或憶阻器,屬于新型非易失性存儲(chǔ)技術(shù),斷電后不會(huì)存在數(shù)據(jù)丟失問題。
典型的ReRAM由兩個(gè)電極夾一個(gè)薄介電層組成,通過改變上下電極的電壓,形成不同的電阻值,進(jìn)而代表不同的存儲(chǔ)狀態(tài),實(shí)現(xiàn)數(shù)據(jù)的讀寫。
ReRAM技術(shù)利用阻值特性,可以在存儲(chǔ)介質(zhì)上實(shí)現(xiàn)乘法操作,且運(yùn)行功耗很低,是極優(yōu)的存內(nèi)計(jì)算介質(zhì)。
作為新型存儲(chǔ)器的代表之一,ReRAM具備讀取性能高、讀取功耗低、密度高和成本低等特點(diǎn),可以很好的兼顧大算力、低功耗的存算需求。另外非易失的特性也可以大大降低芯片的靜態(tài)待機(jī)功耗。
同時(shí)ReRAM技術(shù)還能夠很好地兼容28nm、22nm、甚至14nm、12nm等先進(jìn)的CMOS工藝,滿足不同工藝節(jié)點(diǎn)的SoC芯片的集成需求。
“存”與“算”缺一不可
作為全球關(guān)注的前沿技術(shù),ReRAM技術(shù)在中國也處在快速發(fā)展當(dāng)中。
今年上半年,國內(nèi)創(chuàng)業(yè)公司昕原半導(dǎo)體宣布,其大陸首條28/22nm ReRAM 12寸中試生產(chǎn)線正式完成裝機(jī)驗(yàn)收,并在工控領(lǐng)域達(dá)成量產(chǎn)商用。
這是中國大陸第一條28/22nm ReRAM 12寸中試生產(chǎn)線,中國大陸第一次在ReRAM賽道與國際同行處于同一起跑線上,也為存算一體的發(fā)展注入了新勢能。
昕原半導(dǎo)體新技術(shù)研究院負(fù)責(zé)人周博士告訴36氪,存算一體的設(shè)計(jì)是“存”與“算”耦合設(shè)計(jì),是一個(gè)交替提升的過程。這也意味著,存算一體從實(shí)驗(yàn)室走到商業(yè)應(yīng)用的過程中,不僅僅需要團(tuán)隊(duì)擁有頂級(jí)計(jì)算設(shè)計(jì)能力,還需要對存儲(chǔ)、對器件本身具有深度的認(rèn)知和不斷改進(jìn)的能力,可以根據(jù)器件特性進(jìn)行相應(yīng)的優(yōu)化與性能加深設(shè)計(jì)。
“比如我們器件的高低阻值、開關(guān)比、讀寫IV曲線都會(huì)影響存算電路的設(shè)計(jì),這會(huì)體現(xiàn)到最終的性能與能耗數(shù)據(jù)上,我們可以根據(jù)我們器件的特點(diǎn)做‘定制’設(shè)計(jì)與優(yōu)化,這樣整體的性能可以得到最大提升;同時(shí)我們器件和制程工藝也在不斷的迭代優(yōu)化中,這樣產(chǎn)品與器件可以做到良性循環(huán)” 周博士告訴36氪。
相對而言,單獨(dú)計(jì)算芯片設(shè)計(jì)大都有跡可循,有一定難度但并不是無法達(dá)成的任務(wù);而存儲(chǔ)器件的性能迭代以及存算耦合設(shè)計(jì)能力才真正的考驗(yàn)團(tuán)隊(duì)的能力。存儲(chǔ)器件和工藝制程的迭代的設(shè)計(jì)往往要求具有一條芯片產(chǎn)線能力,產(chǎn)線不僅意味著設(shè)備同時(shí)還要求專業(yè)的運(yùn)營、工藝制程團(tuán)隊(duì)、器件設(shè)計(jì)能力,只有四者合一才能具備器件迭代能力。
因此在傳統(tǒng)的存儲(chǔ)領(lǐng)域,只有像三星、美光和英特爾這樣的大廠具備器件迭代能力。
在新型存儲(chǔ)領(lǐng)域,昕原是目前國內(nèi)唯一具備ReRAM器件和工藝制程高速迭代優(yōu)化設(shè)計(jì)能力的團(tuán)隊(duì),不僅擁有自己的中試生產(chǎn)線,也擁有完整專業(yè)的工藝制程開發(fā)、器件開發(fā)、芯片數(shù)模設(shè)計(jì)、存儲(chǔ)設(shè)計(jì)團(tuán)隊(duì)。只有將“存”與“算”結(jié)合,才能做出真正具有競爭力的產(chǎn)品。
依托技術(shù)優(yōu)勢,推動(dòng)ReRAM生態(tài)搭建
當(dāng)前,基于其ReRAM技術(shù),昕原半導(dǎo)體的產(chǎn)品線聚焦在新型存儲(chǔ)SoC芯片、AI存算模塊/IP、高性能SoC芯片這三大應(yīng)用方向。
在SoC方向,昕原推出了28nm制程的ReRAM安全存儲(chǔ)芯片“昕·山文”系列。該系列芯片目前已在工控領(lǐng)域頭部企業(yè)禾川科技的產(chǎn)線上量產(chǎn)商用。 基于ReRAM PUF(Physical Unclonable Function-物理不可克隆函數(shù))技術(shù)的“昕·山文”具有自生唯一性和物理不可克隆性兩大安全特性,為系統(tǒng)提供了更高的抗物理攻擊安全性。
在AI存算方向上,以昕原第一代的ReRAM存算加速陣列為核心的存算芯片產(chǎn)品即將流片,采用28nm制程工藝,能效比可以做到優(yōu)于傳統(tǒng)AI芯片一個(gè)數(shù)量級(jí)。下一代更高密度的、基于22nm制程工藝的存算加速陣列也在開發(fā)中。
存算一體相比傳統(tǒng)AI芯片技術(shù)仍然比較年輕,新技術(shù)的商業(yè)落地需要學(xué)術(shù)界與產(chǎn)業(yè)界共同努力。昕原作為國內(nèi)最早實(shí)現(xiàn)ReRAM技術(shù)商業(yè)化落地的公司,可以提供成熟的ReRAM存儲(chǔ)介質(zhì)、中試生產(chǎn)線的流片能力、不斷迭代的器件開發(fā)能力、完整的電路設(shè)計(jì)能力與產(chǎn)業(yè)界、學(xué)術(shù)界的朋友一起建設(shè)存算一體的生態(tài)圈。
近年間,存算一體技術(shù)成為半導(dǎo)體產(chǎn)業(yè)的最新熱點(diǎn),既在ISSCC、IEDM等頂級(jí)學(xué)術(shù)會(huì)議上引發(fā)熱點(diǎn)討論,半導(dǎo)體國際巨頭如三星、SK海力士、臺(tái)積電、英特爾、美光、IBM等也紛紛推出最新研究成果。
舉個(gè)例子,在今年的ISSCC 2022上,臺(tái)積電一口氣發(fā)布了6篇存算一體技術(shù)的相關(guān)論文,覆蓋多種新型存儲(chǔ)器類別,其投入之巨可見一斑。
創(chuàng)業(yè)市場同樣風(fēng)起云涌。
僅以國內(nèi)市場為例,近年間,一大批如知存科技、九天睿芯、億鑄科技、智芯科微電子、千芯科技和蘋芯科技等專注于存算一體的新興創(chuàng)企紛紛斬獲融資或披露進(jìn)展,市場關(guān)注度持續(xù)攀升。
存算一體,產(chǎn)業(yè)最新風(fēng)口
近年來,自動(dòng)駕駛、數(shù)據(jù)處理中心以及AR/VR元宇宙等高密度計(jì)算場景的蓬勃發(fā)展,帶動(dòng)了以AI芯片為首的一大批新型半導(dǎo)體技術(shù)的爆發(fā)。
然而,隨著AI芯片走向100Tops、1000Tops甚至更高的算力水平,傳統(tǒng)馮·諾伊曼架構(gòu)卻成了制約市場應(yīng)用的最大瓶頸。
在馮·諾伊曼架構(gòu)之下,芯片的存儲(chǔ)區(qū)域和計(jì)算區(qū)域是分離的,計(jì)算時(shí),數(shù)據(jù)需要在兩個(gè)區(qū)域之間來回搬運(yùn)。 隨著神經(jīng)網(wǎng)絡(luò)模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長,“數(shù)據(jù)搬運(yùn)”已經(jīng)成為高效能計(jì)算性能和功耗的瓶頸,業(yè)內(nèi)俗稱“存儲(chǔ)墻”。據(jù)統(tǒng)計(jì),大算力的AI應(yīng)用中,數(shù)據(jù)搬運(yùn)操作消耗90%的時(shí)間和功耗,數(shù)據(jù)搬運(yùn)的功耗是運(yùn)算的650倍。
![存算一體](http://rz-tex.com/file/upload/202210/11/09/09-28-45-15-17962.png)
存算一體是解決存儲(chǔ)墻問題的最佳方案之一。
存算一體,顧名思義,就是將計(jì)算單元和存儲(chǔ)單元合二為一,用存儲(chǔ)單元完成計(jì)算工作,從而大幅度減少數(shù)據(jù)搬運(yùn)的過程。
理論上,這項(xiàng)技術(shù)最高能將芯片計(jì)算速度與能效提高超過兩個(gè)數(shù)量級(jí)。
馮·諾伊曼架構(gòu),承載了過去80年間,計(jì)算機(jī)技術(shù)的爆炸式發(fā)展,奠定了整個(gè)微電子時(shí)代的基礎(chǔ)。
挑戰(zhàn)它,甚至戰(zhàn)勝它,意味著一個(gè)萬億級(jí)別的全新時(shí)代,正在來臨。
低功耗、大算力,魚與熊掌必須兼得
當(dāng)前的存算一體技術(shù)路徑中,既有使用Flash、SRAM等傳統(tǒng)存儲(chǔ)器的方案,也有使用ReRAM(RRAM)、PCM、MRAM等新型存儲(chǔ)器的方案。
不同方案的適用場景不盡相同。舉個(gè)例子,F(xiàn)lash方案的運(yùn)算功耗極低,能夠適用于超低功耗的極端邊緣應(yīng)用場景,如超低功耗的語音物聯(lián)網(wǎng);但其半導(dǎo)體工藝難以兼容先進(jìn)節(jié)點(diǎn)。
相反,SRAM方案讀寫速度快,兼容先進(jìn)工藝節(jié)點(diǎn),能滿足高性能計(jì)算需求,但其存儲(chǔ)密度難以提升,在存儲(chǔ)密集場景下難免出現(xiàn)數(shù)據(jù)搬運(yùn)的老問題,這會(huì)損失一部分存算帶來的優(yōu)勢提升,另外SRAM的漏電大的特性也會(huì)導(dǎo)致SoC芯片的靜態(tài)待機(jī)功耗大幅提高。
低功耗、大算力、可落地,是否有方案能夠解決這“魚與熊掌不可兼得”的困難問題?
新型存儲(chǔ)技術(shù)之一的ReRAM技術(shù),也許是答案。
ReRAM全稱為阻變存儲(chǔ)器,或憶阻器,屬于新型非易失性存儲(chǔ)技術(shù),斷電后不會(huì)存在數(shù)據(jù)丟失問題。
典型的ReRAM由兩個(gè)電極夾一個(gè)薄介電層組成,通過改變上下電極的電壓,形成不同的電阻值,進(jìn)而代表不同的存儲(chǔ)狀態(tài),實(shí)現(xiàn)數(shù)據(jù)的讀寫。
ReRAM技術(shù)利用阻值特性,可以在存儲(chǔ)介質(zhì)上實(shí)現(xiàn)乘法操作,且運(yùn)行功耗很低,是極優(yōu)的存內(nèi)計(jì)算介質(zhì)。
作為新型存儲(chǔ)器的代表之一,ReRAM具備讀取性能高、讀取功耗低、密度高和成本低等特點(diǎn),可以很好的兼顧大算力、低功耗的存算需求。另外非易失的特性也可以大大降低芯片的靜態(tài)待機(jī)功耗。
同時(shí)ReRAM技術(shù)還能夠很好地兼容28nm、22nm、甚至14nm、12nm等先進(jìn)的CMOS工藝,滿足不同工藝節(jié)點(diǎn)的SoC芯片的集成需求。
“存”與“算”缺一不可
作為全球關(guān)注的前沿技術(shù),ReRAM技術(shù)在中國也處在快速發(fā)展當(dāng)中。
今年上半年,國內(nèi)創(chuàng)業(yè)公司昕原半導(dǎo)體宣布,其大陸首條28/22nm ReRAM 12寸中試生產(chǎn)線正式完成裝機(jī)驗(yàn)收,并在工控領(lǐng)域達(dá)成量產(chǎn)商用。
![昕原半導(dǎo)體](http://rz-tex.com/file/upload/202210/11/09/09-28-20-52-17962.png)
昕原半導(dǎo)體技術(shù)人員對中試線進(jìn)行設(shè)備調(diào)試
這是中國大陸第一條28/22nm ReRAM 12寸中試生產(chǎn)線,中國大陸第一次在ReRAM賽道與國際同行處于同一起跑線上,也為存算一體的發(fā)展注入了新勢能。
昕原半導(dǎo)體新技術(shù)研究院負(fù)責(zé)人周博士告訴36氪,存算一體的設(shè)計(jì)是“存”與“算”耦合設(shè)計(jì),是一個(gè)交替提升的過程。這也意味著,存算一體從實(shí)驗(yàn)室走到商業(yè)應(yīng)用的過程中,不僅僅需要團(tuán)隊(duì)擁有頂級(jí)計(jì)算設(shè)計(jì)能力,還需要對存儲(chǔ)、對器件本身具有深度的認(rèn)知和不斷改進(jìn)的能力,可以根據(jù)器件特性進(jìn)行相應(yīng)的優(yōu)化與性能加深設(shè)計(jì)。
“比如我們器件的高低阻值、開關(guān)比、讀寫IV曲線都會(huì)影響存算電路的設(shè)計(jì),這會(huì)體現(xiàn)到最終的性能與能耗數(shù)據(jù)上,我們可以根據(jù)我們器件的特點(diǎn)做‘定制’設(shè)計(jì)與優(yōu)化,這樣整體的性能可以得到最大提升;同時(shí)我們器件和制程工藝也在不斷的迭代優(yōu)化中,這樣產(chǎn)品與器件可以做到良性循環(huán)” 周博士告訴36氪。
相對而言,單獨(dú)計(jì)算芯片設(shè)計(jì)大都有跡可循,有一定難度但并不是無法達(dá)成的任務(wù);而存儲(chǔ)器件的性能迭代以及存算耦合設(shè)計(jì)能力才真正的考驗(yàn)團(tuán)隊(duì)的能力。存儲(chǔ)器件和工藝制程的迭代的設(shè)計(jì)往往要求具有一條芯片產(chǎn)線能力,產(chǎn)線不僅意味著設(shè)備同時(shí)還要求專業(yè)的運(yùn)營、工藝制程團(tuán)隊(duì)、器件設(shè)計(jì)能力,只有四者合一才能具備器件迭代能力。
因此在傳統(tǒng)的存儲(chǔ)領(lǐng)域,只有像三星、美光和英特爾這樣的大廠具備器件迭代能力。
在新型存儲(chǔ)領(lǐng)域,昕原是目前國內(nèi)唯一具備ReRAM器件和工藝制程高速迭代優(yōu)化設(shè)計(jì)能力的團(tuán)隊(duì),不僅擁有自己的中試生產(chǎn)線,也擁有完整專業(yè)的工藝制程開發(fā)、器件開發(fā)、芯片數(shù)模設(shè)計(jì)、存儲(chǔ)設(shè)計(jì)團(tuán)隊(duì)。只有將“存”與“算”結(jié)合,才能做出真正具有競爭力的產(chǎn)品。
依托技術(shù)優(yōu)勢,推動(dòng)ReRAM生態(tài)搭建
當(dāng)前,基于其ReRAM技術(shù),昕原半導(dǎo)體的產(chǎn)品線聚焦在新型存儲(chǔ)SoC芯片、AI存算模塊/IP、高性能SoC芯片這三大應(yīng)用方向。
在SoC方向,昕原推出了28nm制程的ReRAM安全存儲(chǔ)芯片“昕·山文”系列。該系列芯片目前已在工控領(lǐng)域頭部企業(yè)禾川科技的產(chǎn)線上量產(chǎn)商用。 基于ReRAM PUF(Physical Unclonable Function-物理不可克隆函數(shù))技術(shù)的“昕·山文”具有自生唯一性和物理不可克隆性兩大安全特性,為系統(tǒng)提供了更高的抗物理攻擊安全性。
![ReRAM安全存儲(chǔ)芯片](http://rz-tex.com/file/upload/202210/11/09/09-27-36-56-17962.jpg)
“昕·山文”系列ReRAM安全存儲(chǔ)芯片
在AI存算方向上,以昕原第一代的ReRAM存算加速陣列為核心的存算芯片產(chǎn)品即將流片,采用28nm制程工藝,能效比可以做到優(yōu)于傳統(tǒng)AI芯片一個(gè)數(shù)量級(jí)。下一代更高密度的、基于22nm制程工藝的存算加速陣列也在開發(fā)中。
存算一體相比傳統(tǒng)AI芯片技術(shù)仍然比較年輕,新技術(shù)的商業(yè)落地需要學(xué)術(shù)界與產(chǎn)業(yè)界共同努力。昕原作為國內(nèi)最早實(shí)現(xiàn)ReRAM技術(shù)商業(yè)化落地的公司,可以提供成熟的ReRAM存儲(chǔ)介質(zhì)、中試生產(chǎn)線的流片能力、不斷迭代的器件開發(fā)能力、完整的電路設(shè)計(jì)能力與產(chǎn)業(yè)界、學(xué)術(shù)界的朋友一起建設(shè)存算一體的生態(tài)圈。