核心提示:近年間,存算一體技術成為半導體產業(yè)的最新熱點,既在ISSCC、IEDM等頂級學術會議上引發(fā)熱點討論,半導體
存算一體火了。
近年間,存算一體技術成為半導體產業(yè)的最新熱點,既在ISSCC、IEDM等頂級學術會議上引發(fā)熱點討論,半導體國際巨頭如三星、SK海力士、臺積電、英特爾、美光、IBM等也紛紛推出最新研究成果。
舉個例子,在今年的ISSCC 2022上,臺積電一口氣發(fā)布了6篇存算一體技術的相關論文,覆蓋多種新型存儲器類別,其投入之巨可見一斑。
創(chuàng)業(yè)市場同樣風起云涌。
僅以國內市場為例,近年間,一大批如知存科技、九天睿芯、億鑄科技、智芯科微電子、千芯科技和蘋芯科技等專注于存算一體的新興創(chuàng)企紛紛斬獲融資或披露進展,市場關注度持續(xù)攀升。
存算一體,產業(yè)最新風口
近年來,自動駕駛、數(shù)據(jù)處理中心以及AR/VR元宇宙等高密度計算場景的蓬勃發(fā)展,帶動了以AI芯片為首的一大批新型半導體技術的爆發(fā)。
然而,隨著AI芯片走向100Tops、1000Tops甚至更高的算力水平,傳統(tǒng)馮·諾伊曼架構卻成了制約市場應用的最大瓶頸。
在馮·諾伊曼架構之下,芯片的存儲區(qū)域和計算區(qū)域是分離的,計算時,數(shù)據(jù)需要在兩個區(qū)域之間來回搬運。 隨著神經網(wǎng)絡模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長,“數(shù)據(jù)搬運”已經成為高效能計算性能和功耗的瓶頸,業(yè)內俗稱“存儲墻”。據(jù)統(tǒng)計,大算力的AI應用中,數(shù)據(jù)搬運操作消耗90%的時間和功耗,數(shù)據(jù)搬運的功耗是運算的650倍。
存算一體是解決存儲墻問題的最佳方案之一。
存算一體,顧名思義,就是將計算單元和存儲單元合二為一,用存儲單元完成計算工作,從而大幅度減少數(shù)據(jù)搬運的過程。
理論上,這項技術最高能將芯片計算速度與能效提高超過兩個數(shù)量級。
馮·諾伊曼架構,承載了過去80年間,計算機技術的爆炸式發(fā)展,奠定了整個微電子時代的基礎。
挑戰(zhàn)它,甚至戰(zhàn)勝它,意味著一個萬億級別的全新時代,正在來臨。
低功耗、大算力,魚與熊掌必須兼得
當前的存算一體技術路徑中,既有使用Flash、SRAM等傳統(tǒng)存儲器的方案,也有使用ReRAM(RRAM)、PCM、MRAM等新型存儲器的方案。
不同方案的適用場景不盡相同。舉個例子,F(xiàn)lash方案的運算功耗極低,能夠適用于超低功耗的極端邊緣應用場景,如超低功耗的語音物聯(lián)網(wǎng);但其半導體工藝難以兼容先進節(jié)點。
相反,SRAM方案讀寫速度快,兼容先進工藝節(jié)點,能滿足高性能計算需求,但其存儲密度難以提升,在存儲密集場景下難免出現(xiàn)數(shù)據(jù)搬運的老問題,這會損失一部分存算帶來的優(yōu)勢提升,另外SRAM的漏電大的特性也會導致SoC芯片的靜態(tài)待機功耗大幅提高。
低功耗、大算力、可落地,是否有方案能夠解決這“魚與熊掌不可兼得”的困難問題?
新型存儲技術之一的ReRAM技術,也許是答案。
ReRAM全稱為阻變存儲器,或憶阻器,屬于新型非易失性存儲技術,斷電后不會存在數(shù)據(jù)丟失問題。
典型的ReRAM由兩個電極夾一個薄介電層組成,通過改變上下電極的電壓,形成不同的電阻值,進而代表不同的存儲狀態(tài),實現(xiàn)數(shù)據(jù)的讀寫。
ReRAM技術利用阻值特性,可以在存儲介質上實現(xiàn)乘法操作,且運行功耗很低,是極優(yōu)的存內計算介質。
作為新型存儲器的代表之一,ReRAM具備讀取性能高、讀取功耗低、密度高和成本低等特點,可以很好的兼顧大算力、低功耗的存算需求。另外非易失的特性也可以大大降低芯片的靜態(tài)待機功耗。
同時ReRAM技術還能夠很好地兼容28nm、22nm、甚至14nm、12nm等先進的CMOS工藝,滿足不同工藝節(jié)點的SoC芯片的集成需求。
“存”與“算”缺一不可
作為全球關注的前沿技術,ReRAM技術在中國也處在快速發(fā)展當中。
今年上半年,國內創(chuàng)業(yè)公司昕原半導體宣布,其大陸首條28/22nm ReRAM 12寸中試生產線正式完成裝機驗收,并在工控領域達成量產商用。
這是中國大陸第一條28/22nm ReRAM 12寸中試生產線,中國大陸第一次在ReRAM賽道與國際同行處于同一起跑線上,也為存算一體的發(fā)展注入了新勢能。
昕原半導體新技術研究院負責人周博士告訴36氪,存算一體的設計是“存”與“算”耦合設計,是一個交替提升的過程。這也意味著,存算一體從實驗室走到商業(yè)應用的過程中,不僅僅需要團隊擁有頂級計算設計能力,還需要對存儲、對器件本身具有深度的認知和不斷改進的能力,可以根據(jù)器件特性進行相應的優(yōu)化與性能加深設計。
“比如我們器件的高低阻值、開關比、讀寫IV曲線都會影響存算電路的設計,這會體現(xiàn)到最終的性能與能耗數(shù)據(jù)上,我們可以根據(jù)我們器件的特點做‘定制’設計與優(yōu)化,這樣整體的性能可以得到最大提升;同時我們器件和制程工藝也在不斷的迭代優(yōu)化中,這樣產品與器件可以做到良性循環(huán)” 周博士告訴36氪。
相對而言,單獨計算芯片設計大都有跡可循,有一定難度但并不是無法達成的任務;而存儲器件的性能迭代以及存算耦合設計能力才真正的考驗團隊的能力。存儲器件和工藝制程的迭代的設計往往要求具有一條芯片產線能力,產線不僅意味著設備同時還要求專業(yè)的運營、工藝制程團隊、器件設計能力,只有四者合一才能具備器件迭代能力。
因此在傳統(tǒng)的存儲領域,只有像三星、美光和英特爾這樣的大廠具備器件迭代能力。
在新型存儲領域,昕原是目前國內唯一具備ReRAM器件和工藝制程高速迭代優(yōu)化設計能力的團隊,不僅擁有自己的中試生產線,也擁有完整專業(yè)的工藝制程開發(fā)、器件開發(fā)、芯片數(shù)模設計、存儲設計團隊。只有將“存”與“算”結合,才能做出真正具有競爭力的產品。
依托技術優(yōu)勢,推動ReRAM生態(tài)搭建
當前,基于其ReRAM技術,昕原半導體的產品線聚焦在新型存儲SoC芯片、AI存算模塊/IP、高性能SoC芯片這三大應用方向。
在SoC方向,昕原推出了28nm制程的ReRAM安全存儲芯片“昕·山文”系列。該系列芯片目前已在工控領域頭部企業(yè)禾川科技的產線上量產商用。 基于ReRAM PUF(Physical Unclonable Function-物理不可克隆函數(shù))技術的“昕·山文”具有自生唯一性和物理不可克隆性兩大安全特性,為系統(tǒng)提供了更高的抗物理攻擊安全性。
在AI存算方向上,以昕原第一代的ReRAM存算加速陣列為核心的存算芯片產品即將流片,采用28nm制程工藝,能效比可以做到優(yōu)于傳統(tǒng)AI芯片一個數(shù)量級。下一代更高密度的、基于22nm制程工藝的存算加速陣列也在開發(fā)中。
存算一體相比傳統(tǒng)AI芯片技術仍然比較年輕,新技術的商業(yè)落地需要學術界與產業(yè)界共同努力。昕原作為國內最早實現(xiàn)ReRAM技術商業(yè)化落地的公司,可以提供成熟的ReRAM存儲介質、中試生產線的流片能力、不斷迭代的器件開發(fā)能力、完整的電路設計能力與產業(yè)界、學術界的朋友一起建設存算一體的生態(tài)圈。
近年間,存算一體技術成為半導體產業(yè)的最新熱點,既在ISSCC、IEDM等頂級學術會議上引發(fā)熱點討論,半導體國際巨頭如三星、SK海力士、臺積電、英特爾、美光、IBM等也紛紛推出最新研究成果。
舉個例子,在今年的ISSCC 2022上,臺積電一口氣發(fā)布了6篇存算一體技術的相關論文,覆蓋多種新型存儲器類別,其投入之巨可見一斑。
創(chuàng)業(yè)市場同樣風起云涌。
僅以國內市場為例,近年間,一大批如知存科技、九天睿芯、億鑄科技、智芯科微電子、千芯科技和蘋芯科技等專注于存算一體的新興創(chuàng)企紛紛斬獲融資或披露進展,市場關注度持續(xù)攀升。
存算一體,產業(yè)最新風口
近年來,自動駕駛、數(shù)據(jù)處理中心以及AR/VR元宇宙等高密度計算場景的蓬勃發(fā)展,帶動了以AI芯片為首的一大批新型半導體技術的爆發(fā)。
然而,隨著AI芯片走向100Tops、1000Tops甚至更高的算力水平,傳統(tǒng)馮·諾伊曼架構卻成了制約市場應用的最大瓶頸。
在馮·諾伊曼架構之下,芯片的存儲區(qū)域和計算區(qū)域是分離的,計算時,數(shù)據(jù)需要在兩個區(qū)域之間來回搬運。 隨著神經網(wǎng)絡模型層數(shù)、規(guī)模以及數(shù)據(jù)處理量的不斷增長,“數(shù)據(jù)搬運”已經成為高效能計算性能和功耗的瓶頸,業(yè)內俗稱“存儲墻”。據(jù)統(tǒng)計,大算力的AI應用中,數(shù)據(jù)搬運操作消耗90%的時間和功耗,數(shù)據(jù)搬運的功耗是運算的650倍。
存算一體是解決存儲墻問題的最佳方案之一。
存算一體,顧名思義,就是將計算單元和存儲單元合二為一,用存儲單元完成計算工作,從而大幅度減少數(shù)據(jù)搬運的過程。
理論上,這項技術最高能將芯片計算速度與能效提高超過兩個數(shù)量級。
馮·諾伊曼架構,承載了過去80年間,計算機技術的爆炸式發(fā)展,奠定了整個微電子時代的基礎。
挑戰(zhàn)它,甚至戰(zhàn)勝它,意味著一個萬億級別的全新時代,正在來臨。
低功耗、大算力,魚與熊掌必須兼得
當前的存算一體技術路徑中,既有使用Flash、SRAM等傳統(tǒng)存儲器的方案,也有使用ReRAM(RRAM)、PCM、MRAM等新型存儲器的方案。
不同方案的適用場景不盡相同。舉個例子,F(xiàn)lash方案的運算功耗極低,能夠適用于超低功耗的極端邊緣應用場景,如超低功耗的語音物聯(lián)網(wǎng);但其半導體工藝難以兼容先進節(jié)點。
相反,SRAM方案讀寫速度快,兼容先進工藝節(jié)點,能滿足高性能計算需求,但其存儲密度難以提升,在存儲密集場景下難免出現(xiàn)數(shù)據(jù)搬運的老問題,這會損失一部分存算帶來的優(yōu)勢提升,另外SRAM的漏電大的特性也會導致SoC芯片的靜態(tài)待機功耗大幅提高。
低功耗、大算力、可落地,是否有方案能夠解決這“魚與熊掌不可兼得”的困難問題?
新型存儲技術之一的ReRAM技術,也許是答案。
ReRAM全稱為阻變存儲器,或憶阻器,屬于新型非易失性存儲技術,斷電后不會存在數(shù)據(jù)丟失問題。
典型的ReRAM由兩個電極夾一個薄介電層組成,通過改變上下電極的電壓,形成不同的電阻值,進而代表不同的存儲狀態(tài),實現(xiàn)數(shù)據(jù)的讀寫。
ReRAM技術利用阻值特性,可以在存儲介質上實現(xiàn)乘法操作,且運行功耗很低,是極優(yōu)的存內計算介質。
作為新型存儲器的代表之一,ReRAM具備讀取性能高、讀取功耗低、密度高和成本低等特點,可以很好的兼顧大算力、低功耗的存算需求。另外非易失的特性也可以大大降低芯片的靜態(tài)待機功耗。
同時ReRAM技術還能夠很好地兼容28nm、22nm、甚至14nm、12nm等先進的CMOS工藝,滿足不同工藝節(jié)點的SoC芯片的集成需求。
“存”與“算”缺一不可
作為全球關注的前沿技術,ReRAM技術在中國也處在快速發(fā)展當中。
今年上半年,國內創(chuàng)業(yè)公司昕原半導體宣布,其大陸首條28/22nm ReRAM 12寸中試生產線正式完成裝機驗收,并在工控領域達成量產商用。
昕原半導體技術人員對中試線進行設備調試
這是中國大陸第一條28/22nm ReRAM 12寸中試生產線,中國大陸第一次在ReRAM賽道與國際同行處于同一起跑線上,也為存算一體的發(fā)展注入了新勢能。
昕原半導體新技術研究院負責人周博士告訴36氪,存算一體的設計是“存”與“算”耦合設計,是一個交替提升的過程。這也意味著,存算一體從實驗室走到商業(yè)應用的過程中,不僅僅需要團隊擁有頂級計算設計能力,還需要對存儲、對器件本身具有深度的認知和不斷改進的能力,可以根據(jù)器件特性進行相應的優(yōu)化與性能加深設計。
“比如我們器件的高低阻值、開關比、讀寫IV曲線都會影響存算電路的設計,這會體現(xiàn)到最終的性能與能耗數(shù)據(jù)上,我們可以根據(jù)我們器件的特點做‘定制’設計與優(yōu)化,這樣整體的性能可以得到最大提升;同時我們器件和制程工藝也在不斷的迭代優(yōu)化中,這樣產品與器件可以做到良性循環(huán)” 周博士告訴36氪。
相對而言,單獨計算芯片設計大都有跡可循,有一定難度但并不是無法達成的任務;而存儲器件的性能迭代以及存算耦合設計能力才真正的考驗團隊的能力。存儲器件和工藝制程的迭代的設計往往要求具有一條芯片產線能力,產線不僅意味著設備同時還要求專業(yè)的運營、工藝制程團隊、器件設計能力,只有四者合一才能具備器件迭代能力。
因此在傳統(tǒng)的存儲領域,只有像三星、美光和英特爾這樣的大廠具備器件迭代能力。
在新型存儲領域,昕原是目前國內唯一具備ReRAM器件和工藝制程高速迭代優(yōu)化設計能力的團隊,不僅擁有自己的中試生產線,也擁有完整專業(yè)的工藝制程開發(fā)、器件開發(fā)、芯片數(shù)模設計、存儲設計團隊。只有將“存”與“算”結合,才能做出真正具有競爭力的產品。
依托技術優(yōu)勢,推動ReRAM生態(tài)搭建
當前,基于其ReRAM技術,昕原半導體的產品線聚焦在新型存儲SoC芯片、AI存算模塊/IP、高性能SoC芯片這三大應用方向。
在SoC方向,昕原推出了28nm制程的ReRAM安全存儲芯片“昕·山文”系列。該系列芯片目前已在工控領域頭部企業(yè)禾川科技的產線上量產商用。 基于ReRAM PUF(Physical Unclonable Function-物理不可克隆函數(shù))技術的“昕·山文”具有自生唯一性和物理不可克隆性兩大安全特性,為系統(tǒng)提供了更高的抗物理攻擊安全性。
“昕·山文”系列ReRAM安全存儲芯片
在AI存算方向上,以昕原第一代的ReRAM存算加速陣列為核心的存算芯片產品即將流片,采用28nm制程工藝,能效比可以做到優(yōu)于傳統(tǒng)AI芯片一個數(shù)量級。下一代更高密度的、基于22nm制程工藝的存算加速陣列也在開發(fā)中。
存算一體相比傳統(tǒng)AI芯片技術仍然比較年輕,新技術的商業(yè)落地需要學術界與產業(yè)界共同努力。昕原作為國內最早實現(xiàn)ReRAM技術商業(yè)化落地的公司,可以提供成熟的ReRAM存儲介質、中試生產線的流片能力、不斷迭代的器件開發(fā)能力、完整的電路設計能力與產業(yè)界、學術界的朋友一起建設存算一體的生態(tài)圈。