在人工智能、大數據、物聯網等技術的驅動下,全球數據量正以指數級速度增長,對計算能力的需求達到了前所未有的高度。傳統的馮·諾依曼架構中,計算單元與存儲單元物理分離,數據需要在處理器與內存之間頻繁移動,形成了著名的“內存墻”問題。這不僅造成了巨大的能量消耗(數據搬運的能耗可能占總能耗的60%以上),更嚴重制約了算力的有效提升和系統能效。在此背景下,存算一體(Computing-in-Memory, CIM) 作為一種顛覆性的內核架構創新,應運而生,旨在從根本上打破算力與能效的極限,為下一代計算范式開辟道路。
存算一體并非一個全新的概念,其思想早在20世紀便已萌芽。但其真正的爆發,得益于近年來半導體工藝、新型存儲器件(如ReRAM、PCM、MRAM等)和算法模型的協同進步。其核心思想是:將計算功能融入存儲單元之中,直接在數據存儲的位置完成計算,從而徹底消除或大幅減少數據搬運的需求。
從架構層面看,存算一體主要分為兩大技術路徑:
這種架構創新,將計算從“中心化”的CPU/GPU,分散到了“存”的每一個角落,實現了計算資源的根本性分布與重構。
存算一體架構帶來的性能突破是革命性的,主要體現在兩個維度:
1. 算力密度與能效比的指數級提升
通過消除數據搬運瓶頸,系統的主要能耗和延遲不再花在“路上”,而是集中于有用的計算本身。模擬存算一體芯片在執行矩陣乘加等核心AI運算時,能效比(TOPS/W)有望達到傳統架構(如GPU)的10-100倍甚至更高,同時算力密度也大幅增加。這為在邊緣設備端部署復雜的AI模型(如大語言模型的輕量化版本)提供了可能,實現了真正的“邊緣智能”。
2. 突破帶寬與延遲的束縛
在傳統架構中,內存帶寬是制約算力釋放的關鍵枷鎖。存算一體架構中,數據無需離開存儲陣列,相當于擁有近乎無限的“內部帶寬”,并且計算延遲極低。這對于需要處理海量數據流、要求實時響應的應用場景(如自動駕駛、高頻交易、實時視頻分析)至關重要。
存算一體不僅是計算芯片的革新,更將深刻重塑整個數據處理和存儲支持服務產業鏈。
對數據處理服務的變革:
- 邊緣計算與端側智能的普及:超高能效使得復雜數據處理能力可以下沉至攝像頭、傳感器、手機等終端設備,減少對云端的數據傳輸依賴,提升響應速度與隱私安全性。數據處理服務將從集中式云端向“云-邊-端”協同的立體化模式演進。
- 實時流處理成為常態:低延遲特性使得對數據流的實時分析、決策與反饋變得更加可行,推動數據分析從“批處理”向“實時流處理”全面升級。
- 算法與軟件的協同設計:需要開發新的編程模型、編譯器和算法,以充分發揮存算一體硬件的特性,如利用模擬計算的非精確特性發展近似計算算法。這將催生新的軟件工具鏈和開發生態。
對存儲支持服務的重塑:
- 存儲即計算:未來的存儲系統將不再是被動保存數據的倉庫,而是具備內稟計算能力的主動節點。存儲服務商可能提供“帶計算能力的存儲即服務”,客戶可以直接在存儲層進行數據篩選、過濾、聚合等初步計算,僅將有價值的結果上傳,極大節省網絡和中心算力資源。
- 智能存儲層級管理:結合存算一體芯片,存儲系統可以更智能地分析數據訪問模式與價值,實現數據在高速存算層與低速大容量存儲層之間的自動、優化調度,整體系統效率更高。
- 數據庫與數據倉庫的架構革新:數據庫的查詢、聚合等操作可以部分下推至存算一體存儲硬件中執行,顯著加速數據分析流程,為實時商業智能提供硬核支撐。
盡管前景廣闊,存算一體邁向大規模產業化仍面臨挑戰:
存算一體不會完全取代傳統CPU/GPU,而是作為一種異構計算的核心組成部分,在特定的計算密集型、能效敏感型任務中發揮無可替代的作用。預計其將率先在AI推理(邊緣端)、物聯網、移動設備、專業數據中心等領域實現突破性應用。隨著技術的不斷成熟和生態的逐步構建,存算一體有望引領計算架構進入一個“后馮·諾依曼”時代,真正解鎖算力與能效的無限潛力,為全球數字經濟提供源源不斷的強大動力。
###
存算一體,這場由內核架構創新驅動的革命,正在將計算從“搬運工”的桎梏中解放出來。它不僅是打破算力能效極限的技術利刃,更是重構從芯片到數據中心、從數據處理到存儲服務整個產業價值鏈的基石。投資于存算一體,即是投資于下一個計算時代的核心基礎設施。其發展進程,值得每一位科技從業者與投資者深度關注與積極參與。
如若轉載,請注明出處:http://m.moogee.cn/product/55.html
更新時間:2026-03-01 00:52:16