DeepSeek通過模型算法優化,在顯著降低訓練成本與能耗的情形下,實現了與國際頂尖大模型相當的智能水平。對于算力行業的電力需求而言,一方面,DeepSeek的系列優化技術可以有效減少芯片運算,降低當前算力行業的電力需求;另一方面,DeekSeek將適配更多的國產GPU芯片,有效緩解“卡脖子”問題并激發社會的普遍應用,進而導致用電總量的提升。因此,有必要分析DeepSeek的電力影響邏輯,研判未來算力行業的電力需求變化趨勢并有效應對。
技術上看,DeepSeek引領的算法優化、疊加開源的傳播優勢,將促使算力行業由“算力”驅動轉向“算力+算法”并重,進而影響未來算力行業的電力需求。
以ChatGPT為代表的傳統大模型,主要由堆砌算力和樣本量提升大模型能力。DeepSeek帶來的系列大模型技術,通過“樣本、架構、編程、應用”四方面優化算力需求,將影響未來算力行業的電力需求邏輯。
樣本方面,傳統的通算、智算訓練一般采用32位或16位精度,而DeepSeek的訓練采用了16位和8位混合精度框架。如未來算力行業均采用該精度,則相較于傳統的32位精度,訓練量將降低50%,甚至75%。且隨著GPU芯片對低精度樣本更好地適配,將帶來算效的提升,從而使訓練能耗顯著降低。
架構方面,通過僅激活部分參數,大模型推理可以實現更低的算力消耗。DeepSeek的MLA和MOE架構,相較于其他大模型激活的參數量占比更少,疊加“開源”優勢,有望吸引其他大模型模仿學習。若其他大模型未來推理過程中,激活參數占比降至DeepSeek同等水平,則能夠整體降低推理能耗的60%~70%。
編程方面,DeepSeek通過高水平編寫更底層的PTX語言,繞開英偉達成熟的CUDA架構,提升GPU利用率(MFU)約60%,向全球展示了算力緊張情景下的高效解決方案。但該技術的實現依賴于高級編程人才,預計多數大模型公司仍將選擇CUDA架構,未來能耗壓降有限,但能有效緩解算力“卡脖子”問題。
應用方面,DeekSeek使用知識蒸餾技術,從6710億全參數模型中蒸餾出15億、70億、140億、700億參數的多類型小模型,避免重新訓練。由于“免費+開源”的疊加效應,DeepSeek極大降低了大模型應用門檻,預計未來社會應用將爆發式增長,帶動能耗的整體上升。
行業來看,DeepSeek引發的生態變革,疊加國內政策與國際競合因素,將促使社會應用需求發生變化,預計未來將呈現出“先穩后升”的用電態勢。
模型技術主要影響算力需求,除算力需求外,用電量還受到數據中心PUE、算力設備負載率等因素的綜合影響。DeepSeek引發模型技術之外行業生態變革,可能改變行業生態因素,從而影響整體用電需求。
目前,我國智能算力占比不足40%,雖然預計在2028年將達到75%,但目前仍以通用算力為主。DeepSeek帶來模型技術變革,當前主要作用于智算行業,通算和超算行業應用該類技術需進一步適配和調整。因此,DeepSeek帶來的能耗壓降影響,將不會在短期內大量釋放。
傳統大模型對算力規模的高要求,決定了主要的訓練工作在中大型算力中心完成。DeepSeek對算力規模需求的降低,將使得中小型算力中心也具備模型訓練和微調的能力。一方面,社會使用的擴大將對沖掉部分先進技術對能耗的壓降;另一方面,中小型算力中心PUE(約1.3~1.5)相較于大型算力中心PUE(約1.1~1.3)普遍較高,也將對沖掉部分能耗壓降的規模。
目前,英偉達GPU市場占有率超過90%,隨著AMD、華為等公司宣布針對DeepSeek進行芯片適配,英偉達的芯片壟斷將被打破,引入競爭將進一步降低GPU價格。根據杰文斯悖論,預計芯片國產化適配后,未來大模型在制造、信息、材料、家居等行業的應用將更為普遍,長遠來看將進一步拉升全社會用電量。
能源行業有必要積極關注社會訓練、推理算力的用電趨勢分化,未來可以考慮將部分社會應用模式創新納入能源行業大模型應用體系。
從全國一體化算力網加快建設的態勢來看,未來訓練需求將集中于各樞紐節點。短期內,DeepSeek模型優化技術將對沖訓練需求上升,電力電網設施配套不宜過早、過多、過快;長遠看,未來訓練算力需求將持續增加,樞紐節點是算力保電重點,有必要因時因地、分層分級地精細劃分裕度區間,避免資源錯配錯位。
研究認為,由于數字、電商、高端制造等產業的聚集效應,以及大模型應用的可復制性和擴散效應,DeepSeek帶來的社會應用增長,將率先在數字經濟發達區域出現,需及時研判供電保電壓力變化。
DeepSeek類蒸餾小模型推理算力需求低、能耗低、開源優勢明顯,有望在用戶側以小規模算力實現大量部署,催生出多種創新應用模式。建議持續關注社會應用模式創新,優化能源行業“集中—分散”硬件資源布局,借鑒納入無人機智能巡檢、智能機器人等能源行業專業應用。
|