走進博大數據位于深圳前海的智算中心,一座造型方方正正、藍白相間的建筑格外引人注目。就在這座智算中心的機房里,一排排智算機柜整齊排列,服務器高速運轉,進行著復雜的數據分析與計算任務。
宋春雨/攝
“作為融合算力服務商,我們在自有的算力集群上部署了DeepSeek-R1671B全量版本供客戶使用,通過直接提供AI模型給用戶,創造市場上的算力需求,從而拉動我們智算中心高密機柜和算力服務的銷售。”博大數據副總裁白旭告訴證券時報記者。
隨著國產大模型DeepSeek火爆出圈,最近一段時間以來,來自各行各業的許多公司宣布部署DeepSeek大模型,應用端的算力需求迎來大爆發。業內人士分析稱,DeepSeek通過降低AI應用門檻,推動算力需求從“訓練主導”轉到“推理主導”。面對嶄新的行業變局,智算中心需加快轉型,從簡單的算力提供商轉向專業服務商,提供覆蓋算力全生命周期的專業服務,提高算力資源利用效率。
DeepSeek部署熱潮帶動算力需求提升
最近一段時間以來,企業部署DeepSeek的熱情仍然十分高漲。證券時報記者注意到,多家上市公司密集宣布已完成DeepSeek大模型的相關部署工作。
例如,海看股份2月18日在互動平臺表示,公司已在自研的AI智能審核平臺等垂類模型中部署接入DeepSeek模型,對自有平臺進行微調和優化。同日,卓創資訊也發布消息稱,已完成DeepSeek系列大模型的本地化部署,且正基于DeepSeek-R1模型,運用蒸餾技術,著力打造大宗商品行業大模型。
“DeepSeek很重要的一個意義,是對普通大眾進行了AI的科普及推廣。各行各業的人都知曉這款大模型,也紛紛去嘗試使用。這種集中的訪問與使用,帶動了算力需求的爆發。”中昊芯英解決方案架構師顧立程在接受證券時報記者采訪時表示,今年春節以來,很多客戶都在詢問公司智算中心與DeepSeek的適配情況。“目前,我們的智算中心已經能運行DeepSeek模型的各種蒸餾版本,并且表現都是非常不錯的。”顧立程說。
宋春雨/攝
DeepSeek作為一款開源大模型,憑借高性能與低成本的優勢,極大地降低了AI應用的門檻,正成為下游許多AI應用公司及終端廠商部署AI模型的優先選項。以不久前正式接入DeepSeek-R1大模型的智慧芽為例,該公司是一家科技創新信息服務商,公司技術負責人告訴證券時報記者,DeepSeek等開發的開源模型,確實可以幫助企業降低前期開發投入,尤其是可以節省高昂的基礎設施試錯成本。
記者采訪了解到,企業的需求不僅是本地化部署DeepSeek大模型,還有許多公司會基于DeepSeek大模型,依托自有行業數據進行定制化開發,訓練垂類模型或構建專業應用。
“印象深刻的是一家律師事務所,客戶希望我們能協助他們利用自有的行業數據對DeepSeek進行定制化開發,構建自有的專業領域智能應用,我們目前正在協同合作伙伴努力滿足客戶的需求。”白旭表示,DeepSeek有助于加速國內企業數字化轉型,政府、金融、制造等行業客戶因AI應用場景(如智能審批、數字孿生)的擴展,對高密機柜和邊緣算力設備的需求會大大增加。
從“訓練主導”到“推理主導”,國產算力芯片廠商迎利好
訓練成本低廉,這是DeepSeek區別于其他大模型的一大核心優勢。雖然DeepSeek并未公開R1模型確切的訓練成本,但根據此前V3模型發布時發表的論文,V3訓練成本僅為557.6萬美元,約為Meta開源大模型訓練成本的十分之一。
據記者采訪了解,大模型主要分為訓練和推理兩個階段,訓練是指用大量數據訓練大模型,通常需要極高的計算能力和存儲資源;推理是指將訓練好的模型應用于實際任務,如提問并生成文本、識別圖片與視頻等。
“傳統大模型訓練如同吞噬算力的黑洞,單次訓練成本動輒數千萬美元的巨額投入,筑起了只有科技巨頭才能逾越的技術壁壘。算力軍備競賽加劇了全球GPU資源的爭奪戰,形成了基礎模型研發的高度中心化格局。”上海經邑產業數智研究院副院長沈佳慶向證券時報記者表示,DeepSeek打破了這種既定的秩序,將推動算力需求的重新分層,過去高度集中的訓練算力需求會開始向應用端的推理算力需求擴散。
“早在去年年初,我們就預判智算中心的算力需求結構將從‘訓練主導’轉向‘推理主導’。大模型訓練出來后要做到有用、能用、好用,DeepSeek成功地做到了這一點從而爆火。”白旭表示,目前國產算力芯片廠商與國內OEM(原始設備制造)廠商合作推出DeepSeek一體機,國內各大云平臺也紛紛上線DeepSeek模型服務,這都大大降低了大模型應用的使用門檻。
除了帶動推理芯片需求增長外,DeepSeek對國產算力芯片廠商的利好,還來自于技術層面。顧立程告訴記者,在DeepSeek推出以前,國內大模型處于一個“百花齊放”的狀態。“中昊芯英作為一家AI芯片設計及國產算力硬件平臺解決方案商,涉及大量的大模型適配需求。而隨著國內大模型的逐漸聚焦,會加速我們在算力硬件平臺及軟件大模型全國產解決方案上的定型與市場化。”顧立程說。
事實上,自1月末以來,從云基礎設施服務商到國產算力芯片廠商,都在緊鑼密鼓地適配DeepSeek大模型。云基礎設施服務商方面,華為云、騰訊云、阿里云、百度云等主流的云廠商均已宣布DeepSeek相關模型上架,可供開發者部署調用,中國移動、中國電信、中國聯通三大基礎電信企業也全面接入DeepSeek。國產芯片公司也“聞風而動”,據證券時報記者不完全統計,包括天數智芯、摩爾線程、海光信息、云天勵飛、壁仞科技、燧原科技、沐曦、昆侖芯等在內的十余家國產芯片公司都已相繼宣布適配DeepSeek模型服務。
從提供算力到專業服務,智算中心迎轉型機遇
DeepSeek的崛起,引發了人們對于未來算力需求的廣泛關注。最近一段時間以來,二級市場中的算力板塊和相關個股也迎來了較大的波動。
沈佳慶認為,短期內,由于DeepSeek降低了訓練成本,會使得訓練環節對大規模算力的需求出現下降,從而將資源投入到具體解決方案的研發。“但中長期來看,DeepSeek一是會提升推理、微調的算力需求,使一部分原來用于訓練環節的閑置算力獲得應用;二是會刺激基礎大模型加速迭代,對算力的需求或將出現增長。”沈佳慶表示。
業內人士普遍認為,DeepSeek對智算中心將構成長期利好。但在DeepSeek帶來“潑天富貴”之前,業內對于各地踴躍建設、遍地開花的智算中心卻存有疑慮。據記者采訪了解,近年來,由于人工智能產業的蓬勃發展,全國掀起了規劃建設智算中心的熱潮,大大小小的智算中心如雨后春筍般在全國遍地開花。最近,國際數據公司(IDC)與浪潮信息聯合發布的《中國人工智能計算力發展評估報告》顯示,2024年中國智能算力規模同比增長了74.1%,顯示了我國在智算領域的大力投入。
然而,一些智算中心存在著利用程度不高、供需錯配的問題。沈佳慶分析稱,從供應側來看,為響應國家與地方產業規劃的政策導向,加之政府鼓勵,電信、IT軟硬件等領域國央企和大型民企,秉承“適度超前”的原則,開展大規模的智算中心建設,導致市場供給出現井噴;從需求側來看,市場需求雖有增長,但沒有出現明顯井噴。“一是國產軟硬件在效能、適用領域等方面還有差距,應用效果不及預期;二是在產業發展初期,技術還未成熟,企業從理性角度出發,購買產品或服務時要考慮多重因素,相對而言會比較謹慎。”沈佳慶說。
算力閑置,曾困擾國內不少智算中心,而DeepSeek或有助于緩解這一難題。“就像當年移動互聯網普及一樣,當大模型真正成為大家習慣使用的工具,到時就將迸發出非常龐大的算力需求。”顧立程表示,提前布局智算中心,才能保證需求真正爆發時,智算中心能夠承載得住這“潑天的流量”。
對于智算中心而言,DeepSeek還帶來了新的發展方向和機遇。據白旭介紹,智算中心的產品模式已不再局限于高密機柜和算力服務的提供,而是可以直接部署模型應用給企業使用。
“智算中心應從簡單的以硬件建設為主,轉向以提供專業服務為主的新發展階段。”沈佳慶認為,算力從一種基礎資源,到真正變成普遍應用的生產力工具,中間還有梗阻,這些也是智算中心能夠發力的市場機遇。“通過提供覆蓋算力全生命周期的專業服務,與產業鏈上不同的主體合作,提供包括算力調度、計量、優化、微調、封裝、維護、二次開發等在內的一攬子解決方案,將有效推動算力服務在各行各業的滲透應用,從而擴大整個智算中心的市場需求。”沈佳慶說。
校對:王朝全???