我們需要更多的DeepSeek。
“中國距離追上ChatGPT還有多遠?”
過去幾年里,這是幾乎每個中國大模型從業者們都被反復拷問的話題。
2025年初,這個問題被重新解構。 “來自東方的神秘力量”攪動全球科技圈,一度帶崩芯片股,也引領了持續一個月的“DeepSeek熱”。從巴黎到迪拜,近期所有國際性AI大會都在討論它,盡管它并未參加。
風投機構a16z創始人安德森將DeepSeek R1描述為“人工智能的斯普特尼克時刻”,斯普特尼克是蘇聯在1957年先于美國發射的人造衛星。 ScaleAI創始人亞歷山大·王的觀點更激進:過去十年來,美國可能一直在AI競賽中領先于中國,但DeepSeek的AI大模型發布可能會“改變一切”。
壓力之下,海外AI巨頭近期動作頻頻,谷歌端出了熱乎的新產品Gemini2.0系列,xAI發布了馬斯克口中“地球上最聰明的人工智能”Grok 3,為坐穩大模型王座,OpenAI也變得焦慮,CEO在線投票征集開源方案。
以DeepSeek為代表的中國模型看起來追上甚至部分超越了一向領先的海外模型。QuestMobile數據顯示,DeepSeek日活躍用戶已在2月1日突破3000萬大關,成為史上最快達到這一里程碑的應用。隨后,全球最大的代碼托管平臺GitHub顯示,DeepSeek的Star量(星標)超過了OpenAI。
全球在人工智能領域長期角力進入新階段,全球的大模型實力差距到了重估的時候。
通往羅馬的路不只有一條
自2022年底ChatGPT發布以來,中國AI的主流敘事一直是“追趕”。過去一兩年,當被問及我們離OpenAI有多遠時,有從業者給出的答案還是代差兩三年。2025年,這個問題的答案會更樂觀。
“通往羅馬的路并不是只有一條,可能有很多風景更優美的路徑。”楓清科技創始人兼 CEO 高雪峰對第一財經記者表示, DeepSeek-R1 將很多方面的研究創新性地組合在一起,并真正實驗,達成了現在的效果,的確是一件值得讓全球關注的創新性研究成果。
復旦大學計算機科學技術學院教授邱錫鵬則用“令人震驚”形容R1系列中的R1-Zero,以往大模型團隊復刻GPT-o1時會遇到如何拿到訓練數據的重要問題,而R1-zero證明了純RL就能增強模型推理能力?!斑@讓人產生非常大的遐想,打開了思路:未來是不是有很大的機會能通過大規模RL在推理路線上超越o1?”邱錫鵬說。
CIC灼識咨詢執行董事董曉雅在接受記者采訪時認為,DeepSeek的爆火意味著中國的AI已大幅拉近了與美國技術的差距?!癉eepSeek證明中國能夠在既有的技術框架下,通過局部創新與大規模系統級工程優化,實現對國際領先水平的追趕甚至超越?!?/p>
而從AI從業者的感知來看,今年年初曾前往硅谷的光輪智能創始人謝晨對第一財經記者說,他發現硅谷在AI領域的認知其實和國內頂尖創業者的認知并沒有太大差異,且形成了相當程度的共識。例如,“預訓練不行了,要轉向后訓練”、“RLHF很關鍵”、“具身智能前景廣闊”等,其實這些在國內早已有深入討論,硅谷正在“祛魅”。
不只是DeepSeek,復旦大學計算機科學技術學院教授、上海市數據科學重點實驗室主任肖仰華對第一財經記者表示,單純從國內外模型的效果上來看,我們的差距已經比較微弱。無論是黑馬大模型Deepseek還是大廠派的通義千問系列,從模型效果上看,都已經非常接近海外頂尖模型。
如果看向模型榜單,中國AI勢力不容小覷。全球知名AI模型評測平臺Chatbot Arena(大模型競技場)公布的最新一期榜單顯示,Top11名單中(包含部分并列的模型,總數不止11個),國內4家大模型廠商共有6款產品上榜,包括排在第5位的推理模型DeepSeek-R1,第8位的通義千問Qwen2.5-Max,并列第10位的DeepSeek-V3、Qwen-Plus-0125和智譜AI的GLM-4-Plus-0111,階躍星辰的Step-2-16K-Exp排在11位。
大模型競技場是業界公認的榜單之一,采用匿名方式將大模型兩兩組隊,交給用戶進行盲測(提出任何相同問題),根據真實對話體驗對模型能力進行投票。這份榜單部分可以代表中國大模型在全球市場的競爭力。
分領域來看,在基座大模型領域,通義千問旗艦版模型Qwen2.5-Max模型擠進了基座模型TOP5,排在前面的是xAI最新發布的Grok-3,谷歌旗艦模型Gemini 2.0 Pro、OpenAI最新的GPT-4o模型,以及谷歌通用模型Gemini 2.0 Flash。DeepSeek-V3作為基座模型排在第6位。
在推理模型領域,DeepSeek的R1已經擠進全球開閉源推理模型TOP3,在榜單中僅次于谷歌的推理模型Gemini 2.0 Flash Thinking,超過OpenAI的o1。
除了榜單外,從在專利、頂會論文等維度來看,中國在大模型賽道上也展現出強大的競爭實力。
根據去年7月發布的《2023全球人工智能創新指數報告》顯示,在主要國家人工智能頂級論文數量和主要國家人工智能專利授權數量上,中國遠高于美國。
其中,頂會頂刊論文中國作者數量從2018年的328人增長到2022年的1674人,與美國的差距正逐漸縮小。在主要國家人工智能頂級論文數量占比上,中國占比36.7%,美國占比22.6%。
專利領域同樣競爭激烈。上述報告稱,在主要國家人工智能專利授權數量占比上,中國占比34.7%,美國占比32%。
近日記者從知識產權信息服務商智慧芽獲得的數據顯示,2020年至2024年期間,美國在人工智能領域累計申請8.4萬余件專利,其中2.4萬余件已獲授權;同期中國在人工智能領域累計申請77.6萬余件專利,其中29.9萬余件已獲授權,分別是美國的9.23倍和12.45倍。
這些領域,中國AI仍需追趕
DeepSeek的橫空出世,讓全球看到了中國AI技術的潛力,但這場爆火背后,業界仍需直面與美國AI產業的差距。這既體現在AI企業數量、技術、算法等顯性維度,也體現在創新土壤與生態體系的深層結構之中。
根據《全球數字經濟白皮書(2024年)》,截至2024年一季度,全球AI企業中美國占34%,而中國僅占15%。盡管中國AI企業數量不少,但與美國相比仍有較大差距。
上述報告還顯示,截至去年7月,全球人工智能大模型有1328個(包含同一企業、同一模型的不同參數版本),美國大模型數量位居全球第一,占44%,位居第二的中國大模型數量占比為36%。
而在AI獨角獸規模中,在2023年到2024年第一季度,全球AI獨角獸已有234家,新增數量為37家,占新增獨角獸總量的40%,其中,美國AI獨角獸120家,中國AI獨角獸71家。
AI目前仍是高度依賴資金投入的燒錢行業,在投融資方面,中美存在不小差距。
過去一年里,全球AI領域投資呈現爆發式增長,CB Insights報告顯示,去年全球 AI 領域融資總額達1004億美元,同比增長79.61%,占全球融資總額的69%。其中,美國依然是AI投資的主要力量,AI初創企業融資額約占全球70%,以伊隆·馬斯克的xAI、OpenAI和Anthropic等為代表的美國AI公司獲得了數十億美元的巨額投資。中國在2024年的AI初創企業融資額僅占全球融資額的7%,遠遠低于美國。
一位聚焦中美市場的AI創業者告訴第一財經記者,目前美國一級市場仍是繁榮的狀態,一方面表現在VC基金絕對數量多,另一方面表現在創投生態完善。從pre-seed一直到A輪甚至B輪,美國VC們形成了一條“流水線”似的投資孵化鏈條,為早期創業公司保駕護航,提供了更多的確定性。
另一位AI創業者對記者舉例,自己在硅谷觀察到,一些AI初創團隊的創始人來自斯坦福、MIT 等名校,通常三五人組成小團隊、開發一款產品,并構建一個宏大故事,美國投資人態度寬容,即使團隊商業路徑還未想清楚,也能拿到 50~80 萬美元的種子輪融資,而在國內同階段可能很難達到這種規模。此后在天使輪階段,即便商業化尚未完善,也能拿到 500~800 萬美元的投資。
在此前為數不多對外發聲中,DeepSeek創始人梁文鋒提到,他的團隊不會過早設計基于模型的應用,而會專注在大模型上,目標是做研究、做探索。此前DeepSeek也在找不同出資方談,但接觸下來感覺很多VC對做研究有顧慮,VC有退出的需求,希望盡快做出產品商業化,而按照DeepSeek優先做研究的思路,很難從VC獲得融資。
劉知遠也以DeepSeek為例,稱這是一個非常技術理想主義、以AGI(通用人工智能)為夢想組建的團隊,擁有一個由技術長期主義推出來的結構?!爸袊呀浀搅诉@樣一個階段,需要有更多像DeepSeek這樣的團隊,但是又不像DeepSeek這么有錢,能不能讓他們踏踏實實地做一些創新?這非常值得我們思考?!?/p>
“我們需要更多的DeepSeek”
DeepSeek的爆火并非終點,而是中國AI從單點突破邁向“系統能力構建”的起點。
大模型生態社區OpenCSG(開放傳神)創始人陳冉對記者提到建設生態的迫切性,有了模型,需要建生態?!皢吸c有了,但沒有面,沒有網狀生態?!?/p>
高雪峰同樣認為,在基礎算法研究的沉淀上,在大生態圈的建設方面,以及在硬件基礎設施的創新與追趕方面,我們都需要繼續付出更多的努力。
他表示,DeepSeek將普惠 AI 的基準水平拉齊到了最前沿的水準。當全球越來越多用戶, AI 技術生態就會明顯傾向國內優秀開源模型,“可以明顯看到,普惠 AI 的風已經在中國吹響,各個城市的大中小型企業都在尋求用 DeepSeek的開源技術來實現自身的智能化場景,這會對模型甚至硬件的發展帶來不可估量的正向影響。”
高雪峰認為,當國內真正涌現出非常多具備行業特定推理能力的優秀模型與行業知識體系時,我們會真正具備與任何領先的 AI 技術競爭的實力,因為國內在數據整合,知識整合的方面有先天優勢。
“雪球就這么滾起來了”。盤古智庫學術委員、FutureLabs未來實驗室首席專家胡延平對第一財經記者提到,DeepSeek引爆市場帶來巨大的信心提振,有助于接下來形成良性的開源生態循環, 而接下來一個重要的方向是國產算力要能夠跟上,形成生態軟硬件協同。
此外,從技術創新的角度看,肖仰華認為,關鍵不在于我們是否屬于第一陣營,而在于是否是第一。
“想要與海外頂尖模型競爭,在效果上接近的同時,能否做到成本更低、服務更優、響應更快、場景適配更好也很重要?!毙ぱ鋈A對記者表示,在達到當前性能接近的成果之后,國內模型已具備與頭部模型競爭的可能性,但還要看很多其他因素。
“AGI容易形成類似于差之毫厘、失之千里的效應,即使在某個領域以微弱優勢領先,但AI是一種基礎能力,在千行百業無處不在的應用中,會放大這一微弱的領先優勢。”因此,國內模型并不能滿足于現階段的成果。
他同時也認為,AI是全方位的,“例如在具身智能、在千行百業的應用,我們的亮點仍然不多,但是美國已經取得了很多世界級的成果?!彼a充道,“我們還需要更多的Deepseek。”
“此前,國內外大模型公司都在追隨OpenAI,DeepSeek-R1追上o1后,國內面臨的下一個問題變成了,下一步需要自己走一條全新的路或找到全新的創新點。這是未來看中美差距的關鍵點。”張俊林說。
開創性的突破也需要容忍失敗的勇氣。張俊林提到,國內存在做原始創新的可能性,前提是有這種企業文化:不著急賺錢,在寬松環境下做各種嘗試。目前看,國內只有DeepSeek有這種環境,但如果其他企業能復刻這種環境,將推動國內大模型團隊創新甚至反超OpenAI。
肖仰華認為,市場投入結構和效率或許需要改變。
他對記者提到,中國在AI方面的資源、資本投入并不少,但主要是自上而下的規劃和創新,作為輔助的是民營企業和民間投入的科技創新。
“此次Deepseek的成功,讓我們意識到,來自民營小微企業等市場主體自發地創新難能可貴,可能是整個國家科研科技創新體系中非常寶貴的一分子。” 肖仰華說,優化投入效率和投入結構很重要。初創企業、小微企業和民營企業是具有創新活力的,是他們的好奇心和創造力成就了這次突破,全社會需要“呵護”這種創新。