最新進展!
3月25日晚,DeepSeek又有大消息傳來。該公司在官方賬號上正式宣布V3模型完成小版本升級的消息,并介紹了新版本DeepSeek-V3-0324模型的提升細節,包括推理、前端開發、中文寫作、中文搜索幾個方面的能力優化。另據海外專業AI模型評測機構最新排名,新版V3模型現在是得分最高的非推理模型,超過xAI的Grok3和OpenAI的GPT-4.5(preview)。
值得注意的是,北京時間昨天晚上,人工智能大模型“暗戰”不斷。當地時間3月25日,美國開放人工智能研究中心(OpenAI)宣布推出4o圖像生成功能,“將迄今最先進的圖像生成器集成至GPT-4o”。谷歌也發布Gemini 2.5系列人工智能推理模型,其首個版本Pro Experimental一登場就搶下大模型競技場第一名,并且整整比GPT-4.5高出40分。
再度引爆:又變強了!
3月25日晚間消息,DeepSeek宣布V3模型已完成小版本升級,目前版本號 DeepSeek-V3-0324,用戶登錄官方網頁、APP、小程序進入對話界面后,關閉深度思考即可體驗。
據悉,DeepSeek-V3-0324 API接口和使用方式保持不變。如非復雜推理任務,建議使用新版本V3模型,即刻享受速度更加流暢、效果全面提升的對話體驗。
模型推理任務表現提高,新版V3模型借鑒DeepSeek-R1模型訓練過程中所使用的強化學習技術,大幅提高了在推理類任務上的表現水平,在數學、代碼類相關評測集上取得了超過GPT-4.5的得分成績。
DeepSeek-V3-0324與之前的DeepSeek-V3使用同樣的base模型,僅改進了后訓練方法。私有化部署時只需要更新checkpoint和tokenizer_config.json(tool calls相關變動)。模型參數約660B,開源版本上下文長度為128K(網頁端、App和API提供64K上下文)。
不過,外界對于DeepSeek-V3-0324的關注并不僅僅因為該版本的能力提升,而是猜測它的發布是否意味著DeepSeek更新一代的V4與R2大模型的發布不遠了。
DeepSeek方面表示,一是新版本代碼能力顯著提升,接近Claude 3.7水平。例如,有用戶在實測中發現,V3-0324能一次性生成800行無錯誤的網頁代碼,并實現動態響應式布局和交互效果。二是數學與邏輯推理能力增強。例如經典的“4升水壺問題”和數學競賽題(如AIME 2025題目),部分表現接近專業推理模型。三是模型架構與開源生態。V3-0324采用MIT許可證,允許自由修改、分發及商業化應用,進一步降低了開發者的使用門檻。
暗戰不斷
就在DeepSeek宣布V3模型已完成小版本升級的同時,當地時間3月25日,美國開放人工智能研究中心(OpenAI)宣布推出4o圖像生成功能,“將迄今最先進的圖像生成器集成至GPT-4o”。即日起,所有Plus、Pro、Team及免費用戶將陸續在ChatGPT和Sora中體驗該功能,企業版與教育版即將接入,Sora平臺同步啟用。開發者即將通過API調用GPT-4o圖像生成功能,接口權限將于未來數周內開放。據介紹,GPT-4o圖像生成功能可精準文本渲染、嚴格遵循指令提示、深度調用4o知識庫及對話上下文——包括對上傳圖像進行二次創作或將其轉化為視覺靈感。
谷歌也發布了Gemini 2.5系列人工智能推理模型。該系列模型在回答問題前會“思考”片刻。作為這一系列模型的首發產品,Gemini 2.5 Pro Experimental已經率先亮相。這款多模態推理人工智能模型被谷歌稱為“目前最智能的模型”,支持高達100萬Token的超大上下文窗口,單次可以處理約75萬英文單詞,遠超《指環王》三部曲的總字數。
谷歌透露,未來Gemini 2.5 Pro將支持200萬Token的雙倍輸入長度。這一模型將于周二登陸谷歌開發者平臺Google AI Studio,同時向每月支付20美元訂閱“Gemini Advanced”的用戶開放。谷歌表示,未來所有新推出的人工智能模型都將集成推理能力。
值得注意的是,Gemini 2.5系列首個版本Pro Experimental一登場就搶下大模型競技場第一名,并且整整比GPT-4.5高出40分!谷歌介紹稱,相較于Gemini 2.0 Flash Thinking這個谷歌首個推理模型,Gemini 2.5在基礎模型和后訓練技術上都有改進。不僅是在大模型競技場上一舉拿下高分,在各種推理、數學、科學、編程基準上,Gemini 2.5 Pro都表現出色,屬于是編程能跟Claude 3.7 Sonnet掰手腕,數學能跟Grok 3相媲美。
人工智能光環仍在
就在DeepSeek的最新動作之后,騰訊也快速行動。3月26日凌晨,騰訊元寶迎來重大升級,同時接入兩大模型:深度思考模型“騰訊混元T1”正式版,和DeepSeek V3-0324最新版。
機構認為,當前人工智能對于中國資產的加持光環可能依然存在。高盛發布最新研究報告稱,在今年中國股票上漲約20%之后,預計還會有更多基本面驅動的上漲,不過重申牛市可能因事件風險和獲利回吐壓力而放緩。
分析師Kinger Lau等在報告中指出,根據對投資者的調研,基于宏觀、政策等方面的原因,股票投資者似乎對美國關稅擔憂感到輕松,原因可能是一些投資者相信相比貿易戰1.0,中國當前似乎更有能力應對外部需求逆風,因對美國直接出口的減少和產品競爭力的提高。
盡管對于人工智能潛在獲益的問題和爭論已經浮出水面,但是大多數投資者認可中國人工智能敘事是游戲規則改變者。預計人工智能的廣泛應用將會在未來十年每年提升中國每股收益預測2.5%,并帶來潛在的超過2000億美元的投資組合資金流入。
排版:王璐璐????
校對:楊立林????????????????