国产精品亚洲综合久久,久久精品re,激情五月开心婷婷,久久亚洲日本不卡一区二区,高清一区二区三区,欧美日本日韩aⅴ在线视频

一個向左一個向右, OpenAI與DeepSeek 誰能主導AI競爭格局?
來源:第一財經作者:劉曉潔 鄭栩彤2025-02-28 14:18

OpenAI 發布了昂貴的GPT-4.5,而DeepSeek進行著最后一天的代碼開源分享。

北京時間2月28日凌晨,OpenAI發布GPT-4.5。“這是我們迄今為止最大、最好的聊天模型,是在擴大預訓練和后訓練道路上邁出的一步。” OpenAI介紹,這款新模型面向GPT Pro用戶,下周起將向Plus用戶和Team用戶推出。

OpenAI CEO山姆·奧爾特曼(Sam Altman)因為“在醫院照顧孩子”并沒有出現在發布現場,但他在X上發布了帖子造勢,強調GPT-4.5是一個“高情商”更像人的模型,不會超越基準測試,是一種“不同類型的智能”。

從目前業界的反應來看,這一代模型的能力提升并不算大,但令人驚訝的是GPT-4.5的價格,每百萬Tokens輸入為75美元,相比GPT-4o的2.5美元上漲30倍,同時,OpenAI表示,GPT-4.5無法完全替代GPT-4o。

與此同時,DeepSeek 26日剛在海內外宣布了API 錯峰時間段的降價,V3模型和 R1模型的每百萬Tokens輸入只要0.035美元,相比原價分別下調50%和75%,GPT-4.5是這個價格的2000多倍。就在28日,DeepSeek還放出了“開源周”最后一個代碼庫,將開源進行到底,這一攪動AI圈的“鯰魚”,正在改寫AI競爭格局。

好消息和壞消息

GPT-4.5是奧爾特曼此前預告將“在幾周內”發布的模型。奧爾特曼彼時稱,除了發布GPT-4.5,幾個月時間內OpenAI還將發布下一代基座模型GPT-5。如此看,GPT-4.5很可能是GPT-5面世前的最后一個過渡模型。

與OpenAI此前發布新模型時的慣常做法不同,此前OpenAI通常會強調新模型在各領域的基準測試分數,此次OpenAI則表示,學術基準并不總是反映現實世界的有用性,OpenAI轉而強調了GPT-4.5的“情商”。

奧爾特曼在發帖中提到了“好消息”和“壞消息”,前者是,“這是第一個讓人感覺像是在跟一個有思想的人說話的模型。”他表示,曾多次驚訝地發現能從人工智能那里得到很好的建議。

壞消息則是,“這是一個龐大而昂貴的模型”,甚至沒辦法同時推到plus用戶那里,奧爾特曼表示,“GPU已經不夠了”,下周將添加數萬個GPU,然后將其推廣到plus。

奧爾特曼還特別提到,GPT-4.5不是一個推理模型,也不會在基準測試中取得壓倒性優勢。它是一種“不同類型的智能”。在新模型發布前不久,OpenAI首席研究官Mark Chen接受播客采訪稱,新模型并未被命名為GPT-5,這是因為OpenAI內部對這款模型的評估還沒有到達整整一代的性能提升。

OpenAI表示,早期測試表明,用戶與GPT-4.5交互更自然,該模型有更廣泛的知識基礎、理解用戶意圖的更強能力和更強大的“情商”,這使得GPT-4.5在寫作、編程、解決實際問題等任務上很有用。在訓練過程中,OpenAI則使用了擴大(Scaling)無監督學習和推理的方法。

OpenAI特別強調了GPT-4.5幻覺率降低、與人類協作表現更佳。OpenAI通過用簡單但具有挑戰性的知識問題測試模型,結果顯示,GPT-4.5的幻覺率為37.1%,低于GPT-4o的61.8%、o1的44%、o3-mini的80.3%。在與人類協作的能力方面,OpenAI稱,GPT-4.5在日常查詢、專業查詢、創造性智能這3個方面表現都比GPT-4o更強,GPT-4.5能更好地理解人類微妙的暗示或隱含的期望。

為了展示GPT-4.5的能力,OpenAI舉了個例子。問GPT-4.5“世界上第一種語言是什么”,GPT4.5的回答是“我們不知道確切的第一種語言是什么,科學家認為我們可能永遠不知道確切的答案,因為口語的出現遠早于書面記錄”,并解釋了沒有單一的第一種語言、口語可能最早在非洲出現。

同樣的問題問GPT-4的4T版本,回答則是“確定人類使用的第一種語言極具挑戰性”,并解釋稱,語言學家假設有許多語言的共同祖先,但這種祖先不是第一種語言。直觀感受上,GPT-4.5的表達更接近人類,GPT-4T的語言表達顯得有些機械。

此外,OpenAI還強調了GPT-4.5與o1這類長思維鏈推理模型不同。例如,GPT-4.5在做出反應前不需要經過思考,因此更通用,也更智能。不過,OpenAI也說明,推理仍將是未來模型的核心能力,更強的推理能力即將出現。

在附錄部分,OpenAI才放出GPT-4.5的基準測試分數。在反映科學、數學、多語言、編碼的GPQA、AIME’24、MMMLU、SWE-Lancer基準測試上,GPT-4.5得分分別為71.4%、36.7%、85.1%、32.6%,超過GPT-4o的53.6%、9.3%、81.5%、23.3%,但部分得分低于o3-mini。

這一代的能力提升并不明顯,而與此相對的是,能力定價上,GPT-4.5預覽版的API調用價格為每百萬Tokens輸入(input)75美元,輸出(output)150美元,分別是GPT-4o價格的30倍、15倍。

即便相比自家模型,這個價格也過于昂貴,而進一步與 DeepSeek 進行對比,差距更大。近期非波峰時間段,V3 模型和 R1 模型的每百萬Tokens輸入為0.035美元(原價分別是0.07美元/0.14美元),每百萬 token Tokens輸出只需要 0.55 美元(原價分別是1.1美元/2.19美元),GPT-4.5分別是上述價格的2000多倍和270多倍。

OpenAI說明,由于GPT-4.5是一個非常大且計算密集的模型,所以價格比GPT-4o更貴。同時,OpenAI提到GPT-4.5 還無法完全替代 GPT-4o。考慮到要在支持現有功能和開發未來的模型之間取得平衡,OpenAI還在評估是否長期在API(接口)使用該模型。

“鯰魚”攪動AI圈

除了拼性價比,DeepSeek另一個方向是堅定開源路線。

就在OpenAI新品發布的這一天,DeepSeek正進行著本周第五項代碼開源——Fire-Flyer文件系統(3FS)。它是“所有 DeepSeek 數據訪問的動力引擎”,一個高性能的并行文件系統,專門優化AI數據訪問,為 AI 工作負載提供卓越的存儲基礎設施。

據DeepSeek,3FS是專為AI場景設計的高性能存儲解決方案,通過架構創新和硬件適配顯著提升了數據處理效率,與傳統的云存儲掛載工具(如s3fs)在目標場景和技術實現上存在顯著差異。

除了3FS,DeepSeek本周陸續開源了讓大模型在GPU上跑得更快的MLA解碼核FlashMLA,用于MoE模型訓練和推理的DeepEP通信庫,可支持MoE的FP8 GEMM代碼庫DeepGEMM,一系列優化并行策略等底層代碼,在GitHub上,DeepSeek詳細展開了DeepSeek-V3和R1模型背后的優化技術,教社區如何最大限度利用GPU能力。

“相當于以前DeepSeek是直接給一輛車,告訴大家這輛車續航900公里,但是現在DeepSeek在深挖,用什么方式能夠開到900公里。”大模型生態社區OpenCSG(開放傳神)創始人陳冉此前對第一財經舉例表示。

陳冉認為,DeepSeek現在發布的算法某種意義上屬于“腳手架”, 這些“腳手架”的開源有利于之后的生態搭建。社區和開發者可以基于DeepSeek的技術路線繼續往前走,最終行業能基于此將生態做起來。

長期來看,DeepSeek這一開源動作的意義在于,有模型標準,也有工具標準,也有生態基石,生態就能長起來。也有從業者認為,如果把大模型比作更底層的操作系統,那OpenAI可能是相對封閉的IOS生態,而DeepSeek就是開放的安卓。

DeepSeek或許改寫了AI圈的競爭格局和方向。奧爾特曼在2月o3-mini發布當天表示,OpenAI的開源政策站在了“歷史錯誤的一邊”,需要想出一個不同的開源策略。

在國內,一貫堅持閉源路線的百度也“倒戈”向開源。去年,百度董事長李彥宏還表示,大模型開源的意義不大,閉源模型在能力上會持續領先。今年2月14日,百度就宣布將在未來幾個月陸續推出文心大模型4.5系列,并于6月30日正式開源。

從開源的沖擊看,能力不如開源模型的閉源模型面臨尷尬境地。既然開源模型可以被開發者自行下載、微調乃至私有化部署,就不需要為了使用閉源大模型付費了。

DeepSeek將算力用到極致,在低成本的基礎上進行模型的訓練和推理,此前也一度帶崩芯片股,將壓力給到海外大廠,規模越來越大的數據中心相關資本支出是否合理?這成為投資人對大廠的疑慮。

1月以來,海外AI巨頭近期新品發布密集,谷歌發布了Gemini2.0系列,xAI發布了馬斯克口中“地球上最聰明的人工智能”Grok 3,OpenAI緊接著拿出了GPT-4.5。

從全球知名AI模型評測平臺Chatbot Arena(大模型競技場)的最新榜單來看,最新發布的Gemini2.0系列旗艦模型與Grok 3確實排在前列,但與排在第5位的DeepSeek-R1并沒有拉開實質性的差距,以大模型競技場的評分來看,差距在15分-40分之間。

在2025年達沃斯論壇上,AI科技初創公司Scale AI創始人亞歷山大·王(Alexandr Wang)公開表示, DeepSeek的AI大模型性能大致與美國最好的模型相當。他認為,過去十年來,美國可能一直在人工智能競賽中領先于中國,但DeepSeek的AI大模型發布可能會“改變一切”。

在國內,DeepSeek同樣給大模型廠商不小的壓力。去年C端大模型應用做得聲量最大的國內廠商中,一定有豆包和Kimi。但如果最近再看蘋果中國區免費版APP排行,會發現,第一名是DeepSeek,騰訊元寶搭載DeepSeek并大方投流后,也沖到了榜單第二名。

AI業內人士表示,DeepSeek的技術實力過硬且選擇開源,這對一些閉源公司造成了沖擊,一些大模型團隊需要反思自身的做法。

DeepSeek-R1不是大模型競爭的終局,有消息稱,DeepSeek正尋求鞏固自身優勢,盡早推出R2模型,消息提到DeepSeek原本計劃在5月初發布R2模型,目前會加快這一速度。DeepSeek目前并未對此回應。

此前DeepSeek在R1論文中提到,R1的性能將在下一個版本得到改善,因為相關的RL(強化學習)訓練數據還很少。隨著RL數據的增加,模型解決復雜推理任務的能力持續穩定提升,且會自然涌現出一些復雜行為能力。

同時,OpenAI的下一代推理模型o3計劃融入GPT-5并在幾個月內推出。雖然OpenAI還在持續推出GPT-4o、GPT-4.5這類帶有過渡色彩的模型,但目前距離GPT-4推出已有近兩年時間。發布GPT-4.5之后,OpenAI還需盡快證明自己仍是全球最先進的大模型公司,接下來推出GPT-5將是重要一步。

DeepSeek能否贏得下一局對弈仍存變數,但可以確定的是,它為行業競爭帶來了更深遠的影響,在2025年初以壓倒性的聲勢冒頭,打亂了AI圈的格局,競爭對手或許需要思考,如何走贏下一步棋。

責任編輯: 鄧衛平
聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
網友評論
登錄后可以發言
發送
網友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    主站蜘蛛池模板: 成 人 黄 色视频免费播放 | 国产最新自拍 | 青草视频在线观看完整版 | 久久这里只有精品免费视频 | av2014天堂网 | 1314免费观看完整版 | 国产毛片高清 | 99精品免费在线观看 | 国产成人综合久久精品红 | 亚洲精品乱码久久久久久蜜桃欧美 | 国产羞羞事1000部在线观看 | 激情综合五月网 | 瑟瑟网站免费网站入口 | 精品亚洲福利一区二区 | 欧美日p | 国产美女视频网站 | 国产一级真人毛爱做毛片 | 国产精品综合一区二区三区 | 欧美日韩另类视频 | 久久国产精品一国产精品 | 色综合久久综合网观看 | 国产精品免费网站 | 国产视频高清在线 | 久久www免费人成看国产片 | 色综合天| 国产成人www免费人成看片 | 国产欧美在线观看一区 | 欧美精彩视频在线观看 | 精品国产免费第一区二区 | 精品中文字幕久久久久久 | kuai97| 久久最新视频 | 精品国产中文一级毛片在线看 | 收集最新中文国产中文字幕 | 国产免费色视频 | 久久riav国产精品 | 国内精品久久久久久久久久影视 | 免费男女网站 | 精品日韩一区 | 精品国产96亚洲一区二区三区 | www.五月天com |