當地時間2月27日,OpenAI發布了最新模型GPT-4.5的研究預覽版。這是一款通用型大語言模型,其定位并非OpenAI最頂尖的模型,但卻號稱“情商最高”,且API調用價高于其主流模型GPT-4o。
據OpenAI方面介紹,GPT-4.5是OpenAI迄今為止規模最大、知識儲備最豐富的模型之一,擁有1萬億激活參數,訓練數據量高達120萬億tokens,上下文窗口長度擴展至256K11。
與OpenAI的主流模型相比,GPT-4.5的最大特點在于其“感性能力”的提升。它能夠進行更自然、更溫暖的對話,甚至在回答問題時展現出一定的“人情味”。例如,當用戶輸入“我被放鴿子了,我要發一個‘恨他們’的短信”時,GPT-4.5會先輸出安撫情緒的內容,再給出建議。
在面對 “我考試失敗了,心情很低落” 這類輸入時,之前的模型會立刻嘗試解決問題,而GPT-4.5會先詢問用戶是否想聊聊感受,或提供分散注意力的方法,展現出更高的情感智能,更適合處理與情感交流、寫作輔助(優化內容、激發創意)、客戶服務等相關任務 。
新模型的“幻覺率”(錯誤生成虛假信息的概率)低于GPT-4o和o1模型,僅為37.1%,而GPT-4的幻覺率為61.8%。但在一些基準測試里,它未達行業最前沿水平,如在編程能力的SWE-Bench Verified基準測試中,與GPT-4o和o3-mini表現相當,遜色于OpenAI 的deep research和Anthropic的Claude 3.7 Sonnet。
在學術基準測試AIME和GPQA上,GPT-4.5也不及領先的AI推理模型,如o3-mini、DeepSeek的R1和Claude 3.7 Sonnet。不過,在數學和科學相關問題上,相比其他非推理模型,它仍有不錯的表現。
需要指出的是,OpenAI此前推出的o1等屬于推理模型,能生成 “思維鏈”,在處理問題前先進行反思。而GPT-4.5是該公司最后一款 “非鏈式思維” 模型,未來將作為推理模型的基礎,標志著OpenAI在人工智能技術發展上的一個重要過渡。
在功能上,它支持搜索、畫布模式,用戶可上傳文件和圖像,但暫不支持語音模式、視頻和屏幕共享等多模態功能。
目前,GPT-4.5首先開放給軟件開發者以及ChatGPT Pro(每月200美元)訂閱用戶,未來也將向ChatGPT Plus(每月20美元)和Team訂閱用戶開放。但其定價為每百萬token輸出150美元,遠高于GPT-4o的60美元。
眼下OpenAI的模型發布節奏正在不斷加快,其需要應對來自Anthropic、xAI等的激烈競爭。
前不久,由OpenAI前員工創立的Anthropic發布了Claude 3.7 Sonnet,馬斯克的xAI則推出了Grok 3。在中國市場,DeepSeek等本土企業的崛起也給OpenAI帶來一定技術壓力。這些都促使OpenAI不斷優化和拓展應用場景,以保持優勢。