2月25日,人工智能初創(chuàng)公司Anthropic宣布推出旗下首款混合推理模型Claude 3.7 Sonnet。該公司表示,這是其有史以來“最智能”的AI模型,也是市面上唯一的此類“混合”模型。該模型具備即時響應能力,還能展示分步驟的詳細思考過程,為用戶提供更加靈活和高效的服務。
Claude 3.7 Sonnet最大的亮點在于其獨特的混合推理模式,它融合了標準思考和擴展思維兩種模式。
標準思考模式下,模型無需復雜推理過程,能立刻給出答案,滿足用戶對于簡單問題的快速獲取需求。
而在擴展思維模式中,模型會展示詳細的推理思維鏈,用戶可清晰看到模型如何逐步分析問題、應用邏輯,這種模式在數學、生物等科研領域以及復雜編程任務中尤為適用。API用戶還可以對模型的思考時長進行精細化控制,在速度和回答質量間自由權衡。
相比其他模型,Claude 3.7 Sonnet在處理復雜代碼庫和高級工具使用等方面有顯著改進。在專門評估AI解決真實軟件問題能力的SWE-bench Verified基準測試中,Claude 3.7 Sonnet達到了行業(yè)領先水平。同時,該模型在TAU-bench測試中也表現突出。
就在一周前,馬斯克號稱“地球上最聰明”的Grok 3也吸睛無數。與Grok 3相比,Claude 3.7 Sonnet的優(yōu)勢在于其混合推理模式帶來的靈活性。Grok 3則在特定任務(如推理、數學競賽)上有不錯的發(fā)揮。從基準測試結果來看,Claude 3.7 Sonnet(擴展思維版)適用于強邏輯推理和數學任務,而Grok 3 Beta在部分特定任務上表現更佳,兩者各有優(yōu)勢。
Anthropic是一家在人工智能領域迅速崛起的初創(chuàng)公司,其核心團隊成員不少來自OpenAI 。Anthropic的聊天機器人Claude與OpenAI的ChatGPT競爭激烈,此次推出的Claude 3.7 Sonnet,也被視為Anthropic在與OpenAI競爭中贏得優(yōu)勢的重要舉措。此前,Anthropic在產品發(fā)布上已多次贏得先機,例如率先推出“代理”功能,OpenAI隨后也跟進了類似舉措。
據媒體報道,眼下Anthropic正與Lightspeed和谷歌洽談一筆高達20億美元的融資,若融資成功,加上亞馬遜對該初創(chuàng)企業(yè)約80億美元的投資,其估值將達到600億美元。
另有消息稱,Anthropic擬籌集高達35億美元的資金,融資成功后估值將提升至615億美元。這也表明,盡管AI領域競爭激烈,但投資者對頂級人工智能公司需求依然強勁,看好其未來發(fā)展?jié)摿Α?/p>