国产精品亚洲综合久久,久久精品re,激情五月开心婷婷,久久亚洲日本不卡一区二区,高清一区二区三区,欧美日本日韩aⅴ在线视频

字節(jié)跳動,重大宣布!成本再降40%!
來源:證券時報網(wǎng)作者:周春媚2025-03-10 21:29

大模型訓練成本,再砍一刀!

3月10日,字節(jié)豆包大模型團隊在國際知名開源社區(qū)平臺GitHub上開源了一項針對 MoE(混合專家模型)架構(gòu)的關(guān)鍵優(yōu)化技術(shù)COMET。據(jù)悉,該技術(shù)可將大模型訓練效率提升1.7倍,成本節(jié)省40%。目前,COMET已實際應用于字節(jié)的萬卡集群訓練,累計幫助節(jié)省了數(shù)百萬GPU小時訓練算力。

MoE是當前大模型的主流架構(gòu),最近大火的國產(chǎn)大模型DeepSeek采用的就是MoE架構(gòu)。DeepSeek自研的DeepSeekMoE作為一種創(chuàng)新的大規(guī)模語言模型架構(gòu),通過整合專家混合系統(tǒng)、改進的注意力機制和優(yōu)化的歸一化策略,在模型效率與計算能力之間實現(xiàn)了新的平衡。

字節(jié)豆包大模型團隊表示,MoE在分布式訓練中存在大量跨設(shè)備通信開銷,嚴重制約了大模型訓練效率和成本。針對這一難題,字節(jié)在內(nèi)部研發(fā)了COMET計算-通信重疊技術(shù),通過多項創(chuàng)新,大幅壓縮了MoE專家通信空轉(zhuǎn)時間。

在此前的“開源周”活動中,DeepSeek也曾開源了團隊為解決MoE通信瓶頸而采取的DualPipe+DeepEP方案。不過,與之不同的是,COMET可以像插件一樣直接接入已有的MoE訓練框架,支持業(yè)界絕大部分主流大模型,無需對訓練框架進行侵入式改動,更加方便、靈活、通用。這一方法,還因其簡潔性與通用性而高分入選全球機器學習系統(tǒng)頂級會議 MLSys 2025,被認為“在大規(guī)模生產(chǎn)環(huán)境中極具應用潛力”。

不僅如此,由于在降低MoE通信開銷上,COMET采用了計算-通信融合算子的優(yōu)化方式,DeepSeek研發(fā)的DualPipe則通過排布算子來掩蓋通信,兩種方案并不沖突。因此,COMET還可以與DualPipe方案結(jié)合使用,以更大程度壓縮訓練成本。

值得注意的是,就在一個月前的2月12日,字節(jié)跳動豆包大模型團隊發(fā)布消息稱,團隊提出了全新的稀疏模型架構(gòu)UltraMem,可有效解決MoE推理時高額的訪存問題,推理速度較MoE架構(gòu)提升2—6倍,推理成本最高可降低83%。

業(yè)內(nèi)人士分析,此次開源的COMET可與此前提出的UltraMem結(jié)合使用,將大模型訓練成本進一步“砍”得更低。

當前,隨著技術(shù)的不斷進步迭代,以及頭部廠商逐漸加入開源大軍,大模型訓練成本正不斷下降。啟明創(chuàng)投主管合伙人周志峰曾表示,大模型每百萬Token調(diào)用成本已經(jīng)從2023年120美元(約人民幣800元)降到2024年不到人民幣1元,下降了99.9%,根據(jù)估算,未來成本很有可能再下降99.9%。

DeepSeek、字節(jié)跳動等國產(chǎn)大模型通過提高架構(gòu)創(chuàng)新、算法優(yōu)化,提升了訓練效率,降低訓練成本,看似減少了算力的需求,但中國銀河證券研報指出,大模型成本縮減意味著降低了企業(yè)的訓練與推理門檻,即每單位成本所能提供的訓練和推理服務(wù)更多了,算力效率提升有望激活更廣泛的用戶與應用場景,從而引發(fā)對更大參數(shù)以及更復雜的大模型迭代需求。

研報進一步表示,算法優(yōu)化(如模型壓縮、蒸餾)確實能提升單次任務(wù)效率,但AI能力的邊界擴展(如多模態(tài)、復雜推理、通用人工智能)仍依賴更大規(guī)模模型和更復雜計算。這可能會對均衡下的算力需求產(chǎn)生正面影響,整體算力需求不會減少而是更加旺盛,從而形成對硬件需求的新一輪推升,即步入“算法進步→模型復雜化→硬件升級”的正循環(huán)。

在通過技術(shù)創(chuàng)新持續(xù)降低模型訓練成本的同時,字節(jié)跳動也在擴大AI資本開支,招募更多頂尖AI人才,研發(fā)投入顯著領(lǐng)先同行。浙商證券研報分析,字節(jié)跳動在AI上投入巨大,2024年資本開支達到800億元,接近百度、阿里、騰訊三家的總和(約1000億元)。市場人士分析,2025年字節(jié)跳動或進一步上調(diào)AI資本開支,擴大算力投資規(guī)模。

一方面加大資本投入,另一方面增強人才隊伍,字節(jié)跳動正積極地“招兵買馬”。記者注意到,字節(jié)跳動近日還首次啟動了“筋斗云人才計劃實習專項”。據(jù)內(nèi)部人士介紹,該計劃是字節(jié)跳動面向優(yōu)秀校園技術(shù)人才推出的專項招聘,意在全球范圍內(nèi),吸引和招募有志于用技術(shù)創(chuàng)造突破性價值的頂尖學生。

此外,字節(jié)跳動另一招聘計劃“Top Seed人才計劃(含研究實習專項)”全年開放招募,這是國內(nèi)唯一的專門針對大模型領(lǐng)域的人才計劃,旨在全球范圍內(nèi)持續(xù)尋找有志于投身 AI 研究的頂尖人才。字節(jié)跳動校招負責人表示:“公司十分重視人才、關(guān)注人才成長,相信優(yōu)秀的校園人才能發(fā)揮自身潛力,不斷超越現(xiàn)狀,創(chuàng)造出突破性的價值。”

校對:王蔚

責任編輯: 高蕊琦
聲明:證券時報力求信息真實、準確,文章提及內(nèi)容僅供參考,不構(gòu)成實質(zhì)性投資建議,據(jù)此操作風險自擔
下載“證券時報”官方APP,或關(guān)注官方微信公眾號,即可隨時了解股市動態(tài),洞察政策信息,把握財富機會。
網(wǎng)友評論
登錄后可以發(fā)言
發(fā)送
網(wǎng)友評論僅供其表達個人看法,并不表明證券時報立場
暫無評論
為你推薦
時報熱榜
換一換
    熱點視頻
    換一換
    主站蜘蛛池模板: 久久中文字幕一区二区 | 国产一毛片 | av网站免费线看 | 国产小视频免费在线观看 | 97在线观看视频免费 | 久久久久免费精品视频 | 国产精品久久久久久久久鸭 | 丁香六月综合激情 | 久久国产欧美日韩精品免费 | 青青草成人在线观看 | 免费视频专区一国产盗摄 | 一级一级一级毛片免费毛片 | 免费看涩涩视频网站入口 | 日本久久精品免视看国产成人 | 久久综合成人 | 欧美午夜一区 | 国产欧美一区二区精品久久久 | 欧美在线高清 | 天天插狠狠干 | 久久机热综合久久国产 | 久久精品亚洲牛牛影视 | 国内精品久久久久 | 男女一进一出免费视频 | 色婷婷婷婷 | 网站国产 | 国产精品美女挤奶视频 | 大色综合色综合资源站 | 国产在线一区精品对白麻豆 | 欧美在线观看一区二区三 | 久久久久久夜精品精品免费啦 | 高清精品一区二区三区一区 | 男人天堂网站在线 | 欧妇女乱妇女乱视频 | a级毛片在线视频免费观看 一级片视频在线 | 婷婷色香五月激情综合2020 | 国产精品偷伦免费视频观看的 | 国产在线中文字幕 | 色播激情五月 | 五月婷婷色视频 | 国产精品va欧美精品 | 91精品自在拍精选久久 |