智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開(kāi)源SOTA模型

2025-07-29 09:41 來(lái)源：證券日?qǐng)?bào)網(wǎng)

本報(bào)訊（記者梁傲男）7月28日，北京智譜華章科技股份有限公司（以下簡(jiǎn)稱“智譜”）發(fā)布新一代旗艦?zāi)Ｐ虶LM-4.5，專為智能體應(yīng)用打造的基礎(chǔ)模型。Hugging Face與ModelScope平臺(tái)同步開(kāi)源，模型權(quán)重遵循MIT License。

據(jù)悉，GLM-4.5在包含推理、代碼、智能體的綜合能力達(dá)到開(kāi)源SOTA，在真實(shí)代碼智能體的人工對(duì)比評(píng)測(cè)中，實(shí)測(cè)國(guó)內(nèi)最佳。

智譜方面有關(guān)人士表示，衡量AGI的第一性原理，是在不損失原有能力的前提下融合更多通用智能能力，GLM-4.5是智譜對(duì)此理念的首次完整呈現(xiàn)，并有幸取得技術(shù)突破。GLM-4.5首次在單個(gè)模型中實(shí)現(xiàn)將推理、編碼和智能體能力原生融合，以滿足智能體應(yīng)用的復(fù)雜需求。

智譜/供圖

記者了解到，為綜合衡量模型的通用能力，智譜選擇了最具有代表性的12個(gè)評(píng)測(cè)基準(zhǔn)，綜合平均分，GLM-4.5取得了全球模型第三、國(guó)產(chǎn)模型第一，開(kāi)源模型第一。

在參數(shù)效率方面，GLM-4.5參數(shù)量為DeepSeek-R1的1/2、Kimi-K2的1/3，但在多項(xiàng)標(biāo)準(zhǔn)基準(zhǔn)測(cè)試中表現(xiàn)得更為出色，這得益于GLM模型的更高參數(shù)效率。在衡量模型代碼能力的SWE-benchVerified榜單上，GLM-4.5系列位于性能/參數(shù)比帕累托前沿，表明在相同規(guī)模GLM-4.5系列實(shí)現(xiàn)了最佳性能。

在性能優(yōu)化之外，GLM-4.5系列也在成本和效率上實(shí)現(xiàn)突破，由此帶來(lái)遠(yuǎn)低于主流模型定價(jià)：API調(diào)用價(jià)格低至輸入0.8元/百萬(wàn)tokens，輸出2元/百萬(wàn)tokens。同時(shí)，高速版本實(shí)測(cè)生成速度最高可至100 tokens/秒，支持低延遲、高并發(fā)的實(shí)際部署需求，兼顧成本效益與交互體驗(yàn)。

真實(shí)場(chǎng)景表現(xiàn)比榜單更重要。為評(píng)測(cè)GLM-4.5在真實(shí)場(chǎng)景Agent Coding中的效果，智譜接入Claude Code與Claude-4-Sonnet、Kimi-K2、Qwen3-Coder進(jìn)行對(duì)比測(cè)試。測(cè)試采用52個(gè)編程開(kāi)發(fā)任務(wù)，涵蓋六大開(kāi)發(fā)領(lǐng)域，在獨(dú)立容器環(huán)境中進(jìn)行多輪交互測(cè)試。實(shí)測(cè)結(jié)果顯示（如下圖），GLM-4.5相對(duì)其他開(kāi)源模型展現(xiàn)出競(jìng)爭(zhēng)優(yōu)勢(shì)，特別在工具調(diào)用可靠性和任務(wù)完成度方面表現(xiàn)突出。盡管GLM-4.5相比Claude-4-Sonnet仍有提升空間，在大部分場(chǎng)景中可以實(shí)現(xiàn)平替的效果。

（編輯張明富）

-證券日?qǐng)?bào)網(wǎng)

熱點(diǎn)新聞

創(chuàng)業(yè)板改革推動(dòng)投行向“價(jià)值發(fā)現(xiàn)型”中介轉(zhuǎn)型

擰緊工業(yè)“水龍頭” 繪就綠色新圖景

創(chuàng)業(yè)板增設(shè)第四套上市標(biāo)準(zhǔn) 更好支持優(yōu)質(zhì)創(chuàng)新企業(yè)發(fā)展

打造未來(lái)發(fā)展引擎頭部險(xiǎn)企紛紛深化AI布局

24小時(shí)排行一周排行

深度策劃

新一輪以舊換新落地激發(fā)消費(fèi)新動(dòng)能

首先，一些地方在出臺(tái)與消費(fèi)品以舊換新相關(guān)的……[詳情]

市場(chǎng)快訊

00:43	一季度我國(guó)貨物貿(mào)易進(jìn)出口增速創(chuàng)近...
00:43	中國(guó)人民銀行縮量續(xù)做6個(gè)月期買斷...
00:43	從展會(huì)流量到發(fā)展增量：透視消博會(huì)...
00:43	油價(jià)波動(dòng) 航空業(yè)以變應(yīng)變
00:43	優(yōu)化結(jié)構(gòu)布局、“向新而聚”行業(yè)協(xié)...
00:43	首例新三板“幫助造假”民事賠償案...
00:43	商務(wù)部、中國(guó)進(jìn)出口銀行：加大進(jìn)出...
00:43	優(yōu)化融資并購(gòu)制度護(hù)航創(chuàng)業(yè)板改革...
00:43	存儲(chǔ)行業(yè)前沿技術(shù)受關(guān)注相關(guān)企業(yè)...
00:43	債基管理人加強(qiáng)風(fēng)控調(diào)整凈值精度
00:43	多家銀行密集停發(fā)多款信用卡產(chǎn)品
00:43	消博會(huì)觀察：“新”元素釋放新價(jià)值

智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開(kāi)源SOTA模型

智譜發(fā)布GLM-4.5：面向推理、代碼與智能體的開(kāi)源SOTA模型