<strike id="kgs2i"></strike>

首頁

您所在的位置：網(wǎng)站首頁 > 公司產(chǎn)業(yè) > 企業(yè)信息 > 正文

全球權(quán)威大模型盲測榜單公布阿里千問3.6登頂中國最強(qiáng)編程模型

2026-04-03 15:18 來源：證券日報網(wǎng)

本報訊（記者梁傲男）4月3日，全球知名大模型盲測榜單LMArena旗下聚焦AI編程能力的Code Arena公布新一期排名，阿里巴巴最新一代大語言模型Qwen3.6-Plus登上全球榜單第二，超越OpenAI、Google、xAI等國際巨頭，成為該榜單上排名最高的中國大模型。

企業(yè)供圖

LMArena作為當(dāng)前AI領(lǐng)域最具公信力的大模型盲測平臺之一，采用真實(shí)用戶盲測、實(shí)時對抗排名的機(jī)制，因此也被視為是AI領(lǐng)域最公正權(quán)威的全球大模型性能榜單。隨著Agent時代的到來，編程能力成為衡量模型綜合實(shí)力的關(guān)鍵，該榜單備受關(guān)注。

本次Qwen3.6-Plus斬獲第二的React專項(xiàng)榜單是目前AI Coding領(lǐng)域最前沿、挑戰(zhàn)性最高的一個技術(shù)方向，旨在考察大模型在真實(shí)復(fù)雜Web開發(fā)場景下的自主編碼能力。與傳統(tǒng)的單一代碼補(bǔ)全測試不同，該榜單要求模型具備完整的工程思維和端到端開發(fā)能力，能夠在無人輔助的情況下獨(dú)立完成從項(xiàng)目初始化、代碼編寫到調(diào)試運(yùn)行的全流程。

Qwen3.6-Plus是阿里巴巴于4月2日最新發(fā)布的新一代大語言模型，擁有原生多模態(tài)理解、推理能力，并在代碼生成與Agent能力上表現(xiàn)突出。在多項(xiàng)權(quán)威編程評測中，千問3.6均超越參數(shù)量是其兩倍乃至三倍的GLM-5、Kimi-K2.5等模型，以更少的參數(shù)實(shí)現(xiàn)了更強(qiáng)的性能，成為當(dāng)前國產(chǎn)模型中編程能力的標(biāo)桿。

榜單數(shù)據(jù)顯示，千問3.6得分僅次于Anthropic旗下的Claude-Opus-4.6-Thinking（1540分），以4分優(yōu)勢領(lǐng)先OpenAI最新發(fā)布的GPT-5.0-High（1448分），并以12分差距超越Google的Gemini 3.1 Pro Preview（1440分）。這意味著，在最具挑戰(zhàn)性的AI Coding和Agent任務(wù)中，千問3.6展現(xiàn)出與全球頂級大模型比肩甚至更優(yōu)的代碼生成與工程化能力。此外，在全面評估AI編程能力的CodeArena榜單中，Qwen3.6-Plus同樣位居國產(chǎn)模型之首。憑借這一成績，阿里巴巴在全球AI實(shí)驗(yàn)室排名中升至第四，僅次于Anthropic、OpenAI和Google。

Qwen3.6-Plus是阿里千問3.6推出的第一款模型，后續(xù)千問3.6系列還將開源其他尺寸模型，性能更強(qiáng)的旗艦?zāi)Ｐ蚎wen3.6-Max也將于近期發(fā)布。

（編輯汪世軍）

-證券日報網(wǎng)

熱點(diǎn)新聞

創(chuàng)業(yè)板改革推動投行向“價值發(fā)現(xiàn)型”中介轉(zhuǎn)型

擰緊工業(yè)“水龍頭” 繪就綠色新圖景

創(chuàng)業(yè)板增設(shè)第四套上市標(biāo)準(zhǔn) 更好支持優(yōu)質(zhì)創(chuàng)新企業(yè)發(fā)展

打造未來發(fā)展引擎頭部險企紛紛深化AI布局

24小時排行一周排行

深度策劃

新一輪以舊換新落地激發(fā)消費(fèi)新動能

首先，一些地方在出臺與消費(fèi)品以舊換新相關(guān)的……[詳情]

市場快訊

00:43	一季度我國貨物貿(mào)易進(jìn)出口增速創(chuàng)近...
00:43	中國人民銀行縮量續(xù)做6個月期買斷...
00:43	從展會流量到發(fā)展增量：透視消博會...
00:43	油價波動航空業(yè)以變應(yīng)變
00:43	優(yōu)化結(jié)構(gòu)布局、“向新而聚”行業(yè)協(xié)...
00:43	首例新三板“幫助造假”民事賠償案...
00:43	商務(wù)部、中國進(jìn)出口銀行：加大進(jìn)出...
00:43	優(yōu)化融資并購制度護(hù)航創(chuàng)業(yè)板改革...
00:43	存儲行業(yè)前沿技術(shù)受關(guān)注相關(guān)企業(yè)...
00:43	債基管理人加強(qiáng)風(fēng)控調(diào)整凈值精度
00:43	多家銀行密集停發(fā)多款信用卡產(chǎn)品
00:43	消博會觀察：“新”元素釋放新價值

全球權(quán)威大模型盲測榜單公布 阿里千問3.6登頂中國最強(qiáng)編程模型

全球權(quán)威大模型盲測榜單公布阿里千問3.6登頂中國最強(qiáng)編程模型