ysl水蜜桃86满十八岁会变|国产无码一区二区在线|强千久久久久亚洲少妇天堂网|亚洲精品无码扫码|天堂亚洲av成人黄色~A片|成年人香蕉视频在线免费播放|久草久草久草久草久草久草久草|成人黄片视频成人二级片|婷婷在线国产亚洲无码第三页|国产六月婷婷黄色A级

證券日報微信

證券日報微博

全球權(quán)威大模型盲測榜單公布 阿里千問3.6登頂中國最強(qiáng)編程模型

2026-04-03 15:18  來源:證券日報網(wǎng) 

    本報訊 (記者梁傲男)4月3日,全球知名大模型盲測榜單LMArena旗下聚焦AI編程能力的Code Arena公布新一期排名,阿里巴巴最新一代大語言模型Qwen3.6-Plus登上全球榜單第二,超越OpenAI、Google、xAI等國際巨頭,成為該榜單上排名最高的中國大模型。    

    企業(yè)供圖

    LMArena作為當(dāng)前AI領(lǐng)域最具公信力的大模型盲測平臺之一,采用真實(shí)用戶盲測、實(shí)時對抗排名的機(jī)制,因此也被視為是AI領(lǐng)域最公正權(quán)威的全球大模型性能榜單。隨著Agent時代的到來,編程能力成為衡量模型綜合實(shí)力的關(guān)鍵,該榜單備受關(guān)注。

    本次Qwen3.6-Plus斬獲第二的React專項(xiàng)榜單是目前AI Coding領(lǐng)域最前沿、挑戰(zhàn)性最高的一個技術(shù)方向,旨在考察大模型在真實(shí)復(fù)雜Web開發(fā)場景下的自主編碼能力。與傳統(tǒng)的單一代碼補(bǔ)全測試不同,該榜單要求模型具備完整的工程思維和端到端開發(fā)能力,能夠在無人輔助的情況下獨(dú)立完成從項(xiàng)目初始化、代碼編寫到調(diào)試運(yùn)行的全流程。

    Qwen3.6-Plus是阿里巴巴于4月2日最新發(fā)布的新一代大語言模型,擁有原生多模態(tài)理解、推理能力,并在代碼生成與Agent能力上表現(xiàn)突出。在多項(xiàng)權(quán)威編程評測中,千問3.6均超越參數(shù)量是其兩倍乃至三倍的GLM-5、Kimi-K2.5等模型,以更少的參數(shù)實(shí)現(xiàn)了更強(qiáng)的性能,成為當(dāng)前國產(chǎn)模型中編程能力的標(biāo)桿。

    榜單數(shù)據(jù)顯示,千問3.6得分僅次于Anthropic旗下的Claude-Opus-4.6-Thinking(1540分),以4分優(yōu)勢領(lǐng)先OpenAI最新發(fā)布的GPT-5.0-High(1448分),并以12分差距超越Google的Gemini 3.1 Pro Preview(1440分)。這意味著,在最具挑戰(zhàn)性的AI Coding和Agent任務(wù)中,千問3.6展現(xiàn)出與全球頂級大模型比肩甚至更優(yōu)的代碼生成與工程化能力。此外,在全面評估AI編程能力的CodeArena榜單中,Qwen3.6-Plus同樣位居國產(chǎn)模型之首。憑借這一成績,阿里巴巴在全球AI實(shí)驗(yàn)室排名中升至第四,僅次于Anthropic、OpenAI和Google。

    Qwen3.6-Plus是阿里千問3.6推出的第一款模型,后續(xù)千問3.6系列還將開源其他尺寸模型,性能更強(qiáng)的旗艦?zāi)P蚎wen3.6-Max也將于近期發(fā)布。

(編輯 汪世軍)

-證券日報網(wǎng)
  • 24小時排行 一周排行

版權(quán)所有《證券日報》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455

京公網(wǎng)安備 11010602201377號京ICP備19002521號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。

證券日報社電話:010-83251700網(wǎng)站電話:010-83251800

網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net

官方客戶端

安卓

IOS

官方微信

掃一掃,加關(guān)注

官方微博

掃一掃,加關(guān)注