本報訊 (記者張文湘)3月18日,MiniMax(上海稀宇極智科技有限公司)發(fā)布新一代Agent旗艦大模型M2.7,首次展示“模型自我進(jìn)化”路徑。該模型通過構(gòu)建Agent Harness體系,深度參與自身訓(xùn)練與優(yōu)化流程,在部分研發(fā)場景中可承擔(dān)30%—50%的工作量,并在內(nèi)部評測集上實現(xiàn)約30%的效果提升。
據(jù)介紹,在核心能力上,M2.7在SWE-bench Pro中取得56.22%的成績,接近國際一線水平;同時在VIBE-Pro、Terminal Bench2等真實工程測試中表現(xiàn)突出,支持端到端項目交付與復(fù)雜系統(tǒng)理解。辦公場景方面,其在GDPval-AA的ELO得分是1495,為開源模型中最高,并顯著提升Office文檔處理與多輪編輯能力。
分析人士認(rèn)為,如果自我“進(jìn)化”能力進(jìn)一步成熟,未來AI系統(tǒng)有望實現(xiàn)從數(shù)據(jù)構(gòu)建、模型訓(xùn)練到評測優(yōu)化的全流程自動化,這將顯著壓縮研發(fā)周期,并重塑AI產(chǎn)業(yè)的成本結(jié)構(gòu)與競爭格局。M2.7的發(fā)布,意味著國內(nèi)廠商正在嘗試定義下一階段的技術(shù)路線,即以Agent為核心、以自我“進(jìn)化”為驅(qū)動的AI系統(tǒng)。
(編輯 黃力)
版權(quán)所有《證券日報》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注