智譜聯(lián)合華為開源首個國產(chǎn)芯片訓(xùn)練的多模態(tài)SOTA模型

2026-01-14 08:30 來源：證券日報網(wǎng)

本報訊（記者梁傲男）1月14日，智譜聯(lián)合華為開源新一代圖像生成模型GLM-Image，模型基于昇騰Atlas 800T A2設(shè)備和昇思MindSpore AI框架完成從數(shù)據(jù)到訓(xùn)練的全流程，是首個全程在國產(chǎn)芯片上完成訓(xùn)練的SOTA多模態(tài)模型。

8RUK)@XX7U~[[`B$QFC$9CQ.png

智譜/供圖

據(jù)記者了解，GLM-Image采用自主創(chuàng)新的“自回歸+擴散解碼器”混合架構(gòu)，實現(xiàn)了圖像生成與語言模型的聯(lián)合，是智譜面向以NanoBanana Pro為代表的新一代“認(rèn)知型生成”技術(shù)范式的一次重要探索。

智譜方面表示，“GLM-Image是我們對國產(chǎn)計算生態(tài)的一次深度探索與驗證。依托昇騰NPU和昇思MindSpore AI框架，使用動態(tài)圖多級流水下發(fā)、高性能融合算子、多流并行等特性，我們自研了模型訓(xùn)練套件，全面優(yōu)化數(shù)據(jù)預(yù)處理、預(yù)訓(xùn)練、SFT和后訓(xùn)練的端到端流程。通過動態(tài)圖的多級流水優(yōu)化機制，將Host側(cè)算子下發(fā)的關(guān)鍵階段流水化并高度重疊，消除下發(fā)瓶頸；通過多流并行策略，通信和計算互掩，打破文本梯度同步、圖像特征廣播等操作的通信墻，極致優(yōu)化性能；使用AdamW EMA、COC、RMS Norm等昇騰親和的高性能融合算子，同步提升訓(xùn)練的穩(wěn)定性和性能。”

（編輯李家琪）

-證券日報網(wǎng)

熱點新聞

鄂爾多斯“零碳綠谷”煉成記

算力“一鍵下單”撬動產(chǎn)業(yè)新變局

以“新”破題向“實”落筆

券商傭金“價格戰(zhàn)”沒有真正的贏家

24小時排行一周排行

深度策劃

新一輪以舊換新落地激發(fā)消費新動能

首先，一些地方在出臺與消費品以舊換新相關(guān)的……[詳情]

市場快訊

12:15	百煉智能創(chuàng)始人兼CEO馮是聰：從“...
12:07	中國半導(dǎo)體行業(yè)協(xié)會理事長陳南翔：...
12:06	迅策精準(zhǔn)卡位AI計量新政破解“測...
12:06	零一汽車擬赴港上市獲頂級資本多...
12:05	中央企業(yè)科技成果產(chǎn)業(yè)化聯(lián)合體在京...
12:05	石頭科技實控人提議3億元至4億元回...
12:05	貴州天然氣管網(wǎng)公司注冊資本增至19...
12:05	浙江榮泰企業(yè)管理有限公司成立
12:05	西藏三快信息科技有限公司成立
12:03	塔斯汀注冊資本增至3億元
12:03	復(fù)星漢霖（南京）生物技術(shù)有限公司...
12:01	小米申請注冊MiMo Claw商標(biāo)

版權(quán)所有《證券日報》社有限責(zé)任公司

互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證京B2-20250455

京公網(wǎng)安備 11010602201377號京ICP備19002521號

證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考，使用前務(wù)請仔細(xì)閱讀法律申明，風(fēng)險自負(fù)。

證券日報社電話：010-83251700網(wǎng)站電話：010-83251800

網(wǎng)站傳真：010-83251801電子郵件：xmtzx@zqrb.net