本報訊 (記者梁傲男)1月14日,智譜聯(lián)合華為開源新一代圖像生成模型GLM-Image,模型基于昇騰Atlas 800T A2設(shè)備和昇思MindSpore AI框架完成從數(shù)據(jù)到訓(xùn)練的全流程,是首個全程在國產(chǎn)芯片上完成訓(xùn)練的SOTA多模態(tài)模型。

智譜/供圖
據(jù)記者了解,GLM-Image采用自主創(chuàng)新的“自回歸+擴散解碼器”混合架構(gòu),實現(xiàn)了圖像生成與語言模型的聯(lián)合,是智譜面向以NanoBanana Pro為代表的新一代“認(rèn)知型生成”技術(shù)范式的一次重要探索。
智譜方面表示,“GLM-Image是我們對國產(chǎn)計算生態(tài)的一次深度探索與驗證。依托昇騰NPU和昇思MindSpore AI框架,使用動態(tài)圖多級流水下發(fā)、高性能融合算子、多流并行等特性,我們自研了模型訓(xùn)練套件,全面優(yōu)化數(shù)據(jù)預(yù)處理、預(yù)訓(xùn)練、SFT和后訓(xùn)練的端到端流程。通過動態(tài)圖的多級流水優(yōu)化機制,將Host側(cè)算子下發(fā)的關(guān)鍵階段流水化并高度重疊,消除下發(fā)瓶頸;通過多流并行策略,通信和計算互掩,打破文本梯度同步、圖像特征廣播等操作的通信墻,極致優(yōu)化性能;使用AdamW EMA、COC、RMS Norm等昇騰親和的高性能融合算子,同步提升訓(xùn)練的穩(wěn)定性和性能。”
(編輯 李家琪)
| 12:15 | 百煉智能創(chuàng)始人兼CEO馮是聰:從“... |
| 12:07 | 中國半導(dǎo)體行業(yè)協(xié)會理事長陳南翔:... |
| 12:06 | 迅策精準(zhǔn)卡位AI計量新政 破解“測... |
| 12:06 | 零一汽車擬赴港上市 獲頂級資本多... |
| 12:05 | 中央企業(yè)科技成果產(chǎn)業(yè)化聯(lián)合體在京... |
| 12:05 | 石頭科技實控人提議3億元至4億元回... |
| 12:05 | 貴州天然氣管網(wǎng)公司注冊資本增至19... |
| 12:05 | 浙江榮泰企業(yè)管理有限公司成立 |
| 12:05 | 西藏三快信息科技有限公司成立 |
| 12:03 | 塔斯汀注冊資本增至3億元 |
| 12:03 | 復(fù)星漢霖(南京)生物技術(shù)有限公司... |
| 12:01 | 小米申請注冊MiMo Claw商標(biāo) |
版權(quán)所有《證券日報》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險自負(fù)。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注