本報訊 (記者梁傲男)1月14日,智譜聯(lián)合華為開源新一代圖像生成模型GLM-Image,模型基于昇騰Atlas 800T A2設(shè)備和昇思MindSpore AI框架完成從數(shù)據(jù)到訓(xùn)練的全流程,是首個全程在國產(chǎn)芯片上完成訓(xùn)練的SOTA多模態(tài)模型。

智譜/供圖
據(jù)記者了解,GLM-Image采用自主創(chuàng)新的“自回歸+擴散解碼器”混合架構(gòu),實現(xiàn)了圖像生成與語言模型的聯(lián)合,是智譜面向以NanoBanana Pro為代表的新一代“認知型生成”技術(shù)范式的一次重要探索。
智譜方面表示,“GLM-Image是我們對國產(chǎn)計算生態(tài)的一次深度探索與驗證。依托昇騰NPU和昇思MindSpore AI框架,使用動態(tài)圖多級流水下發(fā)、高性能融合算子、多流并行等特性,我們自研了模型訓(xùn)練套件,全面優(yōu)化數(shù)據(jù)預(yù)處理、預(yù)訓(xùn)練、SFT和后訓(xùn)練的端到端流程。通過動態(tài)圖的多級流水優(yōu)化機制,將Host側(cè)算子下發(fā)的關(guān)鍵階段流水化并高度重疊,消除下發(fā)瓶頸;通過多流并行策略,通信和計算互掩,打破文本梯度同步、圖像特征廣播等操作的通信墻,極致優(yōu)化性能;使用AdamW EMA、COC、RMS Norm等昇騰親和的高性能融合算子,同步提升訓(xùn)練的穩(wěn)定性和性能。”
(編輯 李家琪)
| 11:56 | 央行等四部門:統(tǒng)籌建立常態(tài)化金融... |
| 11:33 | 京東集團:感謝巴黎警方對倉庫被盜... |
| 11:27 | 中鐵快運聯(lián)手菜鳥 今年春節(jié)讓旅客... |
| 11:22 | 五項汽車強制性國家標準征求意見 ... |
| 11:21 | 春節(jié)消費旺季將至 多地發(fā)文要求外... |
| 11:21 | 多家養(yǎng)殖公司1月份銷售價格回暖 |
| 11:20 | 冬奧賽場內(nèi)外“商戰(zhàn)”暗涌 運動戶... |
| 11:20 | 機器人共享模式要火?擎天租:預(yù)計... |
| 11:20 | 產(chǎn)業(yè)鏈企業(yè)協(xié)同共振守護春節(jié)“肉盤... |
| 11:17 | 海航控股開啟新年高質(zhì)量發(fā)展序幕 |
| 10:15 | 科大訊飛2025年經(jīng)營回款超270億元 |
| 09:59 | 天工國際攜手鮑迪克 粉末冶金產(chǎn)業(yè)... |
版權(quán)所有《證券日報》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風(fēng)險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注