本報(bào)記者 許林艷
11月4日,由中國(guó)信息通信研究院組織召開的“存力中國(guó)行暨先進(jìn)存力AI推理工作研討會(huì)”在北京順利召開。本次會(huì)議深入探討了AI時(shí)代下先進(jìn)存力賦能AI大模型發(fā)展的支撐作用。
中國(guó)信息通信研究院首席專家石友康出席研討會(huì)并致辭,中國(guó)信息通信研究院云大所總工程師郭亮主持。中國(guó)移動(dòng)云能力中心項(xiàng)目總師周宇,華為數(shù)據(jù)存儲(chǔ)產(chǎn)品線戰(zhàn)略與業(yè)務(wù)發(fā)展部總裁王旭東,北京硅基流動(dòng)科技有限公司解決方案總監(jiān)唐安波發(fā)表主題演講。
研討會(huì)上,中國(guó)信息通信研究院首席專家石友康深刻闡述了當(dāng)前AI規(guī)?;瘧?yīng)用推進(jìn),推理環(huán)節(jié)的成本、效率、質(zhì)量問題凸顯,先進(jìn)存力成為提升AI推理效能、控制成本的關(guān)鍵。當(dāng)前,國(guó)家高度重視先進(jìn)存力發(fā)展,在《算力基礎(chǔ)設(shè)施高質(zhì)量發(fā)展行動(dòng)計(jì)劃》等政策中明確提出“加速存力技術(shù)研發(fā)應(yīng)用”“持續(xù)提升存儲(chǔ)產(chǎn)業(yè)能力”“推動(dòng)存算網(wǎng)協(xié)同發(fā)展”,為產(chǎn)業(yè)發(fā)展指明了方向。中國(guó)信息通信研究院在政策研究、標(biāo)準(zhǔn)制定、測(cè)試服務(wù)等方面開展多項(xiàng)工作,并聯(lián)合產(chǎn)業(yè)鏈企業(yè)成立“算力產(chǎn)業(yè)發(fā)展方陣先進(jìn)存力AI推理工作組”,同時(shí)提出了三點(diǎn)建議:鼓勵(lì)前沿存儲(chǔ)技術(shù)研發(fā)創(chuàng)新,推動(dòng)存算運(yùn)深度融合,加強(qiáng)存算協(xié)同產(chǎn)業(yè)生態(tài)建設(shè),呼吁業(yè)界同仁凝聚共識(shí),共同推動(dòng)我國(guó)存算協(xié)同發(fā)展。
周宇分享了面向推理的存儲(chǔ)技術(shù)趨勢(shì)與實(shí)踐,圍繞推理挑戰(zhàn)、存儲(chǔ)破局及趨勢(shì)判斷展開。當(dāng)前推理面臨KV Cache存儲(chǔ)需求升級(jí)、多模態(tài)數(shù)據(jù)協(xié)同、存算協(xié)同帶寬不足、負(fù)載潮汐性及成本控制等挑戰(zhàn)。移動(dòng)云針對(duì)性采用分層緩存調(diào)度、高速數(shù)據(jù)互聯(lián)技術(shù)提升帶寬、多模數(shù)據(jù)專屬存儲(chǔ)與標(biāo)準(zhǔn)化、架構(gòu)池化重組等技術(shù)破局,還通過高密全閃存儲(chǔ)、數(shù)據(jù)縮減、自研SPU高密服務(wù)器提高存儲(chǔ)效能和降低成本。未來趨勢(shì)上,移動(dòng)云推動(dòng)存儲(chǔ)從被動(dòng)存儲(chǔ)轉(zhuǎn)向智算協(xié)同,分階段落地高密全閃存儲(chǔ)、數(shù)據(jù)高速互聯(lián)、存算一體等技術(shù),長(zhǎng)遠(yuǎn)構(gòu)建池化多體存儲(chǔ)體系,同時(shí)強(qiáng)調(diào)技術(shù)整合與生態(tài)協(xié)同。
王旭東介紹了AI時(shí)代,IT基礎(chǔ)設(shè)施能力面臨三大挑戰(zhàn):“管不好”的數(shù)據(jù)、“喂不飽”的算力、“降不下”的成本。推理數(shù)據(jù)來源多樣難以形成高質(zhì)量、可持續(xù)供應(yīng)的數(shù)據(jù)集,存儲(chǔ)系統(tǒng)的帶寬和IOPS(每秒讀寫次數(shù))不足,導(dǎo)致GPU等昂貴算力資源長(zhǎng)時(shí)間空閑。傳統(tǒng)存儲(chǔ)架構(gòu)難以兼顧高吞吐、低時(shí)延及異構(gòu)數(shù)據(jù)融合的需求,造成業(yè)務(wù)發(fā)展瓶頸,阻礙AI應(yīng)用落地。華為針對(duì)AI推理研發(fā)的UCM推理記憶數(shù)據(jù)管理技術(shù)在行業(yè)落地中的核心作用,通過“集中高質(zhì)數(shù)據(jù)、提速AI訓(xùn)練、優(yōu)化推理效能”三個(gè)角度,打造AI推理加速解決方案。
唐安波在會(huì)上圍繞大模型推理“推不動(dòng)、推得慢、推得貴”問題展開分享,硅基流動(dòng)構(gòu)建的AI infra工具鏈,聚焦提升算力利用率。核心推理框架適配100多款開源大模型,并通過公有云服務(wù)平臺(tái)為廣大開發(fā)者和企業(yè)提供優(yōu)質(zhì)的大模型服務(wù)。解決方案上,結(jié)合UCM技術(shù)卸載KVCache釋放顯存、提升推理性能,同時(shí)通過智能網(wǎng)關(guān)進(jìn)一步優(yōu)化流量調(diào)度、彈性擴(kuò)縮容等策略,來應(yīng)對(duì)高并發(fā)、低延時(shí)、高吞吐、長(zhǎng)上下文等痛點(diǎn),基于存儲(chǔ)的KVCache方案可大幅提升系統(tǒng)吞吐。
在內(nèi)部研討環(huán)節(jié),參會(huì)專家圍繞算力產(chǎn)業(yè)發(fā)展方陣先進(jìn)存力AI推理工作組下一階段工作建議進(jìn)行研討,中國(guó)移動(dòng)云能力中心、華為、硅基流動(dòng)、浪潮信息、清微智能、東方算芯、智元芯、算苗科技、得一微電子等工作組成員單位參與討論,貢獻(xiàn)實(shí)踐經(jīng)驗(yàn)。存力中國(guó)行暨先進(jìn)存力AI推理工作研討會(huì)的成功舉辦,為存力產(chǎn)業(yè)創(chuàng)新發(fā)展凝聚共識(shí),指明方向。
(編輯 郭之宸)
衛(wèi)星通信萬億賽道起飛,手機(jī)直連時(shí)代開啟
衛(wèi)星通信管理制度及政策法規(guī)進(jìn)一步完善……[詳情]
| 19:25 | 和而泰:鋮昌科技財(cái)務(wù)報(bào)表納入公司... |
| 19:25 | 淮河能源:公司2026年簽訂煤炭長(zhǎng)協(xié)... |
| 19:25 | 海螺水泥:公司生產(chǎn)經(jīng)營(yíng)一切正常 |
| 19:24 | 大華股份:公司及子公司無逾期對(duì)外... |
| 19:24 | 恒華科技:在電力市場(chǎng)化改革縱深推... |
| 19:24 | 華工科技:公司具備硅光芯片到模塊... |
| 19:24 | 張小泉:關(guān)于公司董事辭職的公告 |
| 19:24 | 首都在線:關(guān)于部分募投項(xiàng)目結(jié)項(xiàng)并... |
| 19:24 | 歐陸通:截至2025年6月30日公司累... |
| 19:24 | 諾瓦星云:XR虛擬拍攝解決方案在電... |
| 19:24 | 華勤技術(shù):公司持續(xù)聚焦智能硬件行... |
| 19:24 | 超聲電子:截至2025年9月底,公司... |
版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注