本報(bào)訊 (記者袁傳璽)1月27日,專注于推理GPU的曦望(Sunrise)在杭州舉辦首屆Sunrise GPU Summit,發(fā)布新一代推理GPU芯片“啟望S3”,并披露其圍繞推理場景構(gòu)建的算力產(chǎn)品體系及共建推理云生態(tài)計(jì)劃。這也是曦望在近一年累計(jì)完成約30億元戰(zhàn)略融資后的首次集中公開亮相。

與強(qiáng)調(diào)峰值算力和通用能力的訓(xùn)推一體GPU路線不同,曦望在啟望S3芯片上繼續(xù)強(qiáng)化其“All-in推理”的定位。
曦望聯(lián)席CEO王勇表示,AI行業(yè)正在進(jìn)入以應(yīng)用落地為核心的下半場,推理逐步超越訓(xùn)練,成為主要算力消耗場景。相比訓(xùn)練階段的一次性高投入,推理更強(qiáng)調(diào)長期交付能力、單位成本和系統(tǒng)穩(wěn)定性,這也正在改變GPU的競爭邏輯。
據(jù)介紹,啟望S3是一款面向大模型推理深度定制的GPU芯片,圍繞真實(shí)推理負(fù)載,對芯片架構(gòu)、存儲體系與互聯(lián)方式進(jìn)行了系統(tǒng)級設(shè)計(jì)。相比上一代產(chǎn)品,啟望S3在典型推理場景下的整體性價(jià)比提升超過10倍。
在算力與存儲設(shè)計(jì)上,啟望S3支持從FP16到FP4的精度自由切換,在保證模型效果的前提下顯著提升低精度推理效率;同時(shí)率先在國內(nèi)GPU產(chǎn)品中采用LPDDR6顯存方案,顯存容量較上一代提升4倍,緩解了大模型推理中常見的顯存瓶頸問題。
在DeepSeekV3/R1滿血版等主流大模型推理場景中,啟望S3的單位Token推理成本較上一代降低約90%。王勇表示,這是使“百萬Token一分錢”從概念走向可規(guī)模化部署的工程能力。
王勇表示,曦望的推理GPU并非單點(diǎn)硬件創(chuàng)新,而是通過芯片架構(gòu)、軟件體系與算力交付方式的一體化設(shè)計(jì),將硬件能力穩(wěn)定轉(zhuǎn)化為可交付、可計(jì)價(jià)的推理算力。目前,曦望已構(gòu)建與CUDA兼容的基礎(chǔ)軟件體系,支持推理應(yīng)用低成本遷移與持續(xù)優(yōu)化,相關(guān)能力已覆蓋ModelScope平臺90%以上主流大模型形態(tài)。
圍繞啟望S3,曦望同步發(fā)布了面向大模型推理的寰望SC3-256超節(jié)點(diǎn)方案,可高效支撐PD分離架構(gòu)與大規(guī)模專家并行(EP)部署,適配千億、萬億級參數(shù)的多模態(tài)MoE推理場景。
同時(shí),曦望還推出覆蓋PCIe、OAM模組、一體機(jī)及AI計(jì)算集群在內(nèi)的S3產(chǎn)品矩陣,覆蓋從單機(jī)推理到大規(guī)模集群部署的多樣化需求。
值得關(guān)注的是,曦望通過生態(tài)共建推理云被視為其推理算力體系中的關(guān)鍵一環(huán)。依托自研推理GPU,曦望實(shí)現(xiàn)從底層芯片到上層平臺的全棧優(yōu)化,將硬件能力以平臺化方式穩(wěn)定釋放,從而降低模型適配和系統(tǒng)部署復(fù)雜度,形成面向應(yīng)用落地的完整算力交付路徑。
曦望聯(lián)席CEO王湛表示,新一代的AI算力平臺,應(yīng)具備軟硬件深度協(xié)同、資源利用高度彈性、技術(shù)門檻低且運(yùn)行穩(wěn)定可靠等特征?;谶@一判斷,曦望通過云化方式對算力交付模式進(jìn)行重構(gòu),使推理算力從“設(shè)備能力”轉(zhuǎn)化為可標(biāo)準(zhǔn)化、可規(guī)模化的服務(wù)能力。
據(jù)介紹,共建推理云以啟望S3為底座,通過GPU池化與彈性調(diào)度,將分散的算力資源整合為統(tǒng)一的推理算力池,并以MaaS(Model as a Service)作為核心入口,向企業(yè)提供開箱即用的大模型推理服務(wù)。企業(yè)無需關(guān)注底層硬件配置和集群運(yùn)維,即可按需調(diào)用模型能力,并根據(jù)業(yè)務(wù)負(fù)載靈活擴(kuò)展算力規(guī)模。
曦望董事長徐冰表示,隨著大模型進(jìn)入規(guī)?;瘧?yīng)用階段,AI產(chǎn)業(yè)正從“訓(xùn)練驅(qū)動”轉(zhuǎn)向“推理驅(qū)動”。相比一次性投入巨大的訓(xùn)練,推理更強(qiáng)調(diào)長期交付能力、單位成本和系統(tǒng)穩(wěn)定性。
他指出,曦望并不希望只做一家賣芯片的公司,而是希望圍繞推理場景,構(gòu)建“芯片+系統(tǒng)+生態(tài)”的整體布局,讓推理算力真正成為可規(guī)?;?、可持續(xù)的基礎(chǔ)設(shè)施。2025年,曦望芯片交付量已突破萬片。
“誰能持續(xù)降低推理成本,誰就掌握了AI產(chǎn)業(yè)的成本曲線。”徐冰表示,曦望希望通過推理算力體系的系統(tǒng)性創(chuàng)新,助力AI應(yīng)用實(shí)現(xiàn)規(guī)?;涞嘏c可持續(xù)增長。
(編輯 李家琪)
首先,一些地方在出臺與消費(fèi)品以舊換新相關(guān)的……[詳情]
版權(quán)所有《證券日報(bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報(bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日報(bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注