本報(bào)記者 袁傳璽
近日,百度、階躍星辰、阿里、DeepSeek、Kimi等多家頭部科技企業(yè)密集發(fā)布自研大模型,覆蓋OCR識(shí)別、多模態(tài)理解、具身智能、推理能力等多個(gè)前沿領(lǐng)域,且這些新模型絕大多數(shù)選擇了開源路徑。
業(yè)內(nèi)普遍認(rèn)為,我國(guó)AI開源生態(tài)正從“可用”邁向“好用”乃至“引領(lǐng)”的關(guān)鍵階段,同時(shí)國(guó)內(nèi)開源生態(tài)的逐步擴(kuò)大與完善將加快我國(guó)人工智能領(lǐng)域的發(fā)展速度。
頭部企業(yè)動(dòng)作頻頻
近期,國(guó)產(chǎn)大模型的發(fā)布節(jié)奏顯著加快。2月2日,階躍星辰推出Step3.5Flash,該模型采用稀疏混合專家(MoE)架構(gòu),總參數(shù)量高達(dá)1960億,但每Token僅激活約110億參數(shù),在確保強(qiáng)大推理能力的同時(shí)大幅提高了運(yùn)行效率,尤其適用于復(fù)雜Agent工作流場(chǎng)景。
在輕量化模型方面,2月3日,智譜正式開源GLM-OCR,據(jù)了解,這是一款僅0.9B參數(shù)的小型模型,并支持vLLM、SGLang和Ollama等主流推理框架,顯著降低了部署門檻;1月29日,百度發(fā)布文檔解析模型PaddleOCR-VL-1.5,該模型以僅0.9B參數(shù)的輕量架構(gòu),在文檔解析評(píng)測(cè)榜單OmniDocBenchV1.5中取得全球綜合性能第一的成績(jī),整體精度達(dá)到94.5%。
與此同時(shí),具身智能成為新熱點(diǎn)。優(yōu)必選于近日發(fā)布其自研的“具身大腦”Thinker模型,以“小參數(shù)、高性能、全開源”為特色。而在多模態(tài)領(lǐng)域,DeepSeek發(fā)布新的OCR2模型、月之暗面發(fā)布KimiK2.5模型等。
據(jù)了解,上述模型集中在2026年1月份至2月初密集發(fā)布,覆蓋文本、圖像、語(yǔ)音、具身控制及多模態(tài)融合等多個(gè)維度,且多數(shù)模型強(qiáng)調(diào)在特定場(chǎng)景下的性能優(yōu)化,如文檔解析、工業(yè)機(jī)器人響應(yīng)、Agent協(xié)同等。
“眾多廠商選擇在此時(shí)集中發(fā)布模型,主要是因?yàn)榻?jīng)過三年的技術(shù)積累,國(guó)產(chǎn)大模型在架構(gòu)設(shè)計(jì)、訓(xùn)練方法、工程優(yōu)化等方面已形成較為成熟的技術(shù)體系,具備了規(guī)模化輸出高質(zhì)量模型的能力。”廣州艾媒數(shù)聚信息咨詢股份有限公司CEO張毅在接受《證券日?qǐng)?bào)》記者采訪時(shí)表示,應(yīng)用場(chǎng)景愈發(fā)明確,從工業(yè)機(jī)器人到智能辦公,從金融風(fēng)控到教育醫(yī)療,下游需求促使模型向?qū)I(yè)化、輕量化、高效化發(fā)展。
“更重要的是,當(dāng)前正處于全球AI競(jìng)爭(zhēng)的關(guān)鍵時(shí)期。國(guó)產(chǎn)大模型不僅是技術(shù)產(chǎn)品,更是國(guó)家戰(zhàn)略科技力量的重要組成部分。通過密集發(fā)布高水準(zhǔn)模型,中國(guó)企業(yè)正積極爭(zhēng)奪技術(shù)話語(yǔ)權(quán)與生態(tài)主導(dǎo)權(quán)。”張毅表示。
開源已成主流趨勢(shì)
值得注意的是,無論是智譜的GLM-OCR、階躍星辰的Step3.5Flash、KimiK2.5,還是DeepSeek-OCR2,均選擇發(fā)布即開源策略。業(yè)內(nèi)普遍認(rèn)為,這一趨勢(shì)標(biāo)志著中國(guó)AI產(chǎn)業(yè)正從“閉源競(jìng)賽”轉(zhuǎn)向“開源協(xié)同”,其背后既有戰(zhàn)略考量,也有生態(tài)邏輯。
張毅認(rèn)為,開源有助于快速驗(yàn)證模型能力、擴(kuò)大影響力。在模型性能日益相近的當(dāng)下,誰(shuí)能率先獲得開發(fā)者和企業(yè)的廣泛應(yīng)用,誰(shuí)就更有可能成為事實(shí)標(biāo)準(zhǔn)。通過開源,企業(yè)可借助社區(qū)力量進(jìn)行壓力測(cè)試、場(chǎng)景適配與漏洞修復(fù),形成“發(fā)布—反饋—迭代”的高效閉環(huán)。
同時(shí),開源也是構(gòu)建國(guó)產(chǎn)AI生態(tài)的必經(jīng)之路。過去,中國(guó)AI產(chǎn)業(yè)高度依賴國(guó)外基礎(chǔ)模型與框架,如今,以Qwen、智譜、Kimi、DeepSeek等為代表的國(guó)產(chǎn)開源模型矩陣日益完善,覆蓋語(yǔ)言、視覺、語(yǔ)音、具身智能等多個(gè)模態(tài),初步形成了從基座模型到工具鏈、從訓(xùn)練到推理的全棧能力。“這種‘自主可控+開放協(xié)作’的模式,既保障了技術(shù)主權(quán),又避免了重復(fù)建設(shè),有效降低了中小企業(yè)和科研機(jī)構(gòu)的創(chuàng)新門檻。”有行業(yè)分析師對(duì)《證券日?qǐng)?bào)》記者表示。
更重要的是,開源生態(tài)的繁榮反過來反哺模型本身。其中,由社區(qū)貢獻(xiàn)的評(píng)測(cè)數(shù)據(jù)、優(yōu)化方案、插件工具等,成為了模型持續(xù)進(jìn)化的“養(yǎng)分”。以阿里千問為例,AI開源社區(qū)HuggingFace的最新數(shù)據(jù)顯示,阿里千問的衍生模型數(shù)量已突破20萬個(gè),全球開發(fā)者基于千問開發(fā)的衍生模型每天新增超過200個(gè),涵蓋機(jī)器人控制、代碼生成、漫畫后期制作、多語(yǔ)種翻譯等多個(gè)方向。
展望未來,張毅表示,從密集發(fā)布到全面開源,國(guó)產(chǎn)大模型正走出一條兼具技術(shù)創(chuàng)新與生態(tài)共建的發(fā)展路徑。這不僅是中國(guó)AI產(chǎn)業(yè)邁向成熟的重要標(biāo)志,也為全球人工智能的多元化發(fā)展增添了新的動(dòng)力。在開源浪潮的推動(dòng)下,一個(gè)更為開放、協(xié)同、高效的國(guó)產(chǎn)AI生態(tài)正在加速形成。
新一輪以舊換新落地 激發(fā)消費(fèi)新動(dòng)能
首先,一些地方在出臺(tái)與消費(fèi)品以舊換新相關(guān)的……[詳情]
版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日?qǐng)?bào)社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注