
中國信息通信研究院總工程師 何寶宏
尊敬的各位領(lǐng)導、各位專家,大家好!很高興有機會再次來到數(shù)字經(jīng)濟論壇,分享我和團隊關(guān)于人工智能發(fā)展的最新觀察、理解與思考。內(nèi)容不一定完全準確,供大家批評指正。
第一,今年的《政府工作報告》首次提出“打造智能經(jīng)濟新形態(tài)”,這標志著數(shù)字經(jīng)濟發(fā)展進入了新階段。過去我們強調(diào)數(shù)字化、網(wǎng)絡(luò)化,現(xiàn)在更突出AI賦能千行百業(yè),產(chǎn)業(yè)發(fā)展進入智能化高級階段。從技術(shù)角度看,基礎(chǔ)大模型在過去一年,無論是語言模型還是多模態(tài)模型,都取得了長足進步,但呈現(xiàn)出新特點:語言大模型過去幾年能力年均提升約35%,但增長邏輯出現(xiàn)轉(zhuǎn)折——不再單純依靠“模型越大、效果越好”,而是通過模型擴展、外掛工具等方式,技術(shù)路線發(fā)生了微妙變化。多模態(tài)模型的進步更為顯著,過去一年能力提升50%以上,產(chǎn)業(yè)創(chuàng)新重心正從語言模型加速轉(zhuǎn)向多模態(tài),各類技術(shù)瓶頸不斷被突破。
第二,開源模型能力已接近閉源,差距持續(xù)縮小。開源賽道呈現(xiàn)收斂趨勢,歷史上開源模型數(shù)量曾超200個,如今下載量、使用量及衍生模型高度集中于頭部。TOP5開源模型下載量占比超過83%,可以看到,Meta與DeepSeek明顯占據(jù)了榜單前面,開源模型也在走向收斂。
第三,世界模型成為新探索方向。僅有語言模型和多模態(tài)還不夠,智能需要與物理世界交互,物理仿真、現(xiàn)實建模能力仍顯不足。學術(shù)界正積極探索構(gòu)建世界模型,最簡單路徑是語言大模型與物理世界融合。目前世界模型研究尚處初期,方向明確,但技術(shù)路線仍存較大分歧。一旦世界模型成熟,元宇宙也將迎來真正落地。再往上走是數(shù)據(jù),數(shù)據(jù)是一個重大的挑戰(zhàn)。過去一段時間,模型的能力不能僅依靠模型越大來支撐,今天的數(shù)據(jù)預訓練撞上了墻,難以找到新的數(shù)據(jù)來提升它,數(shù)據(jù)成了制約模型能力提升的一個核心性的因素。如果是數(shù)據(jù)部門,或者做大數(shù)據(jù)要素,你會說數(shù)據(jù)太多了,體量大,類型多。如果做大模型,反過來就會說數(shù)據(jù)太少了,質(zhì)量也不高,互相甩鍋,這是一個正常的現(xiàn)象,不是數(shù)據(jù)不夠,是模型不好。
為了解決今天的公共互聯(lián)網(wǎng)上的公用數(shù)據(jù)基本消耗殆盡的問題,如何挖掘更多的數(shù)據(jù)價值,第一個是私域數(shù)據(jù),針對特定行業(yè)和特定行業(yè)的私域數(shù)據(jù)的開發(fā)利用,尤其是模型的微調(diào)和訓練也是遠遠不夠的,從公域走向私域。
第二是合成數(shù)據(jù),人類產(chǎn)生的數(shù)據(jù)基本上消耗殆盡,生產(chǎn)數(shù)據(jù)遠遠會落后模型消耗數(shù)據(jù)的速度,能不能用各種傳統(tǒng)的算法,用AI的算法合成數(shù)據(jù)回去再訓練數(shù)據(jù),答案是可以的。
第三,不斷提升數(shù)據(jù)的質(zhì)量,通過數(shù)據(jù)工程等方法,無論是什么數(shù)據(jù),需要進一步提煉加工。之所以數(shù)據(jù)用不好,一個重要的原因是數(shù)據(jù)本身在質(zhì)量、即時、完整性、標準化等方面存在很多的問題,我們通過更先進的數(shù)據(jù)工程來不斷提升已有數(shù)據(jù)的質(zhì)量,更好服務(wù)好AI。
算力在過去一年的時間里,熱點層出不窮。第一個是推理算力,從預訓練類的算力轉(zhuǎn)向?qū)嶋H使用的推理算力,推理算力的比例將來肯定會超過訓練算力。第二,算力在國內(nèi)尤其是小散亂,需要把算力一體化集中起來,更好的互聯(lián)互通,發(fā)揮閑置資源的匹配作用,正在構(gòu)建全國算力一張網(wǎng)。第三個是超節(jié)點,我們需要單節(jié)點能力持續(xù)不斷的提升。隨著算力越來越大,算電要協(xié)同,人工智能對電的消耗越來越大。
Agent的技術(shù)框架已經(jīng)初步確定。Agent的開源領(lǐng)域今年發(fā)展得非???,從去年開始技術(shù)發(fā)展非??欤l(fā)現(xiàn)有技巧,效果會更好,把話術(shù)整理多了,就是一個說明書,發(fā)現(xiàn)人整理的說明書,得面向機器,讓機器更準確理解說明書,就有了技術(shù)。
還有駕馭工程,模型給出的結(jié)果是概率性,有可能會出錯,這個時候當概念性出現(xiàn)錯誤的時候,如何控制模型,讓它沿著正確的軌跡去前行,這個在IT歷史上從來沒有遇到過一個新的情況、新的問題。所有智能都有可能出現(xiàn)“發(fā)瘋”的情況,風險一定要在可控范圍之內(nèi),從計算機時代的軟件工程到互聯(lián)網(wǎng)時代的分布式工程,到今年需要一些駕馭工程,每個時代要把它的不確定性變得更加確定。
具身智能目前已經(jīng)取得了長足的發(fā)展,但是大部分的產(chǎn)品還是在特定場景。目前具身智能的領(lǐng)先場景也是在特定場景,但已經(jīng)可以自主執(zhí)行了,這是一個飛躍。未來具身智能的發(fā)展目標是希望能夠泛化,適用于更多的場景,要自主執(zhí)行,不再是遙控。具身智能屬于未來產(chǎn)業(yè),我們還面臨著一些非常關(guān)鍵的挑戰(zhàn),一個是高質(zhì)量數(shù)據(jù)的缺失,訓練具身智能需要物理數(shù)據(jù),海量的數(shù)據(jù)不是專門的物理數(shù)據(jù),如何獲得更多的物理數(shù)據(jù)去訓練它。比如說真機數(shù)據(jù),還是合成數(shù)據(jù),或是互聯(lián)網(wǎng)數(shù)據(jù)。真機數(shù)據(jù)太貴、量太小,合成數(shù)據(jù)有時候不靠譜,互聯(lián)網(wǎng)數(shù)據(jù)很便宜,也不靠譜。所以數(shù)據(jù)的差距問題很大,第二個是模型泛化問題,在一個場景下訓練的具身智能在另外一個場景下不行了,所以整個鏈條的配合問題尤其重要。
AI產(chǎn)品形態(tài)越來越多,AI手機、AIPC,還有眼鏡,形態(tài)明顯日益豐富和完善。
走到今天,AI正在向各行各業(yè)持續(xù)的滲透,但是滲透的次序可能不太一樣,語言滲透比較快,持續(xù)推動人類社會進步。人工智能正在迎來智變,我們做好準備了嗎?我先說這么多,謝謝!
京津冀科技創(chuàng)新聯(lián)動發(fā)展研討會在京舉辦2026-05-29 15:41
山西證監(jiān)局聯(lián)合舉辦期貨衍生品市場服務(wù)山西產(chǎn)業(yè)高質(zhì)量發(fā)展培訓班2026-05-28 20:28
指數(shù)化工具已成為全球投資者配置中國資產(chǎn)的重要渠道2026-05-28 20:07
深交所:研究細化QFII制度優(yōu)化落實舉措 更好服務(wù)在岸與離岸市場...2026-05-28 18:48
?2026上海人工智能高端裝備創(chuàng)新發(fā)展大會舉辦2026-05-28 15:58
| 12:15 | 百煉智能創(chuàng)始人兼CEO馮是聰:從“... |
| 12:07 | 中國半導體行業(yè)協(xié)會理事長陳南翔:... |
| 12:06 | 迅策精準卡位AI計量新政 破解“測... |
| 12:06 | 零一汽車擬赴港上市 獲頂級資本多... |
| 12:05 | 中央企業(yè)科技成果產(chǎn)業(yè)化聯(lián)合體在京... |
| 12:05 | 石頭科技實控人提議3億元至4億元回... |
| 12:05 | 貴州天然氣管網(wǎng)公司注冊資本增至19... |
| 12:05 | 浙江榮泰企業(yè)管理有限公司成立 |
| 12:05 | 西藏三快信息科技有限公司成立 |
| 12:03 | 塔斯汀注冊資本增至3億元 |
| 12:03 | 復星漢霖(南京)生物技術(shù)有限公司... |
| 12:01 | 小米申請注冊MiMo Claw商標 |
版權(quán)所有《證券日報》社有限責任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注