本報(bào)訊 (記者向炎濤)近日,云知聲智能科技股份有限公司(以下簡(jiǎn)稱(chēng)“云知聲”)正式推出Unisound U1-OCR文檔智能基礎(chǔ)大模型。作為首個(gè)工業(yè)級(jí)文檔智能基座,該模型憑借“性能領(lǐng)先、可信可驗(yàn)、開(kāi)箱即用、高效部署、強(qiáng)適配”五大核心優(yōu)勢(shì),打破傳統(tǒng)文檔處理邊界,樹(shù)立起行業(yè)新標(biāo)桿。
據(jù)介紹,文檔智能是指利用人工智能技術(shù)自動(dòng)閱讀和理解文檔影像,并進(jìn)行內(nèi)容的讀取、理解、分類(lèi)及關(guān)鍵信息提取。傳統(tǒng)視覺(jué)方案(OCR 1.0)僅能識(shí)別文字,新一代多模態(tài)方案(OCR 2.0)具備端到端版面理解能力和文字識(shí)別能力。而Unisound U1-OCR則正式開(kāi)啟OCR 3.0時(shí)代——在理解版面的基礎(chǔ)上,進(jìn)一步洞察文檔深層語(yǔ)義,實(shí)現(xiàn)自動(dòng)分類(lèi)與業(yè)務(wù)級(jí)信息抽取,完成了從“字符感知”到“文檔認(rèn)知”的質(zhì)的飛躍。
Unisound U1-OCR核心優(yōu)勢(shì)在于突破了傳統(tǒng)模型“只讀文字、不懂排版”的瓶頸,能夠像人類(lèi)專(zhuān)家一樣“看懂”復(fù)雜文檔。為適應(yīng)OCR 3.0時(shí)代對(duì)于文檔業(yè)務(wù)級(jí)結(jié)構(gòu)化抽取的新要求,Unisound U1-OCR采用ViT+LLM架構(gòu),其中視覺(jué)編碼器部分采用NaViT架構(gòu),實(shí)現(xiàn)文檔分辨率動(dòng)態(tài)處理,模型參數(shù)規(guī)模3B量級(jí),兼顧模型計(jì)算效率與文檔深層語(yǔ)義信息理解的能力要求。
云知聲方面表示,Unisound U1-OCR開(kāi)啟OCR 3.0時(shí)代,標(biāo)志著AI從單純“識(shí)字”躍遷至“理解業(yè)務(wù)邏輯”。公司將以多模態(tài)文檔為知識(shí)入口,賦予機(jī)器自主推理與證據(jù)溯源能力,推動(dòng)AI從感知走向認(rèn)知。未來(lái),云知聲期待構(gòu)建能像人類(lèi)一樣閱讀、思考并解決復(fù)雜問(wèn)題的通用智能體,讓每一份文檔都成為通往AGI的智慧階梯。
(編輯 張昕)
新一輪以舊換新落地 激發(fā)消費(fèi)新動(dòng)能
首先,一些地方在出臺(tái)與消費(fèi)品以舊換新相關(guān)的……[詳情]
版權(quán)所有《證券日?qǐng)?bào)》社有限責(zé)任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營(yíng)許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號(hào)京ICP備19002521號(hào)
證券日?qǐng)?bào)網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請(qǐng)仔細(xì)閱讀法律申明,風(fēng)險(xiǎn)自負(fù)。
證券日?qǐng)?bào)社電話(huà):010-83251700網(wǎng)站電話(huà):010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注