本報訊 (記者向炎濤)近日,云知聲智能科技股份有限公司(以下簡稱“云知聲”)正式推出Unisound U1-OCR文檔智能基礎(chǔ)大模型。作為首個工業(yè)級文檔智能基座,該模型憑借“性能領(lǐng)先、可信可驗、開箱即用、高效部署、強適配”五大核心優(yōu)勢,打破傳統(tǒng)文檔處理邊界,樹立起行業(yè)新標桿。
據(jù)介紹,文檔智能是指利用人工智能技術(shù)自動閱讀和理解文檔影像,并進行內(nèi)容的讀取、理解、分類及關(guān)鍵信息提取。傳統(tǒng)視覺方案(OCR 1.0)僅能識別文字,新一代多模態(tài)方案(OCR 2.0)具備端到端版面理解能力和文字識別能力。而Unisound U1-OCR則正式開啟OCR 3.0時代——在理解版面的基礎(chǔ)上,進一步洞察文檔深層語義,實現(xiàn)自動分類與業(yè)務(wù)級信息抽取,完成了從“字符感知”到“文檔認知”的質(zhì)的飛躍。
Unisound U1-OCR核心優(yōu)勢在于突破了傳統(tǒng)模型“只讀文字、不懂排版”的瓶頸,能夠像人類專家一樣“看懂”復雜文檔。為適應OCR 3.0時代對于文檔業(yè)務(wù)級結(jié)構(gòu)化抽取的新要求,Unisound U1-OCR采用ViT+LLM架構(gòu),其中視覺編碼器部分采用NaViT架構(gòu),實現(xiàn)文檔分辨率動態(tài)處理,模型參數(shù)規(guī)模3B量級,兼顧模型計算效率與文檔深層語義信息理解的能力要求。
云知聲方面表示,Unisound U1-OCR開啟OCR 3.0時代,標志著AI從單純“識字”躍遷至“理解業(yè)務(wù)邏輯”。公司將以多模態(tài)文檔為知識入口,賦予機器自主推理與證據(jù)溯源能力,推動AI從感知走向認知。未來,云知聲期待構(gòu)建能像人類一樣閱讀、思考并解決復雜問題的通用智能體,讓每一份文檔都成為通往AGI的智慧階梯。
(編輯 張昕)
| 00:43 | 一季度我國貨物貿(mào)易進出口增速創(chuàng)近... |
| 00:43 | 中國人民銀行縮量續(xù)做6個月期買斷... |
| 00:43 | 從展會流量到發(fā)展增量:透視消博會... |
| 00:43 | 油價波動 航空業(yè)以變應變 |
| 00:43 | 優(yōu)化結(jié)構(gòu)布局、“向新而聚”行業(yè)協(xié)... |
| 00:43 | 首例新三板“幫助造假”民事賠償案... |
| 00:43 | 商務(wù)部、中國進出口銀行:加大進出... |
| 00:43 | 優(yōu)化融資并購制度 護航創(chuàng)業(yè)板改革... |
| 00:43 | 存儲行業(yè)前沿技術(shù)受關(guān)注 相關(guān)企業(yè)... |
| 00:43 | 債基管理人加強風控調(diào)整凈值精度 |
| 00:43 | 多家銀行密集停發(fā)多款信用卡產(chǎn)品 |
| 00:43 | 消博會觀察:“新”元素釋放新價值 |
版權(quán)所有《證券日報》社有限責任公司
互聯(lián)網(wǎng)新聞信息服務(wù)許可證 10120240020增值電信業(yè)務(wù)經(jīng)營許可證 京B2-20250455
京公網(wǎng)安備 11010602201377號京ICP備19002521號
證券日報網(wǎng)所載文章、數(shù)據(jù)僅供參考,使用前務(wù)請仔細閱讀法律申明,風險自負。
證券日報社電話:010-83251700網(wǎng)站電話:010-83251800 網(wǎng)站傳真:010-83251801電子郵件:xmtzx@zqrb.net
安卓
IOS
掃一掃,加關(guān)注
掃一掃,加關(guān)注