- TH-OCR文字識(shí)別SDK
- OCR文字識(shí)別系統(tǒng)(信創(chuàng)版)
- TH-OCR少數(shù)民族文檔識(shí)別
功能介紹
-
1:1還原重構(gòu)表格
支持OCR自動(dòng)識(shí)別分析表格,并1:1還原重構(gòu)表格,確保數(shù)據(jù)完整性
-
OCR識(shí)別多種版面報(bào)刊
可以識(shí)別不同版式的報(bào)刊內(nèi)容,精確重現(xiàn)原始布局
-
支持多種采集方式
通過手機(jī)、平板電腦、高拍儀、掃描儀、數(shù)碼相機(jī)等途徑獲取的圖像均可識(shí)別
-
可識(shí)別多門語種,字符集廣
支持OCR識(shí)別印刷簡體、手寫簡體、印刷繁體、手寫繁體、生僻字、手寫體和印刷體混合文本及通用英文
-
支持OCR識(shí)別、導(dǎo)出多種格式圖像/文件
支持識(shí)別BMP、JPG、JPEG、PNG、PDF等主流圖片格式;導(dǎo)出JSON、TXT、雙層PDF等多種格式文件
-
自動(dòng)旋正圖片
TH-OCR文字識(shí)別支持45°、90°、180°、270°等多角度圖片旋正
-
可與多種系統(tǒng)集成應(yīng)用
提供標(biāo)準(zhǔn)的API接口,實(shí)現(xiàn)與檔案、OA、ERP等應(yīng)用系統(tǒng)快速集成
-
多種部署方式
既支持B/S端服務(wù)部署,也支持PC端SDK集成部署,也支持移動(dòng)端SDK(Android,鴻蒙)集成
-
支持CPU和GPU硬件配置部署
同樣識(shí)別性能情況下,支持CPU和GPU硬件配置部署,節(jié)約硬件投入成本
產(chǎn)品優(yōu)勢(shì)
國家科技進(jìn)步二等獎(jiǎng)
- TH-OCR技術(shù)榮獲國家科技進(jìn)步二等獎(jiǎng)、教育部科技進(jìn)步一等獎(jiǎng)等多個(gè)獎(jiǎng)項(xiàng)
拓展應(yīng)用
- 支持與AI掃描儀等硬件產(chǎn)品拓展應(yīng)用,實(shí)現(xiàn)大量數(shù)據(jù)檔案的管理與數(shù)字化
自動(dòng)校正
- 支持對(duì)圖像由于掃描引起的傾斜進(jìn)行自動(dòng)校正
支持版面分析、版面還原
- 支持對(duì)圖像進(jìn)行自動(dòng)版面分析,根據(jù)分析結(jié)果 1:1還原版面格式及信息
智能OCR識(shí)別
- 在線可識(shí)別字在原文中的位置和大小,可識(shí)別多頁P(yáng)DF文件
支持OCR生僻字識(shí)別
- TH-OCR文字識(shí)別可高精度識(shí)別多種生僻字
可擦除下劃線、濾色后識(shí)別
- 可過濾圖片上的紅色或粉色等干擾背景
保證數(shù)據(jù)安全
- 企業(yè)內(nèi)網(wǎng)部署,滿足用戶數(shù)據(jù)安全的需求
OCR秒級(jí)識(shí)別、識(shí)別率高
- 識(shí)別速度快,識(shí)別速度在1秒以內(nèi),識(shí)別準(zhǔn)確率高達(dá)99%以上
應(yīng)用范圍廣
- 可廣泛應(yīng)用于檔案系統(tǒng)、大模型、RPA等多領(lǐng)域
應(yīng)用場景
- 電子檔案安全管理系統(tǒng)
- 系統(tǒng)辦公軟件
- 檔案數(shù)字化加工
- 智能硬件
- 合同管理
- 大模型
-
電子檔案安全管理系統(tǒng)
將文通科技OCR文字識(shí)別系統(tǒng)應(yīng)用于計(jì)算機(jī)終端保密檢查系統(tǒng)、電子文檔安全管理系統(tǒng)、郵件防控管理系統(tǒng)、電子檔案安全管理等系統(tǒng),超高識(shí)別率為數(shù)據(jù)安全和風(fēng)險(xiǎn)防范提供高效技術(shù)支持。
-
系統(tǒng)辦公軟件
將文通科技TH-OCR文字識(shí)別SDK嵌入到RPA等辦公軟件中,可應(yīng)用于金融、醫(yī)療保健、企業(yè)、政府、招標(biāo)機(jī)構(gòu)等各領(lǐng)域,為終端客戶提供各類文檔或者內(nèi)部資料的文字提取功能,操作便捷,提升整體的工作效率、節(jié)約人力成本。
-
檔案數(shù)字化加工
將文通科技OCR文字識(shí)別系統(tǒng)應(yīng)用于大量數(shù)據(jù)檔案的管理與數(shù)字化場景,通過掃描企業(yè)紙質(zhì)檔案,可導(dǎo)出雙層PDF、TXT、WORD、XML、XLS等格式文件,方便企業(yè)編輯、查找檔案信息,應(yīng)用于圖書館數(shù)字化項(xiàng)目、歷史檔案數(shù)字化、軍政檔案管理、軍政檔案管理等項(xiàng)目,實(shí)現(xiàn)檔案數(shù)字化管理,提升效率和智能化水平。
-
智能硬件
將文通科技文字識(shí)別SDK嵌入到多功能一體機(jī)、掃描儀或其他智能硬件中,在進(jìn)行文檔錄入的工作時(shí),可快速識(shí)別和提取文字,實(shí)現(xiàn)企業(yè)信息數(shù)字化管理。
-
合同管理
合同比對(duì)基于文通科技TH-OCR文字識(shí)別,自動(dòng)抽取合同文本中的關(guān)鍵信息,可識(shí)別字在原文中的位置和大小,將圖像識(shí)別輸出為可編輯的文件格式,進(jìn)行存儲(chǔ),實(shí)現(xiàn)計(jì)算機(jī)替代人工審核比對(duì),解決合同管理工作中人工審核時(shí)間成本高、人力成本高的難題。
-
大模型
文通科技OCR識(shí)別技術(shù)與大模型相結(jié)合,通過對(duì)文檔整體內(nèi)容和結(jié)構(gòu)的理解,能夠更準(zhǔn)確地識(shí)別和分類信息,從而顯著提升文檔檢索和管理的效率。例如,深度學(xué)習(xí)模型可以理解復(fù)雜的文檔版面,自動(dòng)提取關(guān)鍵信息,處理各種文字和排版風(fēng)格,確保轉(zhuǎn)換后的電子文本質(zhì)量和可編輯性,極大地減少了人工操作的時(shí)間和成本。
客戶案例
免費(fèi)測(cè)試
TH-OCR文字識(shí)別SDK 識(shí)別
圖像建議:大小在200KB左右,位深度24以上。掃描圖像建議:分辨率為300DPI,小于3M。

- TH-OCR文字識(shí)別SDK
- 結(jié)果
- JSON數(shù)據(jù)