漢王 OCR
在最近幾年中,OCR識別技術隨著掃描儀的普及得到了飛速的發展,掃描、識別軟件的性能不斷強大并向智能化不斷升級發展。
OCR 是英文 的縮寫,意思為光學字符識別,通稱為文字識別,它的工作原理為通過掃描儀或數碼相機等光學輸入設備獲取紙張上的文字圖片信息,利用 各種模式識別算法分析文字形態特征,判斷出漢字的標準編碼,并按通用格式存儲在文本文件中,由此可以看出,OCR實際上是讓計算機認字,實現文字自動輸 入。它是一種快捷、省力、高效的文字輸入方法。
漢王OCR 是針對機關單位、企業及有文字錄入需求的個人用戶,在日常的工作中,快速的對書刊、報紙、公文、宣傳頁等印刷稿件中內容進行錄入的應用需求而推出的。本產 品集成了漢王科技頂尖的文字識別技術,對印刷文稿錄入的識別率高達99.5%,能夠識別百余種印刷字體和各種中英繁表圖混排格式的文本,。是理想的文字、 表格、圖像錄入系統。
這樣一來,就不用再手工輸入大量的資料了,只要掃進去,像那種抓英文的工具一樣,讓軟件自動地轉成WORD文檔。即可將圖片變成可編輯的文擋格式。這是目前破解最完美的漢王OCR軟件。
丹青中英日文OCR 辯識 白金版 4.5
安裝序列號:-7DMN-MM7M-CFCB
功能簡介
原文重現 盡在瞬間
◎提供繁中、簡中和日文三種操作介面
◎可辨識繁中、簡中、英文及日文四種文件
◎辨識后的文件可儲存成各種常用檔案格式再編輯
◎超高辨識速率及辨識率再提升,快速原文重現各式文件
產品說明
影像掃瞄
1. 可處理彩色、灰階或黑白的文件影像。
2. 傾斜校正:自動偵測文件影像傾斜角度,并提供旋轉影像之功能。
辨識文件
1. 自動辨識:輕按一鈕,即可自動分析、辨識、校對影像文件,圖文分離,并轉換成可編輯的文件檔案。
2. 設定辨識字集:不需切換語文環境,即可辨識繁中、簡中、純英文及日文四種文件。
3. 高辨識速率:在 III 個人電腦環境下,每秒鐘能辨識高達150個中文字。
4. 多種字體辨識及重現:能夠辨識多種印刷字體,如明體、黑體、仿宋體、楷書、圓體、隸書等,并在辨識后還原成原稿的字體。
5. 原文重現編輯環境:可辨識各種表格及影像,辨識結果依照原文件的圖文版面格式呈現,方便您校對、編輯,節省重新排版的時間。
1. 再辨識功能:提供合/分字、合/分行、合/分區塊、變更區塊屬性等再辨識功能,讓您能夠修正錯誤的辨識結果。
2. 學習新字功能:可將易辨識錯誤的字元輸入到學習資料庫中,提高下次辨識之正確率。
3. 候選字功能:提供原文影像供辨識后圖文作校對,且針對型態相近之文字及語意上前后相連的字詞提供候選字輕松更正辨識錯誤的文字。
4. 自動校對:利用內建的常用詞庫自動校對辨識出的文字,并標示出辨識時所碰到的疑問字,節省您校對的時間。
輸出檔案
1. 傳送至其他應用軟體:可將辨識結果直接傳送至您所指定的應用軟體中再處理,例如可設定辨識結果自動儲存成HTML檔案并直接傳送至網路瀏覽器中。
2. 可儲存多種檔案格式:辨識后的結果可儲存成不同之檔案格式,如TXT、RTF、DOC、XLS、SLK、CSV、HTML等,方便您做不同的應用與處理。
清華紫光文通 TH-OCR 9.0 光盤完全特別版
把破解補丁放到安裝目錄下,運行破解補丁,確定,OK!
TH-OCR簡介
OCR是英文 的縮寫,意思為光學字符識別,通稱為文字識別,它的工作原理為通過掃描儀或數碼相機等光學輸入設備獲取紙張上的文字圖片信息,利用 各種模式識別算法分析文字形態特征,判斷出漢字的標準編碼,并按通用格式存儲在文本文件中,由此可以看出,OCR實際上是讓計算機認字,實現文字自動輸 入。它是一種快捷、省力、高效的文字輸入方法。
TH-OCR是清華大學自1985年就開始研發的,TH是(清華)的縮 寫,TH-OCR代表北京清華紫光文通信息技術有限公司開發的OCR軟件。在國家“863”計劃支持下,持續了十多年的科研成果,從1.0版本開始已經升 級到現在的9.0版本。獨家真正實現了漢英混排同時識別,在國際上首次突破了OCR產品只能處理漢字或英文單一文字的局限性,新增了東方文字(簡繁漢、日 文、韓文)識別功能,對日文和韓文與英文混排文檔的識別水平甚至超過日本和韓國對本國文字的識別水平尚書文字識別系統完全版,在國內、外產生了重大的影響,并連續3年被中國軟件 行業協會評為優秀軟件產品,成為漢字輸入技術的一座里程碑。TH-OCR9.0版本已應用到了包括電子政務、電子出版物、報社、銀行、郵政、稅務、圖書館 等多個領域,成為國內OCR市場的先鋒。
本屆兩會代表的所有提案全部采用了我國自主知識產權的世界識別領域領先產品——清華紫光文通的TH- OCR9.0進行錄入識別,它以準確的識別率、優異的識別速度博得了兩會工作人員的交口稱贊。而清華TH-OCR技術在兩會上的成功應用更論證了我國也完 全有實力擁有自己的卓越技術。
TH-OCR的突出特點:
◇ 漢英雙語同時混排,識別率最高,居世界領先水平。
◇ 可以識別黑白、灰度、彩色圖像,可以讀取多種圖像格式。
◇ 首創對識別結果進行電子文檔版面復原功能,所見即所得。
◇ 首創日文、韓文、日英混排、韓英混排識別功能,識別率98%以上。
TH-OCR的六大優勢:
1. 是唯一可以識別2萬多漢字的多體文字識別系統,漢字識別國內最優。
2. 漢字和英文混排、日文和英文混排、韓文和英文混排同時識別。
3. 漢字識別率最高。清華紫光文通TH-OCR經過"863"智能專家組對數十萬字的指標評測和中國軟件評測中心對產品的嚴格測試,識別正確率超過99.5%,代表了目前印刷體文字識別的最高水平。
4. 支持多種環境接口。清華紫光文通TH-OCR支持環境和GB、BIG5、GBK、JIS、 SHIFT-JIS和KSC等多種內碼,可以用于 NT和 98/2000/XP,適合全球各個地區使用。TH-OCR還具有自學習功能,不論什么生僻字,都可以通過鍵盤輸入進行學習,大大拓寬了OCR系統的識別 字符集。
5. 歷次國內鑒定均被中國科學院院土和中國工程院院土等專家組成的鑒定委員會評定為“具有世界領先水平”。
廣泛的社會認可:
1、 多年來為眾多著名的掃描儀廠商HP、、EPSON、CANON、 等提供TH-OCR普及版作為其掃描儀的捆綁軟件。
2、美國公司將TH-OCR作為東方文字識別捆綁到WINXP 操作系統中。
3、美國公司確定TH-OCR的部分技術使用權。
4、美國INTEL公司確定TH-OCR為最新的MMX技術支持項目。
5、《計算機世界》市場調查結果,清華紫光文通TH-OCR市場占有率達65%以上。
6、《中國計算機報》 組織的用戶調查認為, TH-OCR是一個性能極好的系統,是一個值得用戶信賴的系統(對其他品牌OCR評價為:“是值得用戶選擇的產品”)。
尚書7號OCR 文字識別系統完全版 .0
本軟件系統是應用OCR( )技術,為滿足書籍、報刊雜志、報
表票據、公文檔案等錄入需求而設計的軟件系統。目前,許多信息資料需要轉化成電子文檔以
便于各種應用及管理,但因信息數字化處理的方式落后,不但費時費力,而且資金耗費巨大,
造成了大量文檔資料的積壓,因此急需一種快速高效的軟件系統來滿足這種海量錄入需求。本
軟件系統正是適用于個人、小型圖書館、小型檔案館、小型企業進行大規模文檔輸入、圖書翻
印、大量資料電子化的軟件系統。
●識別字符
簡體字符集:國標-80的全部一、二級漢字6800多個。
純英文字符集。
簡繁字集:除了簡體漢字外,還可以混識臺灣繁體字5400多個以及香港繁體字和GBK漢字。
●識別字體種類
能識別宋體、仿宋、楷、黑、魏碑、隸書、圓體、行楷等一百多種字體,并支持多種字體混排
。
● 識別字號
初號 小六號字體。
●表格識別
可以自動判斷、拆分、識別和還原各種通用型印刷體表格。
●可支持繁體系統
首先,尚書七號開始將整個OCR的過程,明確化了,通過程序的菜單,我們就能夠知道整個OCR
的過程,主要分為:“文件”、“編輯”、“識別”、“輸出”等步驟。
在文件菜單中,您可以調用掃描儀,或者選擇將已經掃描好的圖像文件打開。得到圖像文件后
,用戶開始的工作,就是“編輯“菜單里面所提示的:圖像頁面的處理,其中包括圖像頁的傾
斜校正(提供自動和手動實現方法),旋轉等功能。
處理完畢后,就可以進入“識別過程”,該過程關鍵的是“版面分析”,現在尚書七號的自動
版面分析功能很強,面對報紙雜志等復雜情況的版面,也是分析的正確率很高。不再需要我們
在尚書六號里面那樣的建議手工劃識別范圍。也正是這點,大大降低了使用者的工作量。為了
方便,“識別”菜單下,也提供了用戶自己在自動版面分析后,通過修改識別范圍框的屬性,
來決定需要識別否的功能(默認的情況下,圖象屬性的欄目是不用識別的。當然,如果用戶還
是習慣原來尚書六號那樣,自己來設定識別區域,只要直接用鼠標劃框就可以了。接下來,用
戶就可以直接選擇“開始識別”的按鈕了,等待識別的結果。
賽酷OCR 網絡版
《賽酷OCR網 絡版》是賽酷科技推出的首款網絡OCR軟件,該系統以SAAS(軟件即服務)作為設計理念,集復雜版面分析、文字識別,表格識別,公式識別多項專有技術于 一體,充分滿足了政府公務員、企業經營管理人員、教師學生、科研人員、編輯記者等日常文檔錄入的需要,極大地提高了工作效率和質量。
《賽酷OCR網絡版》即時注冊、免費體驗。
特點:
OCR
ABBYY 是一家俄羅斯軟件公司,在文檔識別,數據捕獲和語言技術的開發中居世界領先地位。其獲獎產品 OCR 軟件可以把靜態紙文件和 PDF 文件轉換成可管理的電子數據,可以大大節省您的時間和精力。2005年12月22日,ABBYY 美國宣布,ABBYY 8.0 專業版被美國著名計算機雜志《PC 》授予4星。(以上摘自官方介紹)
ABBYY 是一款真正的專業OCR,它不僅支持多國文字,還支持彩色文件識別、自動保留原稿插圖和排版格式以及后臺批處理識別功能,能夠直接在 MS Word、MS Excel、 及 Word Pro 中掃描和讀取文件、信件或各類表格,并且能存成 RTF、TXT、DOC、CSV、XLS 或 HTML 等格式。它能保持表格與圖片中原始的多欄頁面設計。 在識別方面支持 ADF (自動進紙)掃描儀,批處理,拼音檢查,強大的表格工具,多語言文件,背景運算和學習新的字體。它也完全支持 TWAIN 掃描儀。。
ABBYY 8.0 主要功能:
1.出色的識別率和版面還原
ABBYY 8.0 提供出色的識別率和版面還原,即使面對讀取困難的或低品質的文檔也如此。 完美的獲取并且重建所有的格式化要素(包括分欄、表格、列表和圖象) –你無需重新打字或重新排版。
2.數碼相機 OCR : 可以將數碼相機列入到移動文檔捕獲設備里
現在您可以使用數碼相機獲取文件并將其轉換為可重用信息。 ABBYY 可以智能識別被拍攝的文檔并且應用 ABBYY 的新的識別技術以保證數碼相機圖象能得到最佳的OCR結果。 因為有數嗎相機OCR, 提供了廣泛的可能性來迅速獲取文檔并將其轉換成可編輯和可搜索的電子文件,即使在您忙個不停的時候。
使用數碼相機來 OCR,您能不受傳統掃描設備的限制。您能從大海報或從厚重、精裝的文檔,如書中獲取文本,而這類文檔是很難掃描的。另外,使用數碼相機獲取文檔是非常高效的,比掃描快幾倍。
3.準確、快速和安全的 PDF 轉換
ABBYY 8.0 是一個理想的 PDF 轉換工具。它在一個應用程序中提供三個不同的PDF轉換功能:
打開 PDF 文件并且轉換它成可編輯的格式(例如 Word 或 Excel)。
打開 PDF 文件,執行少量正文編輯,然后保存回 PDF。
從紙上文檔創建可搜索的 PDF 文件。
加密 PDF
ABBYY 遵照了最新的加密標準。用 ,您能創建加密的 PDF 文件,帶有用先進加密標準(AES)創建的最高 128 位加密。 也遵從訪問權限保護: 當打開一個 PDF 文件要轉換時, 會提示用戶在執行之前輸入密碼。
網絡發布 PDF 和標記 PDF
ABBYY 遵照了最新的加密標準。用 ,您能創建加密的 PDF 文件,帶有用先進加密標準(AES)創建的最高 128 位加密。 也遵從訪問權限保護: 當打開一個 PDF 文件要轉換時, 會提示用戶在執行之前輸入密碼。
4.用自動操作管理器進行一鍵 OCR
用新增的自動操作管理器,您可用鼠標的唯一單擊執行完全的轉換任務。ABBYY 內置了針對最普通的文檔處理流程的計劃任務,包括掃描(及 OCR)到 Word,掃描到 PDF,及 PDF 到 Word。
您也可以使用自動化向導來創建您自己的自定義任務。向導會引導您通過創建 新任務的步驟。任務可以在ABBYY 8.0 中使用命令和選項進行自定義和微調,因此您能迅速和容易地自動化甚至于最特別的任務。例如,您可以指定一個任務來掃描文檔,載入模板,進行OCR,然后保 存結果到 Word 和 PDF,并像原始圖象一樣,保存在不同的文件夾中。
自動任務可以容易地被導入和導出。一旦您創建了一些有用的自動任務,您可以將其導出為文件并與您的同事和朋友分享。
5.多語言識別
ABBYY 支持 179 種語言,包括英語、德語、法語、希臘語、西班牙語、意大利語、葡萄牙語、荷蘭語,瑞典語尚書文字識別系統完全版,芬蘭語,俄語,烏克蘭語,保加利亞語,捷克語,匈牙利語,波蘭 語、斯洛伐克語、馬來語,印度尼西亞語和其他。內置拼寫檢查可以支持其中36種語言。這為與各種各樣不同的國家(地區)和文化打交道的人簡化了文檔轉換過 程。
注意:不支持中、日、韓等語言
6.直接發送結果到 Word, Excel 和更多程序
當您轉換文檔來編輯時,ABBYY 8.0 可以直接地向您喜愛的應用導出結果,包括 Word、 Excel、 、Lotus Word Pro、Corel 、Sun 和 Adobe /。另外,識別的的文本可以被保存為各種各樣的文件格式,包括 PDF, HTML, Word XML、DOC、RTF、XLS、PPT、DBF、CSV、TXT 和 LIT。
7.為即時 OCR 附加的 ABBYY 實用程序
ABBYY 是一個易用的工具,可以讓您迅速獲取屏幕圖像并且允許您從屏幕進行“即時” OCR。它對摘取文本、表格或者瀏覽器頁面圖像、flash 介紹, “文件”菜單或者錯誤消息來說是很理想的。當您想要從 PDF 或圖像文件摘取小的節錄或文本中的幾個句子時, 也是一個理想的“快速 OCR”工具。作為對注冊用戶的獎勵,ABBYY 與 ABBYY 8.0 專業版同時發行。
8.與 Word 協同
您可以從 Word 內部啟動 ABBYY ,掃描紙質文檔并將識別結果置入您正在操作的文檔中而不用離開 Word。
當導出文件到 Word 2003 時, 自動地打開原文件的一張嵌入視圖,允許您同時編輯和查驗您的文檔,這就不需要在兩種應用程序之間切換。
9.所見即所得的文本編輯器
多分欄所見即所得文本編輯器允許您在編輯期間查看掃描文檔的完整版式,因此您可以在導出它之前迅速檢查文件。
10.帶有詞法支持的全文搜索
在 ABBYY 中創建的任何批處理文件都可以作為一個帶有全文搜索功能的小數據庫使用。您可以用所有語法形式搜索單詞。此功能支持有詞典支持的36種語言。
11.條型碼識別
ABBYY 也支持條型碼識別,包括 PDF-417 2D 條碼的識別。這對需要處理并索引很大數量的文檔為存檔的公司來說是很理想的功能。
12.圖像分割工具
圖像分割工具允許您分割圖像為幾個區域并保存各個區域為單獨頁面。此模式對識別書籍和 稿件是非常方便的。
13.易用性
ABBYY 8.0 有一個新的直觀的,友好的用戶界面來指引您通過 OCR 過程。 無論您對 OCR 是陌生的還是一個高級用戶,使用 8.0 工作都是簡單和容易的。
支持的部分語言列表:
帶有詞典支持的語言:
亞美尼亞語(東部,西部,) 保加利亞語 巴士克語 加泰羅尼亞語 克羅地亞語 捷克語
荷蘭語 (荷蘭和比利時) 英語 愛沙尼亞語 芬蘭語 法語 希臘語
德語 (新拼法和古拼法) 丹麥語 匈牙利語 意大利語 拉脫維亞語 立陶宛語
挪威語 (尼諾斯克語和博克馬爾語) 波蘭語 羅馬尼亞語 俄語 斯洛伐克語 西班牙語
葡萄牙語 (葡萄牙和巴西) 斯洛文尼亞語 瑞典語 韃靼語 土耳其語 烏克蘭語
人工語言:
世界語() 拉丁國際語() 伊多語(Ido) 西方語()
格式化語言:
Basic
C/C++
COBOL
JAVA
簡單化學公式(H2O, )