請教辨識率高的OCR軟體

由於辦公室最近想買文件辨識用的OCR軟體
但是因為周遭沒人有使用過的經驗提供
所以想上網請教推薦軟體或實際使用者評價

使用需求:

1.紙本掃描後的PDF或JPG轉文字(中英文為主,偶有日文)
2.掃描檔可以自有選擇轉換格式(例如純excel之數據表格轉換後還是能轉成excel)
3.辨識度高,不需要安排人手重新校到死...
4.保持原有格式比例高,避免從重新排版問題

目前在線上購物網上找到

1.omnipage 17 標準商業版 (5300)
2.ABBYY Finreader 10 一年授權板 (2999)
3.Readiris 12 asian (??)
4.丹青文件辨識系統5(下載版)(5500)

敬請版上高手不吝提點
2011-05-25 15:56 發佈
提供您一些建議,版主所提,除了1.omnipage 17 標準商業版沒有用過外,其餘都測試過

1 - 如果是純檔案轉成的pdf,例如word 或 excel,建議找破解軟體轉成可編輯狀態,這樣比較快,格式 也不會跑掉,內容也正確

另就pdf 圖片檔 (jpg、tif等等)識別 ,ABBYY Finreader及Readiris 12 asian都可以做得到,也都滿強的,前提是解析度都需再300dpi以上,如果是相片檔至少都要75dpi 或是300萬畫素以上才會容易成功。


2 - 表格辨識方面,要看內容,都容易誤判,測試過後覺得abby比較穩,至少清楚的pdf轉成word還算可以
但是不要抱持太大期望,丹青測試過一次就放棄了,格式會跑掉~試過5 6 兩個版本都一樣。

在測試複雜字串時,例如編號,G12FCD5,1的部分都會被辨識為L小寫,在測試Readiris 12 asian時較為明顯,丹青已經放棄。


3 - 辨識率高不用重新編排
丹青可以排到近似的形狀,但是斷行處與文章所列不符,如果多一個空白或是 ENTER就會全部跑掉
Readiris 12 asian兩套都滿強的,印象中eadiris 12 asian有針對圖文類的文章進行選擇,但依樣有段行的問題。
ABBYY Finreader忘記測試結果,印象中還不錯。

4 - 保持原格式建議是ABBYY Finreader及Readiris 12 asian兩套測試看看。

以上
---------------------------------------------------------------------------------

純英文字ABBYY Finreader及Readiris 12 asian兩者都很強(至少測試時是這樣),但如果要有表格又有文章等,印象中表格會變成圖片,要再另外選擇告訴她是表格。

不過成功率不高就是了,另外Readiris PEN也測試過,當初測試感覺並不好,錯字超多(可能是我公文太髒了)

---------------------------------------------------------------------------------

感覺起來比較像是研究室懶得抄文章的做法,不像是公司的作法

版主應該要想的是,

你要
1.辨識的是什麼東西??
2.辨識後的資料重複利用率高嗎?? 不行就掃描圖片貼上就好~~
3.你有要建檔嗎??
4.你的資料是圖文並存嗎??
5.要件資料庫嗎??

如果以上都不是...............

自己的文件都是複合式的 中文+英文+阿拉伯文(數字)+符號,重複性高的,建議自己打
或是用Readiris 12 asian這一套

但是也別抱太大的期望,有公司網站應該有測試版可以用~~~
http://www.irislink.com/c11-865-41/Downloads---I-R-I-S--demo-products-available-in-download-.aspx


以上

潛水中
Readiris 12 asian 印象中要 20000台幣

建議找掃描器有附的,印象中 hp的有
潛水中
感謝您的詳盡說明!!!
我會上官網查看是否能下試用版本來看看

因為我們常常要做資料彙整重新排版工作,可惜很多時候只接到各單位的紙本(大夥常忘了丟電子檔來)
所以才考慮用文件辨識軟體來補足重新打字工作...

文件內容主要還是以文字為主,最多穿插數字表格
要不就是excel的統計表
掃pdf維持在300dpi以上應該不是問題
所以只要好排好掃辨識高
就達成我的期待值了!!!!

綜觀您的說明,看來好像Readiris 12 asian會是不錯的選擇
不過20張小朋友的價錢....不太確定提上去會不會被退件
加上辦公室裡的掃描器已經買很久了(可惜非hp)
更加買不逢時

因為現階段在線上購物網看到的omnipage價格還不錯
不曉得這套軟體是否也會有使用者能分享實際操作體驗
如果你們是用office 企業版的,應該就有內附辨識軟體,測試過.....尚可

如果經費有限可以考慮

潛水中
剛剛查了一下,亞洲版的 7000有找

台灣有經銷商可以測試,你們可以帶自己的檔案或資料過去測試
潛水中
omnipage 早期版本用過,辨識英文頗神,中文就...
丹青..坦白說,牌子老牌子大卻沒什麼保證,從此沒信心,
以前還有套漢王,比丹青好多了。

至於不用校稿校到死這一點,校死要挑,但是說完全不校,難了。
感謝a大的建議
因為這陣子手邊事太忙,所以沒能上來再向您超具體的解說道聲謝
尤其是在還沒買軟體的時候,看到office也能用的提醒
讓我至少渡過這次的難關
(雖然校字排板重刷了不少,中間還加上一度完稿後檔案消失的慘劇...)

另外也感謝K大的提醒
如果omnipage中文辨識度也不太優的話....
剩下的選擇也不多了

看來

Readiris 12 asian

我請購單上的標的

就‧是‧你‧啦

再次感謝大家的經驗分享呦~~

a8552065 wrote:
提供您一些建議,版...(恕刪)

關於 丹青 和 ABBYY FineReader 和 Readiris 12 asian ocr 辨識軟體 的解說 很詳細
感謝網友提供 的 意見
Line的圖片轉文字OCR太強了
完全把Abbyy打得不堪一擊!!

基本上是變成
兩種檔次的中文OCR辨識軟體
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?