由於辦公室最近想買文件辨識用的OCR軟體
但是因為周遭沒人有使用過的經驗提供
所以想上網請教推薦軟體或實際使用者評價
使用需求:
1.紙本掃描後的PDF或JPG轉文字(中英文為主,偶有日文)
2.掃描檔可以自有選擇轉換格式(例如純excel之數據表格轉換後還是能轉成excel)
3.辨識度高,不需要安排人手重新校到死...
4.保持原有格式比例高,避免從重新排版問題
目前在線上購物網上找到
1.omnipage 17 標準商業版 (5300)
2.ABBYY Finreader 10 一年授權板 (2999)
3.Readiris 12 asian (??)
4.丹青文件辨識系統5(下載版)(5500)
敬請版上高手不吝提點
1 - 如果是純檔案轉成的pdf,例如word 或 excel,建議找破解軟體轉成可編輯狀態,這樣比較快,格式 也不會跑掉,內容也正確
另就pdf 圖片檔 (jpg、tif等等)識別 ,ABBYY Finreader及Readiris 12 asian都可以做得到,也都滿強的,前提是解析度都需再300dpi以上,如果是相片檔至少都要75dpi 或是300萬畫素以上才會容易成功。
2 - 表格辨識方面,要看內容,都容易誤判,測試過後覺得abby比較穩,至少清楚的pdf轉成word還算可以
但是不要抱持太大期望,丹青測試過一次就放棄了,格式會跑掉~試過5 6 兩個版本都一樣。
在測試複雜字串時,例如編號,G12FCD5,1的部分都會被辨識為L小寫,在測試Readiris 12 asian時較為明顯,丹青已經放棄。
3 - 辨識率高不用重新編排
丹青可以排到近似的形狀,但是斷行處與文章所列不符,如果多一個空白或是 ENTER就會全部跑掉
Readiris 12 asian兩套都滿強的,印象中eadiris 12 asian有針對圖文類的文章進行選擇,但依樣有段行的問題。
ABBYY Finreader忘記測試結果,印象中還不錯。
4 - 保持原格式建議是ABBYY Finreader及Readiris 12 asian兩套測試看看。
以上
---------------------------------------------------------------------------------
純英文字ABBYY Finreader及Readiris 12 asian兩者都很強(至少測試時是這樣),但如果要有表格又有文章等,印象中表格會變成圖片,要再另外選擇告訴她是表格。
不過成功率不高就是了,另外Readiris PEN也測試過,當初測試感覺並不好,錯字超多(可能是我公文太髒了)
---------------------------------------------------------------------------------
感覺起來比較像是研究室懶得抄文章的做法,不像是公司的作法
版主應該要想的是,
你要
1.辨識的是什麼東西??
2.辨識後的資料重複利用率高嗎?? 不行就掃描圖片貼上就好~~
3.你有要建檔嗎??
4.你的資料是圖文並存嗎??
5.要件資料庫嗎??
如果以上都不是...............
自己的文件都是複合式的 中文+英文+阿拉伯文(數字)+符號,重複性高的,建議自己打
或是用Readiris 12 asian這一套
但是也別抱太大的期望,有公司網站應該有測試版可以用~~~
http://www.irislink.com/c11-865-41/Downloads---I-R-I-S--demo-products-available-in-download-.aspx
以上
潛水中

我會上官網查看是否能下試用版本來看看
因為我們常常要做資料彙整重新排版工作,可惜很多時候只接到各單位的紙本(大夥常忘了丟電子檔來)
所以才考慮用文件辨識軟體來補足重新打字工作...

文件內容主要還是以文字為主,最多穿插數字表格
要不就是excel的統計表
掃pdf維持在300dpi以上應該不是問題
所以只要好排好掃辨識高
就達成我的期待值了!!!!
綜觀您的說明,看來好像Readiris 12 asian會是不錯的選擇
不過20張小朋友的價錢....不太確定提上去會不會被退件
加上辦公室裡的掃描器已經買很久了(可惜非hp)
更加買不逢時

因為現階段在線上購物網看到的omnipage價格還不錯
不曉得這套軟體是否也會有使用者能分享實際操作體驗

內文搜尋

X