• 2

求助PDF內容複製變亂碼問題


lily4383 wrote:
不太懂大大的意思
是...(恕刪)

本來想法是安裝pdf檔有用到的字型,這樣就能轉成一般文字,但你的pdf字型太多非windows內建,有DFKAISHU華康.jenlei demi文鼎,還有educ自建的字元,因此這個方法恐怕行不通.看其他大大是否有其他更快的方法..
真懷疑這個PDF是在什麼系統下做出來的

可以正常複製的部份,複製出來的"人"字unicode碼正確(4EBA)
不能正常複製的部份,複製出來的"人"字unicode碼錯誤(DBC0),這個字碼是顯示空白的....

剛剛把我知道的方法都試了一次,除了樓上的方法之外,只有一種方法能把字搞出來,就是.....最笨的方法,轉成圖片輸出,再OCR回PDF

不過稍微比對一下發現錯字蠻多的
或許圖片畫質高一點結果會比較好吧

壹、致股東報告書
一、前一年度營業結呆
(一)營業計畫實施成果
回顧由美國次級房貸風暴所引發的全球金融大海嘯,在各國政府大規模金融好困方案下進漸平息,再加上各國財政及貨幣政策等多管齊下後,支撐需求並降低金融市場的不確定性及系統風險,全球主要國家經濟衰退已見減緩,正緩步回溫中。而在市場狀況尚未完全回穩的狀況下,透過本公司優異的經營團隊其對外在環境變化的敏銳洞察力,適時調整經營策略,並在全體同仁努力深耕經營下,使九十八年度經營成呆展現了豐碩成就:
1.係費收入:三四、三五二、三三五仟元。
2.營業收入:七九、四一六、七九二仟元。
3.營業毛利:七、二六二、二七四仟元。

(二)預算執行情形:不適用。
(三)財務收支及獲利能力分析
1.稅後淨利:四、五七五、一 -0仟元。
2.基本每股盈餘:七﹒三八元。
3.資產總額:二九一、五八九、二六三仟元,較九十七年度增加四二、二九。、 0五九仟元,成長一六﹒九六%。

(四)研究發展狀況
本公司九十九年在商品開發及推動上,將配合持續降低責任準備金季息策略,推動終身壽險、長年期分期繳及傷害險與健康險 (A&H)商品,並因應民眾需求,開發保本型傷害險與健康險 (A&H)商品並加強附約商品組合包裝;在新業務及特定族群商品上,預計開發兒童保單及國內突發疾病保險;在因應
滿期金回流商品之策略上,預計推出悠活人生、利變萬能險及結構債商品;配合九十九年景氣逐漸回升,投資型商品業績將其成長空間,將強化投資型商品的創新及研發,推出全權委託商品、外幣投資型保單及保證給付投資型商品。
本公司仍將持續關注市場之變化,藉由靈活、具有創意的商品策略,提升公司之營運績效。
在 google PDF 轉文字的時候,剛好查到這篇,分享我的解法,文字辨識正確率蠻好的
👉Line 的 OCR 文字辨識功能 https://mrmad.com.tw/line-ocr
 
不過如果樓主的頁數非常多的話,可能只能一頁一頁截圖辨識了
  • 2
內文搜尋
X
評分
評分
複製連結
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?