我這邊有一份藏文的PDF檔 這幾天我試了很多方法都沒辦法成功的把他轉成Word(變成亂碼)
請問有神人大大可以幫我把這份文件轉成Word檔嗎??
附加壓縮檔: 201303/mobile01-869b6507717b6214b486601c7cb27b8f.zip
揮揮手 wrote:
我這邊有一份藏文的P...(恕刪)
這是延續前一篇的嗎

我有稍微試過,不過似乎沒什麼快速的方法
我想可能是編碼的關係吧,可能是原本在轉PDF時,字型沒完整嵌入,只嵌入了有用到的字

也許可行的方法...(當然,你電腦裡要有藏文字型,不然成功轉出來你看起來也不會是藏文)
1.如前一篇所提,PDF轉圖片,圖片再用OCR軟體辨識。
2.如果你給的檔案不是節錄的話(全文就5頁),自己手打一次。

3.搞清楚[嵌入在PDF裡的字型]和[原Tibetan ModernA字型(或藏文Unicode字型)]的對應關係
例如,你給的PDF頭2個字
轉換後看似亂碼的前2個字是!!,但實際上在Tibetan ModernA字型要打出那頭2個字是要打@@,也就是說!要替換成@,搞清楚這些關係後寫個程式做替換,替換後就是正常的咯。4.等懂PDF的人出現,因為我有轉到一個很像的檔,不過有些漏字錯字和...母音(..嗎?)亂標,所以我想也是有可能完美的轉回Word。
(這是第2行)
內文搜尋


























































































