藏文 PDF轉Word

揮揮手
個人積分：1分
文章編號：42612076

1分

樓主

2013-03-24 13:26

我這邊有一份藏文的PDF檔這幾天我試了很多方法都沒辦法成功的把他轉成Word(變成亂碼)
請問有神人大大可以幫我把這份文件轉成Word檔嗎??

附加壓縮檔: 201303/mobile01-869b6507717b6214b486601c7cb27b8f.zip

2013-03-24 13:26 發佈

文章關鍵字藏文 PDF word

nsps5606

nsps5606
個人積分：489分
文章編號：42624883

489分

2樓

2013-03-25 1:43

揮揮手 wrote:
我這邊有一份藏文的P...(恕刪)

這是延續前一篇的嗎

我有稍微試過，不過似乎沒什麼快速的方法
我想可能是編碼的關係吧，可能是原本在轉PDF時，字型沒完整嵌入，只嵌入了有用到的字

也許可行的方法...(當然，你電腦裡要有藏文字型，不然成功轉出來你看起來也不會是藏文)
1.如前一篇所提，PDF轉圖片，圖片再用OCR軟體辨識。
2.如果你給的檔案不是節錄的話(全文就5頁)，自己手打一次。

3.搞清楚[嵌入在PDF裡的字型]和[原Tibetan ModernA字型(或藏文Unicode字型)]的對應關係
例如，你給的PDF頭2個字

轉換後看似亂碼的前2個字是!!，但實際上在Tibetan ModernA字型要打出那頭2個字是要打@@，也就是說!要替換成@，搞清楚這些關係後寫個程式做替換，替換後就是正常的咯。
4.等懂PDF的人出現，因為我有轉到一個很像的檔，不過有些漏字錯字和...母音(..嗎?)亂標，所以我想也是有可能完美的轉回Word。

(這是第2行)