beta 1.09版
2009-6-23 Ioklim轉換
(以下黑字為國語(普通話),綠色字是閩南語佮白話字POJ)
本「台灣閩南語辭典」特別要感謝「台日大辭典」的林俊育長老,以及「台華線頂辭典」的楊允言老師熱心提供資料庫。
chit-ê「台灣閩南語辭典」尚要感謝ê是「台日大辭典」ê林俊育長老,佮「台華線頂辭典」ê楊允言老師真熱心ê提供資料庫。
★★請注意,要使用本辭典請先安裝Taigi Unicode字型(twu.ttf),不然,當中有一些字的顯示會有問題。
★★請注意,欲使用chit-ê辭典進前,請先安裝Taigi Unicode字型(twu.ttf),若無,內底ê一寡字會走精去。
一、正名與序言
閩南語又稱為河洛話,是指南福建,或福建之南通行之語。東南亞普遍稱為福建話,在台灣俗稱台灣話、台語。
閩南語又閣號做河洛話,一種通行佇南福建,或者是福建以南ê語言。東南亞普遍kā 伊稱做福建話,佇台灣定定予人叫做台灣話、台語。
但其實用「台語」來稱呼台灣人講的閩南語並不恰當,因為台灣人使用的母語包含了「台灣國語」、「閩南語」、「客家話」,以及n種「原住民語」。
但實際上用「台語」來稱呼台灣人講ê閩南語並無適當,因為台灣人teh用的母語有「台灣ê國語」、「閩南語」、「客家話」,以及各族ê「原住民話」。
但是用閩南語來稱呼這個辭典也不恰當,因為台灣的閩南語跟廈門、泉州、漳州、新加坡等地方講的閩南語因為地域的隔閡,融合的文化的不同等等,
但若是用閩南語來稱呼chit-ê辭典mā無好,因為台灣ê閩南語佮廈門、泉州、漳州、新加坡遮ê所在所講ê閩南語,因為隔siuⁿ遠,濫tioh摻tioh ê文化無仝,
已經形成不小的差異了。因此通行於台灣的閩南語,在語言的分類上通常用閩南語的分支「閩台片」來表示。
已經有bōe細ê無仝啊。所以佇台灣teh講ê閩南語,佇語言ê分類頂面,定定用閩南語ê分支「閩台片」來表示。
本辭典主要收錄台灣通行的閩南語詞彙,因此以「台灣閩南語辭典」來做為辭典的名稱。
chit本辭典主要是收錄佇台灣teh用ê閩南語詞彙,所以是用「台灣閩南語辭典」來做辭典ê名。
本「台灣閩南語辭典」共收錄有25萬多條的閩南語拼音和漢字詞條(如果扣掉索引詞條,還有將近13萬條),它的項目數是目前電子閩南語辭典之最。
chit-ê「台灣閩南語辭典」攏總收錄25萬外 ê閩南語拼音佮漢字詞條(若是扣掉索引詞條,iáu有將近13萬條),伊ê項目ê量是目前ê電子台語辭典內底上濟 ê。
資料的來源有三個資料庫:台語摘譯台日大辭典(網址:http://taigi.fhl.net/dict/)、台語華文線頂辭典(網址:http://203.64.42.21/iug/ungian/Soannteng/chil/Taihoa.asp)及Ioklim轉換
的「台漢漢台拼音字典」。
資料ê來源有三ê資料庫:台語摘譯台日大辭典(網址:http://taigi.fhl.net/dict/)、台語華文線頂辭典(網址:http://203.64.42.21/iug/ungian/Soannteng/chil/Taihoa.asp)參Ioklim轉換ê「台漢漢台拼音字典」。
二、拼音方式
原始資料裡面三個資料庫採用的拼音方式不太一樣,合成一本字典之後的拼音方式,主要是根據台日大辭典以及台華線頂辭典的數字拼音方式,再做一些修改。
原始資料內底三ê資料庫所用ê拼音方式無啥仝款,合做一ê字典了後ê拼音方式,主要是根據台日大辭典參台華線頂辭典ê數字拼音方式閣再做一寡調整。
原本台日大辭典裡面的數字拼音方式是將原本的白話字(POJ, 教會羅馬)拼音做些微修改,將調號改做數字調號,o͘改成ou,鼻音小ⁿ改成大寫的N。
原底台日大辭典內底ê數字拼音方式是對(ùi)原本ê白話字(POJ, 教會羅馬)拼音做
小許(sió-khóa)修改,將調號改做數字調號,o͘改做ou,鼻音小ⁿ改做大寫N。
但是為了要讓"N" 和 "n"在字典的排序上不同,因此本台語辭典將原本的 N改做nn(TLPA之方式)來做區別。
但是為著beh hō͘ "N" kap "n"在字典ê排列順序會tàng無仝,所以chit-ê台語辭典將原本ê N改做nn(TLPA之方式)來做區別。
以下是各拼音之間異同的簡單對照表。
下腳是chit幾種拼音彼此無相仝ê簡單對照表。
POJ | TLPA | 台羅(教育部) | 台日/台華 | 本辭典 |
ch/chh | c/ch | ts/tsh | ch/chh | ch/chh |
eng | ing | ing | eng | eng |
oa | ua | ua | oa | oa |
oe | ue | ue | oe | oe |
o͘ | oo | oo | ou | ou |
aⁿ(小n上標) | ann | ann | aN | ann |
調號á à ah â ā a̍h | a2 a3 ah a5 a7 ah8 | á à ah â ā a̍h | a2 a3 ah a5 a7 ah8 | a2 a3 ah a5 a7 ah8 |
另外,不同的資料庫常常會有相同的項目,尤其是「單一漢字」和「單一拼音」重複最多,但是裡面的資料卻是有不同的參考價值。
另外,無仝ê資料庫定定會有仝款ê項目,尤其是「單一漢字」佮「單一拼音」重複ê上濟,但是內底ê資料卻是有無仝ê參考價值。
所以為了區別不同的資料庫的「單一漢字」和「單一拼音」這些項目,凡是從「台漢漢台」來
的項目,後面都會打一個星號*;台日和台華的資料就沒有加。
所以為著beh分別無仝ê資料庫ê「單一漢字」佮「單一拼音」chia--ê項目,見若對「台漢漢台」來ê項目,後壁攏會加一ê星號*;台日佮台華ê資料就無加啥物佇後壁。
三、詞彙項目統計表
各資料庫項目數以及所佔比例可參考下面的表格:
逐ê資料庫ê項目量佮所佔ê比例請看下腳ê表:
資料庫 | 類別 | 項目數 | 百分比 |
台漢 | 漢字 | 13070 | 5.1% |
_ | 拼音 | 3009 | 1.2% |
台日+台華 | 詞條 | 98103 | 38.2% |
_ | 索引 | 127049 | 49.5% |
英文索引 | _ | 15693 | 6.1% |
攏總 | _ | 256924 | 100% |
四、版本差異
這個beta 1.09版跟去年發佈的1.07版主要修正幾個地方:
chit-ê beta 1.09版佮舊年彼ê 1.07版主要佇一寡不對ê所在有改進:
1. 修正「囝:kiann2」之前錯標成kinnn2的錯誤
修正「囝:kiann2」進前標做kinnn2 ê錯誤
2. 將台日及台華的同詞條合併
kā台日佮台華相仝ê詞條合合做伙
3. 將索引的條目全部加上漢字並列,增進查閱的效率。
將索引ê條目全部加上漢字排做伙,增加查chhōe ê 效率。









以下為主要辭典的壓縮檔,需要雙次解壓縮,也就是先將所有的檔案解壓縮到同一個目錄,然後再解壓縮一次。
附加壓縮檔: 200906/mobile01-f5f90a396274643e289e7a3cc56dd3df.zip
附加壓縮檔: 200906/mobile01-99c79f8214410c5cd1e565ae873b9814.zip
附加壓縮檔: 200906/mobile01-1fd38e2673ded76db3f74ea832ba9299.zip
附加壓縮檔: 200906/mobile01-71266acad2d455149e70d8d97cd587c8.zip
附加壓縮檔: 200906/mobile01-53de6e88ce5efe63de0dec3a08d008ff.zip
附加壓縮檔: 200906/mobile01-5d648dadc1cd9e28251f07d2dd006a65.zip
附加壓縮檔: 200906/mobile01-2006533af067f76dfd6af227a6ad09e0.zip
附加壓縮檔: 200906/mobile01-1bcc17882f5371ced8879b1b8d1dc7f7.zip
以下為字型檔:
附加壓縮檔: 200906/mobile01-985adde460ab1e3946c2568cf2e61405.zip