我也補充一下.....
如何精確的壓縮資料? 通常是把 "出現次數最多" 的東西用最少的空間表達.
假設一篇文章有
100個 "你"
10個 "我"
1個 "他"
那個假設要拿 0, 1, 2 分別代表 "你我他"......就會拿 2 來代表"他".
因為, 2 這個數字所佔用的 bit 數較多, 用2進位它是 10, 要2個bit
而0 或 1 可以只用 1 個 bit 來呈現. .....0 / 1, 拿來表達最多次的 "你" 和 "我"
0/1 --> 1 bit
2/3 --> 2 bit
4/5/6/7 --> 3 bit
所以如果文章中, 不同的文字越多(越亂), 那麼就要使用佔3-bit空間的 4/5/6/7 來表達了...
所以越亂的時候, 壓縮效果越差.
而以前工數交的傅立葉轉換, 可以算出 "頻率", 也就是出現的 "次數"....
算出頻率後, 就可以決定, 用最少的空間來呈現出這些資料....
所以相信前面人說的那個程式, 因該就是有解晰過資料, 利用某種裙帶關係找出可以歸納的 "頻率".
然後對此做壓縮, 就能得到最高的壓縮比.
兔貴肇朋:本人所發表和回應的文章,都是晚消化,本人不對其導致的結果承擔任何責任.