宅男工程師 wrote: 聽出有毛邊波形(THD+N)的 48kHz-16bit...(恕刪)
首先我們要定義什麼叫毛邊?有毛邊會造成什麼問題?怎麼測量毛邊?

上面KKBox這張圖,只是為了方便說明數位動態範圍弄出來的「示意圖」。但若真用它來思考類比波形,會很容易搞混一些觀念。在[ 卅一、動態範圍 ]中的第二段,有談過播放器材的動態範圍,參考 [Analog Device網頁 ] 的定義如下:

但這定義也許仍有點抽象,不容易有感覺。這次將嘗試用另一個方式解釋,試著讓大家「看到」這觀念。
要談毛邊前,先來問問自己,認為DAC的類比輸出端波形是長什麼樣呢?

如果您認為是上圖這樣,那您就錯了!

在[ 數位音樂的取名格式整理(仍待改善) 31樓 ]曾整理過怎麼將數位資料轉換成類比訊號,這裡簡要整理如下由 POMAD 及 wiki 中的圖整成一張,來說明教科書上的範例做法(實務上有更多不同做法):

中間步驟有點複雜,細節可參考前文連結。但只需要記住最後一個動作,就是:
使用低通濾波器
(最下圖右邊頻域藍色虛線,落在Fs/2處)
濾除超過取樣頻率一半的所有訊號。波形會變回光滑的原始類比樣貌。不論是48kHz或96kHz去還原同一個20kHz以下的波形,理論上都會一樣平滑沒有鋸齒。若您認為的毛邊就是鋸齒,簡單的回答:「並不是」。
Archimago 這篇有實際量測波形可參考,請看中間Filtered sine那欄:

那麼,究竟毛邊是什麼?

繼續來看bit數,會造成什麼影響。以下例子先從數位波形開始(還沒過類比低通濾波前):

橘色線是只用3個位元來表示此波形,可以看見綠色虛線就是與理想波形的差異。接下來過低通濾波器後,變成類比訊號:

橘色線會變得歪七扭八,無法緊貼理想波形。兩者相減得到綠色虛線,這就是因為bit數限制造成的noise。上圖是3 bits,若換成5 bits,造成的誤差如下:

可發現誤差變小了,來聽聽誤差(綠虛線)的聲音。
[ 3 bit ] [ 5 bit ]
這聲音就像是工廠機房大機器在作動,且這個聲音也會隨原本要發出的聲音相關。之前也試過三個實際樂曲受bit數的影響,再放上來一次供大家體驗:
[ 有效位元數差異wav檔下載 ]
可嘗試8-bit版本,影響會最明顯容易體會。
毛邊就是「quantization error」?
若談的是16bit相較24bit數有毛邊,我認為毛邊就是量化誤差(quantization error),會影響到的聽感就是誤差造成的底噪(在這裡先不討論其他例如jitter、非線性等等其他因素)。時域上就是上面提到的綠色虛線波形,轉到頻域如下,除了那個單一頻率的sin波之外,底下整片就是量化誤差的能量。

這就像是波形不受雜訊影響的範圍,從下面被吃掉了,可以這樣圖像化來理解動態範圍變小的概念。
還可看到在頻域上,會展開由低頻到高頻都有能量的雜訊,類似在訊號底部的背景雜訊。有了頻域這個觀察,就可由FFT計算出THD+N。特別針對是N(noise)這個成分,也就是「毛邊」是可量測的。
不過這仍是我對於毛邊的定義,不知道大家是如何定義「毛邊」這個聽感呢?

——— 16 bit到24 bit有意義?———
這個問題常常被提起,也已經在網路上有超過十年的探討了,最經典的是 [ Archimago Blogspot ] 這篇,他的結論是:「無法辨別差異」。
In a naturalistic survey of 140 respondents using high quality musical samples sourced from high-resolution 24/96 digital audio collected over 2 months, there was no evidence that 24-bit audio could be appreciably differentiated from the same music dithered down to 16-bits using a basic algorithm (Adobe Audition 3, flat triangular dither, 0.5 bits).
但其實我仍期待,過了這麼多年,也許音響、耳機技術更進步了,24bit音樂也更多了,會有不同的發現。若您有找到可辨別的曲子,我們可一起研究。或是在網路上有找到新的研究成果,請幫忙分享。

(補充:Archimago在2023年又再做了一次 Daft Punk Version,有興趣的朋友可參考看看)
——— 取樣率48k到96k、192k ———
首先,您提供的連結中這張圖不是類比波形:

內文提到越高sample rate越滑順,這是在數位看圖而產生的誤解。我一開始有提到DAC的工作原理,數位轉類比的最後一道是低通濾波拿掉Nyquist rate以上的訊號。階梯狀訊號在DAC類比輸出端會被平滑化,讓訊號變化程度落於1/2 sample rate頻寬以下。不應有階梯狀,若有必然是哪裡弄錯了(除非故意不處理好,例如NOS: none over sampling mode)。
其次是sample rate拉高,才能記錄、播放超過24kHz的頻率,目前能支持聽得到這麼高音的是[ ScienceDirect ]這篇論文,提到藉由直接刺激或是經由骨頭傳導到cochlea(耳蝸),人能感受到超音波。但目前我還沒找到單單經過空氣就能感受到的研究。
若超音波真的可經由空氣讓人感受到,現在96k以上,甚至到384k的音樂資源也越來越豐富,能有機會感受此差異一定很有趣。這也是為何最近會與ghleu大合作,實際來設計實驗,試著看看有沒機會感受到。當然目前這只是單一一個案例,並非代表全部。
聽感與檔位元數及取樣率的關聯,也是個有趣的題目,也很期待與大家一起來探索!












)
),就可以盡情把音量「催落去」了。





。但是差異並不大,兩者幾乎重疊就是了。










):

























)













。來吧!





。







方波最好、正弦波次之、鋸齒波最差。但有一點非常不同,模擬時方波與弦波並沒看到尖尖的突刺或凹陷,這是為什麼呢?




















































































