• 18

(卌七、瞬間電流⑦ - 電源波形實驗)製作特性差異音訊、體驗聽感

廿七、DRC - 殘響消除

什麼是殘響(reverb)? 在空間中多次反射,才到耳朵的聲音。而room mode通常指的就是殘響低頻的部分。

處理殘響最暴力方式是計算反函數。在時域上極為困難,但在頻域上雖然還是不容易,但相較下比較有機會

——— 反函數基本原理 ———

先回到頻率響應的本質說起,在[十五、傳輸線實驗]曾聊到過聲音有類似向量的特性存在。於[十九、頻率響應&脈衝響應]中,直接看到頻率響應其實就是以複數(向量)形式表示,能與時域脈衝響應互換。

以下舉最簡單、單一個向量為例。真實的頻率響應,只是以下例子擴展為成千上萬個向量組成,可用一樣的觀念類推。

左圖是房間的頻率響應的某個頻點。由A相量,轉了45度,長度乘0.6倍,變成B相量。角度旋轉跟長度改變,即代表該頻率點的響應。(若只計算長度改變倍率,並以log方式呈現,就是大家常說的以dB來算的頻率響應。)

若是希望頻率響應不是B,而是B’,要如何計算出DSP要使用什麼脈衝響應(也就是FIR filter,或convolution filter),才能由A變成B’ ?

先由原本量測到已知的A到B為45度、0.6倍,將B’倒推回A’ (轉-90度,除以0.6倍)。

A’到B’是這個空間(含器材、喇叭)的頻率響應。由A到A’ (轉75度,1.2倍)就是DSP所需達成的頻率響應。再經反向FFT運算,就可得到DSP要用的脈衝響應檔了。

就這樣這麼簡單嗎?請接著看下面這個例子~

——— 縮短殘響 ———

將上述方法用在縮短殘響,不需考慮有無規律、也不管是什麼造成,就直接暴力解。

可看到上圖殘響由原本600ms~900ms,直接全頻段20~20kHz縮短到400~450ms。

下圖放大20~300Hz區看瀑布圖:

可看到直接針對拖尾砍短,甚至沒動到原本的高峰/凹陷。乾淨俐落、完全不拖泥帶水。

這樣如同開外掛的究極召喚術存在,哪管什麼大魔王,直接一擊搞定!?

哈哈 畢竟不是一拳超人漫畫,這招發動條件嚴格不說,還會因種種限制效果大打折扣,甚至暴走變成災難。

——— 分解步驟 ———

若想去除拖尾,可將頻率響應先換為脈衝響應。將對應時間區段中,把拖尾所在對應頻率成分去掉,如下圖為例:

然後再用FFT轉回頻域,將修過的響應稱為B’。如同前面原理所述步驟,利用量到的頻率響應(A—>B),反向倒推由B’到A’。則A到A’ 就是DSP所需達成的頻率響應。轉成脈衝響應如下:


這裡就是問題所在!放進convolution filter計算,聽聽看這災難性的結果:

Guitar ]
大約在12秒左右,吉他擦弦聲後有明顯不自然高音金屬起振聲。

為何頻率響應看起來很棒,卻是個災難? 原因是「FFT會將時域視為環形頭尾連接」,更動頻域向量角度,就類似移動時域波形。若移動超過邊界,就會從另一頭折回來。所以會看到上圖脈衝響應檔的尾巴,反而有很大的能量。

這樣的脈衝響應,在數學上的確完成我們所交辦的任務。但對時間軸上連續流動的音樂,卻不適用。

此外還有一個陷阱~

——— 瀑布圖的陷阱 ———

將上述脈衝響應後處理處理平滑化(如下圖),此方法亦非正解,只是為了方便說明:

使用此脈衝響應做DRC,同樣會達成殘響縮短到約400ms的效果,但是⋯⋯

「拖尾其實沒有完全消失,只是轉換成了漣漪!」

將前面瀑布圖的底部向下多看60dB,並拉長觀察時間到5秒。看起來變短的殘響,被轉換成拖長的漣漪。聽起來還是很糟

DSP處理後
DSP處理前

魔鬼藏在細節裡,使用瀑布圖時會有一些陷阱。改變觀察參數,例如降低最低刻度、時間拉更長等等,就露出馬腳了。

雖然此例旨在說明陷阱,但也同時提示了一個可能的解法。若造成的拖尾能量遠遠低於音樂訊號,也許就聽感而言還真可忽略。況且也不是每個拖尾縮短後都會變成漣漪,就可取捨找出可用適合的調整方式。

—— 處理上一篇EQ後殘留的尾巴 ——

有了以上暴走的經驗後,學到了不能過於仰賴數學暴力解。仍要顧及現實狀況修正算法,因應不同狀況,選擇各種不同調整策略。

來處理一下上一篇殘留的拖尾,也同時滿足我的好奇心:「究竟拖尾縮短對聽感的影響為何?」


使用向量反函數運算,在小心調整後,原本500~800ms的拖尾,都能收到350ms左右。除了57Hz這個點,雖已有改善,但仍看的到淺淺的拖尾。

要補充一點,我這裡所說的拖尾(包括瀑布圖的拖尾),還沒對它做嚴謹的數學/物理定義,只是口語上容易說明。看不同分析報告時,要特別注意右邊的長條刻度(以此圖為例是70~120),除此外還有很多設定上的細節。若想以此圖來評比DRC算法能力,需要小心解讀以免誤解或被誤導。

瀑布圖細看57Hz處,下圖下方利用疊影,方便看出效果:

57Hz雖然長度沒變短,但是能量仍可得到抑制。可見只要不過於激進暴力硬修,是有機會既拿到好處、又避免漣漪產生的。

來聽聽看效果如何吧!
Guitar ] [ Jazz ] [ Piano ]
wav檔下載 ]

前一篇中以Jazz較能分辨出有無EQ,以這首來仔細聽縮短殘響的效果,,以我的聽力完全分辨不出來與只用EQ的差異。也許是真的人耳的確對此不敏感,或也可能是曲目的原因,無法凸顯其差異。

最後回頭再看看頻率響應有何變化:(謝謝宅男工程師提醒,補充說明各條線是故意錯開好閱讀,原本是完全疊在一起的,下圖中左邊的SPL絕對值沒有意義)

很有趣的是拖尾變短,會將頻率響應比較起起伏伏的地方平滑化,變得沒那麼尖銳。頻率響應凸點與時域上殘響拖尾,有著奇妙的互伴關聯性。這現象說來就話長、離題了,之後再來整理一下,音訊怎麼會跟量子力學、測不準原理扯上關係

(上圖取自《我們的生活比你想的還物理》,2022 年 11 月,商周出版,網頁連結:泛科學)

——— 感想 ———

越強力的武器,越要小心使用。否則很容易未蒙其利、先受其害。直接修改頻率響應向量就是如此。

而大家常用的各種EQ,就像是修煉已久的招式,對於向量的改變及最終時域的影響,早已瞭然於胸,出招前就已經知道結果如何了。

很可惜沒能感受到拖尾變短對聽感的影響,但也發現了時域拖尾與頻域凸起,像是奇妙不可分割的一體兩面。

目前只做了個小小的嘗試,對高頻區殘響也尚沒有頭緒,相信仍有很大可玩的空間,還待慢慢發掘。
goldbingo
goldbingo 樓主

宅男工程師 聲壓沒變,只是為了避免疊在一起不好閱讀及說明,讓每條線平行向下位移錯開。這是REW中的overlays/separate功能,很好用喔[微笑]。

2025-01-31 22:39
goldbingo
goldbingo 樓主

宅男工程師 謝謝您的提醒,有在文章中增加說明了。[謝謝]

2025-02-01 12:01
廿八、傅立葉轉換與頻譜圖

數位訊號處理本身,其實也是相當好玩,這篇暫時沒有要造差異音檔來聽,先回頭聊聊分析工具。

頻譜圖(Spectrogram)及瀑布圖(Waterfall),常在許多分析中使用,先從頻譜圖說起,要談怎麼畫出來,就要先了解傅立葉轉換是什麼?

以下這個影片非常推薦!是我看過最棒的圖像化說明,直接抓到公式背後物理意義。片長約20分鐘,不論是否具工程數學背景,希望看了都會覺得津津有味


影片結尾,會稍微點到前一篇提到過,跟量子力學有非常相似的特質。這題之後再聊,先回來談頻譜圖如何畫出來的。

我自己製作的影片就沒有上面那部這麼生動了,希望還能對沒接觸過的朋友有點幫助。知道這常用的圖是怎麼畫出來的,也知道其應用限制是什麼。

舉以下例子來說,以三個頻率10Hz、20Hz、22Hz組成的波形:

將上面所形容的動作,做成動畫影片,會比較容易了解。


將算出來的FFT spectrum(頻譜),依不同高度,給它一個顏色。然後隨著window框框移動的時間,將對應頻率的顏色畫在時間線上:

做成動畫影片如下:

不論是時間軸向上或向右,都可稱之為spectrogram(頻譜圖),視分析視覺方便選擇方向。

產生的頻譜圖,為何看起來會有明顯的條紋?下圖右借用Siemens的投影片:

這是因為用方框window切下來的波形,在進行FFT運算時,是視為頭尾相連的重複波形。 相接的不連續處,就會在FFT後看到寬頻雜訊能量,這並不是原始波形有問題。

用方框切段落會有此問題,因此要將邊緣做平滑處理,來減輕此困擾。一樣借用Simens的投影片:

效果就會如下影片,頻譜圖乾淨好讀多了。

(看著FFT跳動起伏的樣子,還真療癒。)

window形狀有許多選擇,方方的沒平滑化的,常稱為boxcar(鐵路棚車,很傳神)。

其他還有Hann, Gaussian 等等。這些在時域的window對頻域的影響,都已經有相當完整明確的研究。

(取自scipy網頁上方是時域window,下方為頻域響應)

使用頻譜圖時,若能對其使用的window函數有概念,會比較能推想看到的是真實訊號,還是因爲window所造成的不理想性。

——— window寬度、FFT點數 ———

Window寬度,以48kHz sample rate來看,1秒的寬度相當於48000個點。而FFT是以點來計算,所以也常用FFT點數來當單位。例如2048點,8192點(常用2的冪次,因為容易快速計算)。而sample rate跟FFT點數,就決定了wine寬度與FFT頻域精細度。

先看以下影片範例,幾個觀察重點處:
1. 20Hz與22Hz是否明顯可辨
2. 20~25秒20Hz有兩個短音,是否在右下角的頻譜圖可以分辨
3. FFT頻譜(圖第二列),其精度反映在點與點的間距


小window特性:

大window特性:

還有一個常常會搞迷糊的地方,sample rate拉高會讓FFT頻域精細變高或變低?

若是維持window寬度固定,sample rate加倍,等同FFT點數也加倍。但因同時頻寬也加倍,頻寬除以點數等於精細度不變。

但若維持FFT點數不變,sample rate加倍,就等效於是window變一半,精細度反而下降。

一口氣說了一堆,發現很佩服那些做科普節目的人,他們真的很不簡單。希望這篇沒讓大家昏了頭,看完反而更混亂了
廿九、脈衝響應頻譜圖與瀑布圖

首先非常謝謝JohnTitor的提醒,在看脈衝響應頻譜圖及瀑布圖時,有一些要注意的地方。也來分享在過程中,這一路學習到的一些眉眉角角。

——— 脈衝響應頻譜圖 ———

脈衝響應在[ 十九、頻率響應&脈衝響應 ]已經談過定義,此處主要來說說脈衝響應的頻譜圖。

其頻譜圖以REW程式為範例:

這裡的Mode選的就是傅立葉轉換,window使用Gaussian,時域稍較窄而尖。但頻域上它側邊露出去的能量較少,但是相對中心頻較胖。也就是稍稍犧牲了些頻率解析度,來換側邊的低雜訊以及時域上的精細度。第三欄是window寬度500ms。

Window type的影響:

Hann較細長,Gaussian較胖短。需要時間精度的話,選Gaussian較有優勢。

Window寬度的影響,以下舉兩種寬度為例:

Window變寬到1000ms後頻率精度提高可以想像,但為何window變窄為250ms,會有黑色洞洞,看起來還有點規律性?

結果還是因為FFT的天性,洞洞是臨近兩個頻率相互影響造成的。當window變寬,兩個頻率FFT後明顯拉開後,就不會有這怪怪的樣子。

接下來是調整顏色,其中最關鍵的值,我覺得是Scale Bottom。

預設值是自動計算為最大值減40dB。比bottom值小的部分都看不到!這拿來過濾掉雜訊不看很有用,但若拿來不同錄音比較,就得關掉自動調節(Match top scale to peak),固定設定下比較方便比較。

以拖尾長度為例,看看這設定對判讀影響有多大。


對於聽感,尚不知道有沒有一個貼近人類感知的標準Bottom/Window寬度設定方式?目前我都是設為固定值後,拿它來當相對性比較工具。

——— 瀑布圖 ———

之前只簡化說瀑布圖是頻譜圖3D化畫出來,事實上於REW中,並不只是這樣。頻譜圖只用單一種window,但瀑布圖的window左邊與右邊window函數及window寬度是分開設定的。如下圖:


為何要分左邊跟右邊呢? REW的Waterfall Graph官方說明網頁有非常詳細的說明。

左邊窄而陡的目的是讓時間軸上的解析度提高,右邊長而緩則是控制頻率軸上的解析度。特別針對脈衝響應會漸弱的特性,巧妙的利用window左右取得各自的好處。

瀑布圖一個重要的設定是SPL Bottom:

這個值決定了瀑布的海平面,如下虛線匡起來的地方,低於這個值就不會畫出來。

在比較不同的量測結果,這些設定除了需要確認相同,也要變化不同值看看,有沒有解讀還沒考慮到的地方。

上圖中170Hz有看到怪怪的形狀,放大如下:

這樣抖抖抖,不就不只造成尾音拖,還會抖動了嗎?

這還是FFT window下的產物,回頭看頻譜圖:

這次用黑白深淺當高度,且打開REW的3D視覺效果。用此方式很清楚看到,左圖跟瀑布圖看到的一樣,有一邊凹凸一邊下降的趨勢。將FFT window改為1000ms,如右圖,凹洞就消失了。且凹洞週期,正就是這兩個相近頻率的差值。

回顧更早在網路線差異分享 114髏,曾提到的Beat Note的圖:

兩個很接近的頻率,時域上的確會產生抖動的現象。在頻譜圖上window短,就會看到跟時域上一樣的現象。但若window夠長,則看到的是兩個頻率,反而看不到抖動情形。

較近期,還記得在 [ 廿一、反射音消除實戰 ] 出現過的這張圖嗎?

那時嘗試解讀左下角虛線圈圈的凹陷處,分別在約50Hz左右、100出頭Hz。其實圖上到處也都是洞洞。那時沒搞懂為什麼,經過這麼一段時間學習後,現在才稍微明白,很可能還是FFT短window下所看到的相近頻率的相互影響。跟comb filter的洞洞不一定有關係。

哈哈,沒想到之前也曾經這麼不懂,不經一事、不長一智。

——— 感想 ———

頻譜圖或瀑布圖,在分析脈衝響應都很方便。在使用時若看到奇怪的形狀,利用調整FFT window以及對FFT的特性,可以幫助澄清及判讀使否是假象。剩下來的,就是你我的觀察力與想像力了。
三十、音響與量子力學

為了要分開頻域上兩個接近的頻率,得靠調寬FFT window寬度,來得到較高的頻域解析度。但調寬後,在時域反而兩個音就黏在一起,看不到細節。如此就變成了兩難的局面。

「時域細節與頻域細節無法兼顧。想看到時域細節,就看不到頻域細節。看清楚了頻域細節,又讓時域模糊掉了。」

這跟下列海森堡不確定性原理的敘述,根本是一個模子刻出來的:

「粒子的位置與動量不可同時被確定,位置的不確定性越小,則動量的不確定性越大,反之亦然。」(取自Wiki)

一般常將不確定性原理(uncertainty principle)稱為“測”不準原理。但我比較喜歡「不確定性原理」這個說法,因為所談的核心觀念,是波粒二象性物理的本質。

以下這個頻道接續上上回,解釋傅立葉轉換的下集如下,這集影片比起上集,又更深入而節奏緊湊,也非常值得一看!

這次在之前的基礎下,引申到量子力學中,發現傅立葉不確定性與海森堡不確定性,了解到兩者竟然有如此深的關聯。而量子力學也不再那麼神秘難以理解了。

——— 量子波粒二象性 ———

參考量子線上學院的文章,其中最有趣的觀念是下圖:

將粒子視為波的組成,在空間中位於某位置,如上圖紅線中虛線位置。而一個波事實上是由許多不同頻率的波(含其相位)疊加而成,不同的頻率波具有不同的動量(也就是能量與其方向)。

越是位置要確定,紅色波形越集中。越集中的紅色波形,勢必由更多藍色的波組成。也就是動量的不確定性提高。

談到這裡,您是否發現,這不就是在說我們於音頻分析常常在說的傅立葉轉換嗎?但關聯也僅止於數學上,若是看到有什麼量子力學裝置能改善音質,您就知道別當真、笑笑略過吧!

——— 傅立葉轉換不確定性 ———

量子力學中位置與動量的不確定性,寫成公式就是下圖右邊,位置的標準差乘上動量的標準差,必大於等於某個數字:

同樣的,傅立葉轉換也有同樣的表述,如上圖左邊。時域與頻域有同樣的不等式存在。

——— 頻譜凸起與時域拖尾 ———

以高斯波形為例:

(上圖取自 research gate )

我們先看淺綠色(σ=5),圖右頻率響應凸起,圖左時域就會變寬。反之藍色線(σ=1),左手邊時域變窄,右手邊頻域就會變寬變圓滑。這正是傅立葉轉換不確定性的具體例子。

回頭看看於[ 廿七、殘響消除 ]中這張圖:

最下面紅色線拖尾變短後,頻率響應從藍色線較多尖銳凸起,變為較平滑的現象,正就是不確定性的一體兩面。我們聽到的,既是頻率響應凸起,也是時域波形拖尾。

——— 感想 ———

從諧波泛音、THD+N,然後談到IMD。接著玩了許多不同形式的左右聲道cross talk,甚至量測了5米長的RCA線。也聽了clock/data jitter的聲音後,又嘗試了許多DRC的技巧,並學習了空間聲學模擬的工具。

最後談著談著,玩音響竟跟最先進的量子力學距離這麼近,這是半年前一開始蓋這棟樓時,完全不會想到的。也讓我跟朋友聊天又多了個話題可哈拉

很喜歡這本書的書名《我們的生活比你想的還物理》,尋找事物的本質是件極為有趣的事。學習的過程,也許像要接受粒子是波一樣,會顛覆原本從未懷疑過的觀念。一但跨越過後,一定又是一番新的景象

卅一、動態範圍

常在大家談聽感時會提到「動態好」,或是「動態被壓縮了」這些形容詞。好奇是怎樣特性的樂段,會造成這樣的聽感?

提到動態,猜想大家談的應該是「動態範圍(Dynamic range)」這個指標,若不是的話,還請大家給予指正。

動態範圍的定義,有分兩個不一樣的概念:
其一:在曲目進行混音及後製過程中,為了聆聽音量控制方便,預先處理音源檔的程序。
其二:器材、喇叭等,在播放時因電子或物理等限制,造成的影響。

——— 其一、音源檔動態範圍 ———

需要調整動態範圍,是為了因應聆聽時的需求。想像開車時,外面風切聲、輪胎滾動噪音、引擎排氣管等等。或是居家環境,外面馬路行車經過,或是家裡電器、冰箱、空調、鄰居走動、料理等等。還有每個人聽力不同,都會影響聆聽較小音量樂段的感受

但是直接將音量調大,又會在樂曲聲量較大的段落過度放大。且不談播放器材容易失真,過大的聲壓會造成聽感不適、甚至傷害聽力,也容易引起鄰居抗議

因此,引進了動態範圍壓縮(Dynamic range compression/control,正巧也簡稱為DRC)技術,來解決這個問題。這也同時引發了響度戰爭,這又是另一個故事了,大家若有興趣,在網路上很容易可找到相關資訊。

最直覺,也最簡單的解決方法,就是把音量小的樂段放大,同時把音量過大的樂段降低。以下取自 [University of Illinois Board of Trustees, by Ryan M. Corey, 2020]:

先看上圖上方single sound,左邊大振幅變小,右邊小震幅變大。付出的代價是中間過渡期引入的失真,會需要小心處理讓人耳不易察覺。

再看上圖下方,另一個問題是當有兩個聲音,例如紅色是小喇叭聲量太大時,一壓縮也同時讓藍色例如是鳥鳴聲也變小。因此在混音時,會個別樂器音軌分開獨立做動態壓縮處理,想辦法讓合在一起後聲音聽起來自然。


上述這個做法雖然看起來不錯,但在時間軸上還是引入了大小聲音量調整過渡的問題要處理。

另一個做法是在線性度上下手。下圖借用[Pro Audio Files, by Danny Echevarria, 2021]

在振幅超過臨界值(Threshold)時,會將振幅衰減。例如4:1的比例,就是當超過臨界值12的話,只多輸出3。中間的轉折點(Knee),通常也會做平滑化處理,讓聲音較為自然。上圖只畫正向單方向,若畫出上下雙向,就會看到類似在之前文章[二、諧波失真]中提到過的:


這樣的動態範圍壓縮方式,恰恰正是奇次諧波失真。其效果如下圖(取自這篇[QSC, by Christophe Anet, 2023]);

優點是小震幅處完全沒有動到,維持原始最佳品質,只有大振幅處才被壓小。

用來標準化量測調整動態範圍,最常用的規格是EBU R 128,各大串流如Tidal, Spotify, Apple, YouTube都是用此標準,只是目標音量各有所選擇。(下表來自[wiki])


稍微說明一下這個標準所使用的音量單位:LUFS(Loudness Units referenced to full scale)。因為人的聽覺對於不同頻率,相同的物理能量感受到的體感音量並不相同。所以計算音量上需要對不同頻率能量乘上不同權重,如下圖(取自[Production Expert網站]):


可以看到其假設是人耳對低頻的音量變化較不敏感,中間100~1kHz約略平直,再往高頻則會較敏感,覺得比事實物理能量上更大聲。

而音樂中的較強處與較弱處,就會依[EBU Tech 3342]標準方式計算LRA(loundness range):

主要的概念是先去除音量過低的片段後,取音量前5%,以及後10%各自平均後,相減就會得到LRA。大家常說的動態範圍,就會以LRA這個數據來呈現。

接下來使用ffmpeg這個工具,來量化分析之前於文章[二、諧波失真]中提到的幾段音檔:
Guitar ] [ Jazz ] [ Piano ]
wav檔下載 ] (中度失真檔名結尾 xxx_0deg,原始檔案xxx_pre3_0deg)
wav檔下載 ] (過強失真檔名結尾 xxx_0deg_bad)
(使用指令是 ffmpeg -i 檔名.wav -filter:a ebur128=framelog=quiet -f null -)


鋼琴曲可能因為有大量音量極低幾乎靜音的時間,算出來動態範圍值怪怪的,還沒搞懂,暫時跳過不看。

其他兩首算是符合趨勢,您可以分辨的出動態範圍縮小造成的聽感差異嗎?在過強的動態壓縮下,因過度失真甚至截波(clipping)而產生雜音,應該明顯可辨,但中度失真(中度動態範圍壓縮)就不是那麼容易了。

——— 其二、播放器材動態範圍 ———

播放器材本身,若有類似上述諧波失真,也會造成動態範圍壓縮。除此外,還有另一個面向,參考[Analog Device網頁]的定義:



這裡的Dynamic range代表的是在distortion發生前,一直到noise floor中間這段區域。和SNR不一樣的地方,在於SNR通常以一個nominal位準來計算,不計算保留的headroom空間。

由Analog Device的定義可知,和前一段所講混音後製中的動態範圍定義,雖同樣一個詞,但完全是兩碼子事,不能混為一談。

以此定義,就可以來說明由訊源DAC到後級輸出會發生哪些相關的事。

DAC最常被討論到的是DSP volume(數位音量)可不可以用?這個跟動態範圍扯上什麼關係呢?

如上假設有16-bit dynamic range(約90dB),使用DSP代替類比音量縮小6dB,相當於由16變15bit,只剩一半動態範圍。noise floor仍然不變,也可說類似等效SNR變差6dB。一起來試試動態範圍縮小的聽感吧!

有效位元數差異wav檔下載 ]

檔名後面的數字,就是其中有效位元數。正常聆聽音量下,吉他及爵士到11 bit起雜音開始比較明顯。鋼琴因為音量較小,在最後幾秒比較容易聽出雜音,大約到13 bit就稍微聽得出來了。聽到的雜音比較像是白噪音,不像是有”壓縮”讓大音量小音量差異變小的感覺。

現在的DAC大多支援24 bit,THD+N超過110dB也不再是難事。從24bit到13bit,也有個60dB可調空間,用來當作數位音量控制也就成了一個可行的選項。

常見的DAC隨數位音量的THD+N趨勢如下:

左半邊隨著振幅下降,THD+N呈線性上升的現象,就是因為noise floor是主要失真成分。聽感上會比較像是噪音增加,不會讓大小音量差異變小。

若將DAC接下一級,問題會稍微複雜一點了。若下一級的noise floor比前一級的noise floor高,則被下一級決定了noise floor。若是下一級的可用電壓範圍又比前一級小,則動態範圍又被進一步限制。簡化示意如下圖:

在此情形下,要控制前一級增益變小,以進入下一級的可用區間內。

反過來的情形如下,只是沒用滿下一級的動態範圍:

—— 小結 —— 

由以上DAC及上下級的例子,來分析播放器材動態範圍影響,都不會是”壓縮”讓大音量小音量差異變小。造成的差異是類似SNR變差,底噪增加。

——— 回到聽感 ———

之前跟nerv大討論時,nerv大曾提到:

「動態簡單來講例如鋼琴聲,動態好的會讓你覺得彈鍵時的強弱對比明顯,動態差的會讓你覺得聲音沒有起伏聽起來比較平淡。」

強弱對比明顯程度,猜想跟第一段談的線性度於高振幅處壓縮比較相關,跟第二段底噪有效位元數比較無關。若是能明顯聽得出來,理論上會反應在諧波失真上,也就是最終會在THD+N的數據上有差異。

不知道大家如何在聽感上定義「動態」這個詞呢?您在調整或選擇系統時,曾在什麼樂段會想用「動態」這個詞來形容?更具體的話,是怎樣的差異呢?

也許我目前所選擇的數據指標(THD+N, LRA)並不適當,若您有合適的動態差異樣本,很希望能有機會跟大家合作錄音量測及分析。
goldbingo
goldbingo 樓主

ghleu [讚] 您的見解很深入,頻域與時域這題延伸下去又是另一個有趣的題目。退回這篇主題,線性失真上,可利用THD+N的量測手法,仍給了我們一個很好的武器來量化這個問題。

2025-02-28 16:19
thxman.tw

就動態範圍言之,若非耳機聆聽,當或再思,其三、聲重播空間的動態範圍

2025-03-10 6:35
goldbingo wrote:
動態簡單來講例如鋼琴聲,動態好的會讓你覺得彈鍵時的強弱對比明顯

動態範圍與泛音列多寡有直接關係.
喇叭的頻率範圍, 與 DAC 類比輸出波形完整與否, 會關係到超高/低頻泛音列的重現.

小提琴最高泛音頻率是 40KHz, 我的 B&W 803D2 頻率範圍是:
Frequency range: -6dB at 28Hz and 33kHz.
Frequency response: 35Hz – 28kHz ±3dB

無法完全呈現所有泛音. 所以有人會外掛 超高音單體 (ELAC ELAC 4 PI Plus V), 與超低音喇叭 (REL), 來覆蓋更多頻率範圍.

上面說的是 Playback, 而 Source 端的 DAC 機也要夠好, 能完整輸出泛音列波形.
只有在 Source 與 Playback 相互匹配時, 才能改善動態範圍.

以我為例, 經過 2 次器材升級, 增加泛音後,
鬼太鼓的鼓聲從 "噗" 變成 "咚", 再進化到 "咚嗯嗯嗯".
宅男工程師 wrote:
動態範圍與泛音列多寡有直接關係....(恕刪)


謝謝宅大的回饋,這點的確提醒了我,大家形容聽感時,同一個詞「動態」在實際上會有不一樣的解釋。宅大的想法,就在我前面文章中所提的兩個領域的解釋之外。

在我的認知裡,一直認為泛音的重現只比較偏向是頻率響應與頻寬等領域。之後在跟大家討論時,的確需要多注意了解彼此用字遣詞的細節含義。若造成大家誤解,反而失去焦點,無法形成共識,那就太可惜了。
goldbingo wrote:
提到動態,猜想大家談的應該是「動態範圍(Dynamic range)」這個指標,若不是的話,還請大家給予指正。

動態定義不簡單啊~
有動態範圍,有音樂本身的動態。
但聽感上的動態,指的是什麼?
我個人有限的經驗裡,我認為常常指的是跟時間響應有比較大的關聯。
音樂本身的動態,和音樂資料格式能表達的動態範圍,是跟聽感上談的動態有很大的關連,但我覺得少了一個重要的因素。少了時間響應。

我用車子來比例,也許更能表達時間響應的重要性。
扭力大的車子,影響了初段加速。
馬力大的車子,影響後段加速度的延伸性。

擴大機的最大功率,我覺得像馬力。
那兩部相同功率的擴大機,動態表現是不是相同? 我想大家都心理有數。
那麼要如何解釋功率相同,動態表現卻差異很大的現象呢?
其實把扭力給帶進來,就更能解釋其中的差異了。

擴大機的動態表現,很像車子的扭力。
動態表現,就看擴大機能不能及時供夠大電子流,把大動態音樂及時表達出來。
如果瞬間電子流供應不足,大動態音樂就無法表現得乾淨俐落,而變得無力或模糊。

改善動態表現的方式,最常見的是 並聯輸出,兩個放大器並聯,瞬間供應電子流的能力就加倍。

晶體機我少研究,心得少。
真空管的話,跟動態相關的部份舉例如下:
1。整流管:電流輸出要足夠,內阻要低。
2。穩壓電容: 內阻要低,容量要足。
3。功率管: 燈絲功耗大的,電子流的動能通常比較大。陽極板面積大的,額定功率大的,電子流動能比較大。直熱式燈絲比旁熱式效率高,電子流比較大。

不談聽感的喜好,只看動態的話:
並聯輸出動態好
推挽比單端好
直熱式比旁熱式好。
宅男工程師

後級擴大機的瞬間功率輸出, 很重要. 大編制交響樂常有, 突然所有樂器巨響的轉折. 瞬間輸出差的後級, 聽起來就軟腳, 沒有恢弘滂渤的氣勢.

2025-03-02 7:01
MiPiace wrote:
我認為常常指的是跟時間響應有比較大的關聯...(恕刪)


謝謝MiPiace提供您的觀點

就我的理解,我想您所提到的瞬間電流的意思,是當輸入訊號有大幅度快速變化時,輸出電路是否有足夠能力同樣高速充放其下一級。

對於信號可能產生的影響,是斜率(slew rate)出現非理想特性,影響波形正確性。

但談到slew rate,就得探討是否時變這個因素。許多數學分析方式,都基於線性非時變LTI(linear-time-invariant)的基礎上。若仍非時變,意思是不論何時,該變形不理想都是如此,則稱為非時變(time-invariant)系統。

先說非時變的情形,也就是面對的可能是一個非線性系統,這在先前跟ghleu也聊了一部分。我在這討論串的[二、諧波失真]中也推導過,時域非線性失真,在頻域就是諧波失真。這部分在利用THD+N的量測手法,例如對振幅、頻率掃描,比較有機會定量分析。

那麼若是時變呢?這就是另一個大題目了,例如上升下降slew rate不同、AM效應等等,我再花點時間想想怎麼整理出來。

因為也不知道是否跟您所談的吻合,您可舉例在哪首音樂的樂段或是某類波形,會出現您提到的這種不理想性嗎?這會有助於討論的聚焦。
goldbingo wrote:
對於信號可能產生的影響,是斜率(slew rate)出現非理想特性,影響波形正確性。

是的,我談的大概是跟slew rate 有關,但我不確定是不是只有 slew rate 一個單純因素。
瞬間並不好衡量,會不會有可能 overshoot, undershoot, 或震盪產生泛音(真空管尤其明顯)。這些都會影響聽感。
還有不同的頻率,是不是slew rate 會不同,畢竟放大電路的阻抗是會因頻率不同而不同。
goldbingo
goldbingo 樓主

[笑] 看來動態這詞在聽感有太多含義,這樣會難以聚焦,我試著先從瞬間電流/slew rate角度,想看看怎麼更明確定義。

2025-03-02 12:52
  • 18
內文搜尋
X
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 18)
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?