• 19

(卌九、三論諧波相位)製作特性差異音訊、體驗聽感

dirtsa wrote:
當audio engineering...(恕刪)

dirtsa 宅男工程師 其實這部分我比較難理解的是為何需要找到一個參數去解析音色,
解析他的好處在哪?系統能打的出來不是比較重要?復現的工程上需要這樣反推的實務應用在那?

流程應該是盡可能去確保輸出等於輸入為必要條件,做出一個能接近理想的輸入輸出系統,最後再套上option 用家要的一些filter DSP eq 或是一些人因工程研究後最佳化效果等等濾鏡即可。
四、非平滑曲線

延續上一篇討論,似乎在交越零點附近的失真,對於聽感影響較明顯。這次由最接近這類的交越失真開始,同時也玩玩其他類似在線性度上不平滑情形。

Case 2: Crossover distortion

這是很經典的失真,在class B放大電路被討論最多,下圖取自[wiki]

主因是上下兩個電路在偏壓0V附近時,都會落入cut-off  region不導通。轉換成輸出入關係,並設定1% THD,極端情形會如下圖,因為很小不清楚,刻意放大中間部分在左上角。

藍色線中間會有一段躺平,代表不導通區域。以1kHz正弦波輸入,輸出端頻譜如下:

會有一堆奇次諧波,這裡只畫到20kHz以下,事實上會再一路延伸出去到更高頻。這與傅立葉展開觀念上一致,時域上有一個不平滑面折角形狀,就會展開到更高頻。這些所有的諧波能量都算是諧波失真的一部分。由隨頻率掃THD圖如下。可以看到約在1kHz開始,若有低通濾波器時(橘線),就開始有部分高頻諧波慢慢被濾掉。這種現象也可當作一個側面依據,來推測可能有不平滑發生。

跟聽感更強烈連結的,是用振幅掃THD的圖如下。雖然最右邊全振幅時是1%(-40dB),往左振幅變小時,失真程度一路爬升。物理上可以理解成不平滑的失真能量,隨著訊號變小,佔的比例一路變大。

這對聽感來說是最容易被感受到的,即使再縮小到0.1%,也明顯可聞。以下圖吉他曲頻譜為例,中間是0.1%THD的頻譜,與上方相減得到下方的能量差,寬頻帶雜訊能量大增,在頻譜上也同樣說明了這種失真的破壞性。

準備了0.01%, 0.02%, 0.05%, 0.1%, 1%來聽聽看,以了解不同程度失真的聽感影響。

Guitar ] [ Jazz ] [ Piano ]
wav檔下載 ]

吉他曲在1%時,像是從壞掉的收音機聽到模糊的聲音一樣,到了0.1%可聽到撥弦沒那麼清脆,帶著沙沙聲。爵士曲在0.1%bass雖然聽來還算正常,但背景較小聲的伴奏卻也仍帶著一點點細沙聲,到了0.05%才微乎其微。到了0.01%,吉他及爵士曲已完全聽不出差異,鋼琴曲還仍然稍可以聽得到不同,以下圖頻譜來說明(Y軸為頻率,未取log):

上方是原始檔,下方是受0.01%失真影響後的鋼琴頻譜,可看到crossover失真會在高頻區形成紋路。在鋼琴曲,例如最後只剩尾音及琴鍵聲區域,聽得到多出來的高頻聲音,這真的很妙。

在數學上不平滑(也就是微分會有不連續點),聽感上的確會造成災難。但電路中轉折點可能會稍微平滑些些,如下圖:

其隨振幅THD圖如下:

小振幅訊號受失真的的影響變小,此例子的平滑轉折點約在0.05。試試實際聽感,維持1%失真,試試要平滑到多大範圍才會感受不到。

Guitar ] [ Jazz ] [ Piano ]
wav檔下載 ]

結果到約0.1或0.12,我開始聽不出差異。在這附近聽到的差異,是在吉他聲音的乾淨度,夠不夠清脆。爵士曲中bass聲,有沒有像是共鳴箱壞掉的感覺。鋼琴曲則在鍵盤按下之後的尾韻,有沒有類似木板鬆脫的雜音。同樣來看看鋼琴在有0.1幅度平滑後的失真。特別放大來看,會看到波紋但稍稍粗一些也模糊一些。由此頻譜實在料想不到到聽感會是如此。



Case 3: Clipping distortion

另一個極端是不平滑處不在正中間,而是出現在兩頭。這種失真在EQ調過頭,超過動態範圍時就會出現。或是各級訊源擴大機間電壓範圍沒弄好,前一級訊號過大超過下一級輸入容許範圍時也會。

若以輸出入關係來看,則如下圖。藍色線小於clipping界線,則完全沒有失真。要超過才會出現失真。

若以THD=1%來算,以全振幅為+-1.0,大約clipping在+-0.97,不容易視覺於圖上看到,因此放大到THD=5%比較容易說明。下圖上方是被clipping的波形。下圖下方是完美的正弦波。


其頻譜可展開如下圖,可看到非常多的奇次諧波,這裡刻意將頻譜畫到40kHz。右半邊若沒有經過低通濾波,會有能量跑到超音波範圍。


另一種是單端clipping,如下波形:

其諧波組合如下,且全都是偶次諧波。

以1%總諧波失真來算,單邊也只約clipping在-0.96。以正常音樂來說,很少有機會波形到達這麼邊緣,但頭一次聽到時,我還是嚇了一跳。刻意調到會造成clipping來聽聽,增加經驗值。

wav檔下載 ]
兩端clipping檔名為 *_clip.wav
單端clipping檔名為 *_clip_L.wav

Case 4: DAC distortion

看過了中間和兩端的極端狀態,不平滑有沒有可能出現在一半的位置呢?能想到的一個可能的例子,是DAC的DNL問題。這裡暫不打算探討所有DAC可能的非理想性,只先看此單一狀況題。參考Research gate上Nedjeljko Lekic文章中的圖如下:

DAC可能因電路設計不理想性,在某些位元轉換處,產生較大的DNL,在R2R這類很吃元件match特性的DAC尤其挑戰高。將問題簡化成如下圖鋸齒狀非線性特性,來體驗一下聽感。

Guitar ] [ Jazz ] [ Piano ]
wav檔下載 ]

1%失真時,吉他及爵士都明顯帶雜音,至於鋼琴因為音量較小,因為這裡用的DAC失真於零點處並未失真,聲音要大到約0.125時,才會撞到不平滑區。所以聽起來只在琴鍵敲下去時,有時左邊,有時右邊,有時兩邊,會出現小小爆聲,相當有趣。以振幅掃THD圖,也可印證此狀況。0.125以下無失真,一超過THD立刻暴升。隨著振幅變大會經過的其他不平滑處,也都會看到對應的起伏點。

當降低到0.1%失真時,三首曲子只剩鋼琴曲還聽得到雜音。在與1%失真中雜音出現的相同地方,仍有細微的雜音,要非常仔細放大音量才注意的到。頻譜上有個有趣的現象,值得一看。

上圖上方是原始檔,下方經失真後,與crossover失真不同,頻譜上多出來的高頻長相不是紋路,而是類似斷斷續續的直條狀,想不出如何解釋為何頻譜長這樣。至少之後遇到了類似情形,有了這個經驗,會知道與此有關,不會完全沒有頭緒。

到這裡,也應可解釋[上一篇]中提到的猜測「是否人耳對接近零點的不平滑區較敏感?」因為在零點附近的不平滑,不論大小聲量都會經過,必然失真。而遠離零點的不平滑只有大於一定聲量才會遇到,且大聲量對於聽感的遮蔽效應下,會抑制對某些失真的感受,相較起來就影響較小了。Csaba Horváth在[tonestack]這篇文章試著討論這題,參考文章中的圖:

若將人聽感參數考慮進去,只有露出藍色線遮蔽效應閥值的,才會被感受到。將物理上的THD對人聽感參數做調整,會有一個比較接近人感知的THD threshold。不過這個流程及計算方式似乎仍沒有確切標準,尚沒看到在工程上有使用。

結語

同樣1% THD在不同頻率組成下,聽感感受的失真度卻是天差地遠。1%的不平滑曲線,比起15%的三階諧波失真,聽起來差別還大。在解讀THD數據時,不一定低的,就一定聽起來感覺失真小。

————— To be continued —————
誰阿 wrote:
其實這部分我比較難理...(恕刪)


我覺得你講的全部都是對的。

就是因為參數不能解析音色,他們才一直反覆跳針音色,宣稱一些基本量測有偏差,明顯失真,輸入不等於輸出的高價器材,或是測不出差異的高價線材,他們"聽得出""音色更好",所以你的量測是有缺陷的。而且99%情況下越貴的器材就是音色越好。

如果今天音色能被測量,他們就會換成講別的東西了

他們的一貫手法:

你不是神纜教,你就是老實教,
你不是蛇油教,你就是老實教,
你不是標價教,你就是老實教,
你不是logo教,你就是老實教,

到最後就人人都是老實教了。只有在有管理的公開社團,音頻專業的知識才能好好的被討論。
goldbingo wrote:
DAC可能因電路設計不理想性,在某些位元轉換處,產生較大的DNL,
在R2R這類很吃元件match特性的DAC尤其挑戰高

很欽佩樓主的研究精神, 請問是本業 or 個人業餘愛好 ?

我知道的 DAC 類比電壓輸出分,
1. 以類比計算輸出的精密電阻陣列,
2. 以數位方式輸出的 OPA IC 串列
兩者極端機種的價格差距, 可達 200 倍.

goldbingo wrote:
同樣1% THD在不同頻率組成下,聽感感受的失真度卻是天差地遠。

這就是多年以來, 數據派與聆聽派爭吵的重點,
有糟糕 THD+N 量測值的上百萬真空管 DAC/前後級擴大機, 會被數據派歸為低階產品
唯有親耳聽過, 才知道是不是自己認為的好聲音, 而非單看別人量的數據.

誰阿 wrote:
其實這部分我比較難理解的是為何需要找到一個參數去解析音色

這問題應該要先問 ASR Amirm,
為何長久以來只靠頻譜, SNR/THD+N/IMD 等頻率公式值, 來評論 DAC/喇叭的音質優劣 ?
難道他不知道, 樂音是由基音+泛音列組合, 的基礎樂理知識 ?
pipi678

甚至是toole的書 也都被斷章取義的支離破碎 明明數據跟聆聽是對等重要的事情 這些人的論述看久了就也不意外了

2024-09-02 13:23
goldbingo
goldbingo 樓主

我是個人業餘愛好,只能從理論上來思考,若有業內專家還請給予指正建議。

2024-09-03 12:51
誰阿 wrote:
做出一個能接近理想的輸入輸出系統,最後再套上option ...(恕刪)


若是能有一個100%理想系統,可將技術部分(無失真)與藝術部分(聽感喜好)分開,會有很多玩法的想像空間。

例如分開成不同機器以不同指標來評量,各自依自己的技能樹點滿點數,調整聽感不影響其技術面失真指標。這樣就不會因量測數據而錯過想要的聲音。

或是聽感運算可是硬體、也可放到類似Roon這種streaming軟體中大家可互相替換交流,甚至聽感引擎可獨立販賣授權等等

舉Ayre QB-9的做法為例,它就有點這個味道。這部DAC在後面附上了可以切換Measure/Listen的開關。
掃了frequency sweep頻譜如下:

兩種模式雖都有一樣的諧波失真,但Listen模式在upsample演算法的設計上,卻選擇了將應壓抑的mirror效應保留較多。落在超音波區域(>20kHz)就罷了,甚至部分進入可聽聞頻帶。

這正是有趣的地方,Ayre有能力做出接近教科書的Measure模式。同時還給了聽者,另一個量測上也許會覺得有缺陷,但他們推薦的Listen模式。

實際音樂頻譜在20kHz以上,會像海市蜃樓一樣浮出額外頻率成分。
goldbingo wrote:
舉Ayre QB-9的做法為例,它就有點這個味道。這部DAC在後面附上了可以切換

Ayre QB-9 也是很早導入防 Jitter 的 DAC

Ayre QB-9 USB DAC

MY-HiEND wrote:
您知道為什麼Ayre 從來不生產分體式的轉盤及DAC 嗎?為什麼QB-9 會成為Ayre 第一台獨立的DAC?今年9 月Ayre 市場經理Brent 來時,我特別問了他這點,答案其實很簡單,關鍵就在於時基誤差(jitter)。標準的S/PDIF(Sony/Philips Digital Interface Format)數位傳輸方式是沒有辦法避免jitter 的產生,這對要求完美的Ayre 來說,是沒有辦法忍受jitter 對聲音所造成的劣化。
五、+雜訊

這系列THD+N主題,走到最後一個+N 這個項目。N就是Noise。

THD+N的定義參考wiki算式如下:

通常的做法分母會假設harmonics及noise很小,fundamental佔比非常高。所以就以全波形的rms(均方根)代替。分子是利用非常sharp的notch filter,將基頻濾除。留下來的波形取rms。

另外頻寬選擇也會影響計算結果,我的選擇是將24kHz以上、DC及極低頻低頻段濾掉,只計算可聽得到的頻帶。

目前想到的噪音種類如下:
1. White noise (白噪音)
2. Pink noise (粉紅噪音)
3. 高頻雜訊 (類似sigma-delta DAC noise shaping後沒濾乾淨, 用白噪過5kHz high-pass filter來體驗)
4. 特定頻率雜訊 (例如交流電源雜訊60Hz)

噪音wav檔 ]

加到樂曲內,THD+N要多少以下才會無感呢?以1%(-40db), 0.1%(-60db), 0.01%(-80db)來聽聽看。

White noise  [ 樂曲wav檔 ]
Pink noise [ 樂曲wav檔 ]
高頻雜訊 [ 樂曲wav檔 ]
60Hz單頻 [ 樂曲wav檔 ]
檔名命名規則:
xxxx_pre: 原始檔
xxxx_high/pink/white: 1% THD+N
xxxx_x0.1: 0.1% THD+N
xxxx_x0.01: 0.01% THD+N

聽感部分,除了最後的60Hz外,其他都是在0.1%時,雜訊就很小但仍能察覺到,到了0.01%,就幾乎聽不出來,只有鋼琴曲放大聲量後稍微可聞。

60Hz則感受不太一樣,1%雖然可以說是聽到了60Hz的聲音,但從更深層感知層面來說,形容成有一股壓抑感從下而上整個悶住,更為貼切。到了0.1%時就已經感受不到那種壓抑感,只能在曲目結尾稍稍可聞該頻率。0.01%則完全無法察覺。

舉白噪音1%為例,來看一下THD+N對振幅及頻率掃描。

隨振幅THD+N曲線非常像crossover失真,這是因為振幅小時,雜訊仍然一樣大,所以佔比會偏高。DAC的Quantization error也很類似白噪音,若量測作圖也會有類似現象。

隨頻率掃描如下:

橘色是只看24kHz內能量,可看到比全頻域(48kHz)要低約3db,可知我所用的白噪音有超音波頻域成份。但60Hz雜訊則非常不同,如下:

因為沒有超過24kHz成分,所以藍橘色線重疊。在60Hz處會突然THD+N超好(-150db已是python浮點運算極限),這是因為THD+N的量測方式,是打入基頻,量測「輸出側雜訊/輸出側基頻」,這時雜訊被當作基頻,分子變小,分母變大。單點THD+N變好是假象,解讀應參考更多資訊。

單頻輸入是THD+N測量的一個主要方法,但也衍生出其限制。除了這裡提到的單頻雜訊外,複數頻率輸入造成的額外失真並沒有計算進去,之後玩IMD(inter modulation distortion)時可再來檢視。此外因為是固定振幅量測,不考慮隨時間變動振幅的效應。Transient intermodulation distortion (TIM) 有一說是近代電路已經夠好,不用再煩惱此問題,這點我還需要再多學習一下相關知識。

最後拿我的DAC來綜合實際量測掃振幅對THD+N。藍色是左聲道,橘色是右聲道。

振幅在-20dBFS以下 ,Noise dominate,如同白噪情形,隨振幅變小,雜訊比例變大。超過-20dBFS之後,反過來由Harmonic distortion dominate ,隨振幅越大失真越大。所以也未必用盡動態範圍是好事,應視器材特性適當使用就好。

-10dBFS處有怪怪的凸出一根,這是因為我的隨身錄音機的限制。一般寬dynamic range的ADC電路不易實現,退而求其次的做法是使用兩個ADC同時工作,在超過小的ADC輸入範圍時,切換到另一個大輸入範圍但精度稍差的ADC繼續運作。-10dBFS正好就在切換邊緣。如下頻譜:

左邊底噪較小(深藍色),右邊底噪變大(淺藍色),中間換檔處有明顯基偶諧波一路到高頻,很像是clipping的行為。看來我已經用到此隨身錄音器材的極限了

—— THD+N告一段落,其他主題待續 ——
宅男工程師 wrote:
不同頻率的相異衰減時間 ...(恕刪)


六、頻域時間資訊?

謝謝宅大先前的提案,先來試著來探討其中一題「頻譜隨時間變化復現能力」。某個頻率的訊號在時間上的衰減,做完傅立葉轉換後不見了嗎?

從時域觀點,可直接由波形看得到,相對上比較直覺。舉一個例子,有一個1kHz波形有如下分別為增強及衰減的現象。


事實上,這兩個波形都是由同樣的兩個頻率995Hz及1005Hz組成。轉換到頻域思考時,會是一樣的兩個頻率項。因為經傅立葉轉換後是複數形式,一般看頻譜只看了其絕對值,相當於振幅,好像時間資訊被壓縮不見了。其實不然⋯

「時間上的資訊藏在phase中」

分別取最前面0.005秒放大來看,上方f0是995Hz,中間f1是1005Hz,下方merge是兩者相加波形。
逐漸增強:相位差從約180度開始

因為1005Hz頻率較高,因此兩者相位差會慢慢變小,原本波峰波谷相消會慢慢轉變成波峰波峰疊加。

逐漸衰減:相位差從接近0度開始

相反地,從波峰對波峰疊加,會慢慢轉變成波峰波谷相消。

以此簡化的例子來說明,時域上變動的波形,可轉換成頻域上多個頻率(及其相位)的組合。兩域可互為轉換,資訊並沒有丟失。

但在現實量測上卻沒辦法這麼簡單直覺,因為頻域上對頻率的精確度,得要靠時間夠長,才能得到。因此如果以這麼短的時間window做FFT,頻率resolution不足以分出兩個頻率,頻譜會如下圖:

時間資訊消失了嗎?其實還在,藏在中心頻往外下降的斜坡裡。舉不同衰減速度波形為例:

轉換到頻譜如下:

由上而下,隨著衰減斜率變緩,頻譜上集中度提高。是衰減還是增強,則由斜坡上各個頻率成分的phase而定。

從這個角度來思考,若是有雜訊或失真出現在中心頻兩旁的斜坡上,就會影響該頻率於時域上隨時間變化的特性。而IMD(互調失真),參考MISCO/Minneapolis Speaker Company網站的圖如下:

右邊的f2頻率,若因左邊另一個f1頻率而失真多出f2 ± f1, f2 ± 2f1, …等頻率,必然會影響f2在時域上的表現。

觀察了上面時域上波形與頻域上IMD的敘述,連結到一個重要觀念:「時域上波形的envelop (如下圖紅線),不就是通訊上的Amplitude modulation(就像是收音機的AM, 調幅)嗎!」。因此隨時間變化的問題,可以轉化成通訊上的調變問題,這就有機會模擬了。



參考了這篇 KLIPPEL LIVE Series1_Part9 - Intermodulation Distortion - Music is More than a Single Tone [對應的 Youtube 影片],其中說明了IMD成因、模型及量測等多方面資訊,提供了一個以數學方式模擬的可能性。若真的可行,弄好之後再來跟大家分享聽感。
宅男工程師

Dr. Wolfgang Klippel 講解較有學術嚴謹性. 但曲高和寡, 訂閱數僅 812+1

2024-09-08 19:49
goldbingo
goldbingo 樓主

很佩服Klippel貼心的將原理用容易理解的方式呈現。但畢竟是較為深入專業的題材,會有興趣的朋友也就比較有限了。

2024-09-08 20:46
七、IMD成因原理

—— InterModulation Distortion——

先來看可能造成的原因,在物理上有其意義,做model模擬時也比較有手感。

借用Kirill在COMSOL文章中的圖:

單體中訊號經由線圈推動紙盆將聲音傳遞出去。然而紙盆在上下震動不同位置上,因為線圈電感/電流/磁力/共振/氣流等等緣故,會導致對電流/電壓特性不同。

若有一個低頻大訊號,將紙盆推離中心點。在移動到時上方,這時另一個高頻訊號,若需要更多能量才能讓紙盆有相同高頻位移程度,則實際推出來的聲音就會相較紙盆在中央處來得小。Klippel這份投影片/影片中實際量測到的如下,橫軸為時間,縱軸是音壓:

原本應該要保持衡定振幅的高頻訊號,失真成載了低頻訊號的AM波形。

除了單體外,電路中也有類似效應存在。舉3次諧波失真為例(可參考先前文章二、諧波失真),橫軸可視為爲輸入電壓,縱軸藍色粗線爲其對應到縱軸輸出電壓:

可看到在振幅較大的地方,其斜率變緩,中心點則斜率較陡,相同輸入的小幅高頻訊號,輸出會比在零點附近的來得小。以f1=100Hz, f2=4kHz(振幅為-12db)為例,下圖是時域上的波形:

波形中小幅震盪高頻成份,在輸出端頂端與中間的振幅產生差異。將輸出端經高通濾波,只觀察高頻部分,可更明顯看到類似AM調變的失真。這跟Klippel量測單體的實驗結果相似。將輸出波形轉到頻域來看:

可看到f2兩旁距離2*f1處,各多了一根。這兩個不該存在的頻率成份,就是互調失真InterModulation Distortion(IMD)。

有個疑問是:「為何在f2鄰近的兩個失真頻率,不會被遮蔽效應屏蔽掉?」原因是遮蔽效應的理論基礎是單音被另一個更強的鄰近單音遮蔽,而聽不到。但這裡並非單音,而是複合頻率形成AM調變效應,人耳並不會聽到兩個單音,而是感受到聲音振幅抖動。

諧波失真與互調失真,就像是對非線性失真的兩種不同觀察面。之前提到過的偶次諧波失真、crossover、clipping等等,利用這種這種two tone IMD量測也都會反應出來。


以上探討了第一種two tone IMD測試方法,是利用高低兩個頻率,大小振幅不同。也暸解了其物理意義。在測試標準上常看到的是SMPTE RP120-1983,通常挑選60Hz/7kHz,振幅為4:1。依振幅大小掃出IMD值來觀察。

還有第二種在通訊上常用的two tone IMD測試方法,是使用兩個一樣振幅的不同頻率。這篇Analog device的Walt Kester所寫的Intermodulation Distortion Considerations for ADCs,我覺得讀起來收穫很多。借用文章中的圖:

輸入為f1, f2兩個頻率,經由非線性失真,額外產生了一堆m*f1 ± n*f2,其中m, n為正整數。這在多通道通訊系統是一個重要的指標,這代表某一個通道(頻段)的訊號,會因失真跑入其他通道,造成其他通道訊號劣化影響傳輸品質。在上述Kester文章中有習知的技巧來推估其影響程度。(文中ADC的IMD特性推導也相當神奇!)

換作audio信號,我會這麼類推,如下是之前提到過由freesound.org取材一段小提琴單音頻譜:

將每一個諧波都視為通訊的一個通道,若有通道因干擾,其能量落入其他通道(頻率)中,就無法將原始資訊完全正確傳入耳朵。所以第二種two tone IMD測試方式,可想像成一種測試泛音是否會失真的概念。

一樣也來檢視一下之前討論過的種種非線性失真,是否都會有對應的IMD失真?


到此引發我兩個疑問:
一、既然非線性問題,THD都測得出來,測IMD能多提供什麼資訊?
二、在什麼狀況下單頻沒有失真,非得多頻率同時打才會失真?

這是我還沒完全搞懂的地方,暫時放著。先來試著參考Klippel的文章,模仿其envelop形狀製作AM調變干擾吧!

————— To be continued —————
八、模擬IMD聽感

Klippel文章中用的是feedback loop方式加入非線性調幅失真。而我並非想要模擬單體行為,只是單純想體驗這種失真的聽感,因此模型大量簡化後如下:

粗略抓低通濾波1kHz,高通濾波4kHz,非線性失真近似Klippel量測形狀(一個cycle有兩個U形凹陷):

如此一來此模型就具有單頻THD 測試看起來無失真,但雙頻IMD 測試卻有失真的特性。

先來看看模擬出來的頻譜(f1=60Hz,f2=7kHz):

頻譜上可看到7kHz左右,有一連串60Hz引起的互調失真。時域波型如下:

只看7kHz高頻部分的AM波形,與Klippel 的圖就有幾分像了。先聽聽輸出入波形two tone的聲音:[ 輸入 ]  [ 輸出 ]
原始輸入高音部分穩定乾淨,失真後輸出聽到高音明顯抖動類似蟋蟀聲。

將此模型套入實際的音樂來聽聽看:
Guitar ] [ Jazz ] [ Piano ]
wav檔下載 ]

Guitar是三個錄音中算比較容易聽出差異的,但仍要加強失真至少+6db,不加強我仍分辨不出來。

仔細聽高音弦的撥弦及延續音,可以感受到高音沒那麼乾淨,有點模糊。增強到+12db雖失真過頭了,但其高音抖動更加明顯,+6db的聽感,可以把+12db稍稍減低失真來想像。

原本以為Jazz有大量bass,會更有機會聽出失真,但我只能在+12db的最後幾段薩克斯風,聽出變得稍微沙啞沒那麼清亮。

至於Piano就完全分辨不出差異。

回頭來看一下頻譜,以Guitar為例,先看分辨不出來的+0db:


+6db後可分辨:

有幾個觀察:
1. 最下方頻譜差異只在4KHz以上有,符合model中高通濾波設定頻點。
2. +6db後,明顯改變了頻譜上泛音組合的特性,也聽得出不同。+0db則仍與輸入原始頻譜類似,雖然頻譜上差異已經不小,但聽感區分不出來。
3. 頻譜差異有直條紋,與之前做3階諧波失真類似。就聽感上,之前的經驗是3階諧波失真要失真非常大才感受得到,此處亦有同樣觀察。
4. AM效應會衰減高頻能量,並加入抖動,這在+6db經失真的頻譜的確可觀察到。

——— 結語 ———

以模仿Klippel量測為範本的IMD模型來體驗聽感,真實樂曲相較單純正弦波,要辨別差異更有難度。真實樂曲就算頻譜已有明顯差異,失真度不夠大則仍難以區別。就聽感而言,正弦波測試還比真實樂曲更嚴格。
570
570

提問與結語鞭辟入裡,樓主是個狠人。

2024-11-18 2:01
  • 19
內文搜尋
X
評分
評分
複製連結
請輸入您要前往的頁數(1 ~ 19)
Mobile01提醒您
您目前瀏覽的是行動版網頁
是否切換到電腦版網頁呢?