
接下來就可以拿Mora上下載的檔案進行聽感實驗了。

先來看看Mora上的「09 交響曲 宇宙戦艦ヤマト 第四楽章 明日への希望 _ドッペルコンチェ」這首,CD檔與96k檔有什麼不同:

這首24bit/96k檔在20kHz以上,有很平順的能量向高頻展開,不像是由低頻硬升頻上去的曲子,常會看到有明顯的鏡像現象。原生96k sample rate的頻譜相當漂亮療癒
。CD版本就很明顯在20kHz有個斷崖,之上就一點訊號都沒有。20kHz以下跟96k版本很像,將頻譜相減得到最下圖。
很特別的是竟然呈現藍色,也就是CD的能量(音量)比較低。將Y軸頻率改成log scale如下:

頻率響應的差異量其實並不大,由差異顏色看來不到1dB。更神奇的地方是「差異不均勻」,甚至有些時候100Hz以下頻段差異呈現紅色,表示有時候強有時候弱。
平均來看CD與96k兩者的頻率響應差異:

在100Hz以上,CD的音量小了約0.25dB,且在300~400Hz左右有個怪怪的起伏。想不透CD版本在後製時,被動了什麼手腳。
但其實 0.25dB的差異並不大,是否會影響聽感呢?接下來就要來試試了。
在另一動大樓中的這篇:「實測24kHz以上影響聽感?」也談過,DAC的演算法也可能會影響聽感。比較CD(44.1k sample rate)與96k sample rate檔案聽感,除了本身檔案的差異外,還引入DAC數位轉類比的數位演算法及類比電路架構的操作不同。
為了控制變因只留下檔案內音訊成份差異,去除DAC相關軟硬體差異,目前選擇的做法A是先將CD升頻到96k,使兩者在檔案格式上相同。升頻指令如下:
ffmpeg -y -i mora_CD.flac -af aresample=96000:resampler=soxr:precision=33 -c:a pcm_s24le mora_CD_96k.wav
如此一來DAC工作模式沒有差異,少了一個變數。二來檔案大小也都相同,做盲測時也比較不會不小心看到答案
。做法A:
我會準備12個檔案:原始96k檔,CD轉96k檔,10個亂數產生檔。您可以下載聆聽紀錄這10個分別是哪個來源,再回私訊給我對答案。要怎麼聽、來回重複播放幾次等等,都沒限制。
做法B:
與A類似,但使用網頁ABX測試,
。網頁的問題在於經過作業系統底層音訊處理,比較難知道及控制中間被做了什麼轉換。但很適合做相對比較,因為作業系統底層在測試期間並不會改變,若是有明確差異,最容易克服聽覺記憶困難,而辨別出差異。
做法A1:
與A相似產生10個檔,但CD檔換成96k檔拿掉20kHz以上成份。


FFmpeg同樣選用sox演算法,頻率響應完全平直,超過20kHz的高頻也濾掉一乾二淨。換成時域上看也很有趣:

拿掉20k以上頻率成份會讓波形少了高頻毛躁的起伏,看起來還稍微平順些呢。

做法B1:
與B相似網頁ABX測試,但CD檔換成96k檔拿掉20kHz以上成份。
做法A2:
與A類似10個檔,但反過來將96k降頻到CD,與原始CD檔比較。讓DAC保持操作在一樣的44.1k不變。
做法B2:
與B相似網頁ABX測試,但反過來將96k降頻到CD與原始CD檔比較。
做法C:
其實這會最接近一般使用者實際情境,但不同的DAC處理不同sample rate的演算法及硬體不同,除了檔案之外,又引入第二個變數。
我會準備20個檔案,分別是10個原始96k檔,10個原始44.1k CD檔。您可自行用習慣的軟體,編排成20首playlist,使用亂序播放聽前10首,這樣的目的是讓自己不知道這10首中,有幾首是96k的,幾首是CD。但要避免自己不小心看到機器或手機介面訊息,別洩了題就是了。
不用太在意您的系統是否能播放出超音波成份。研究96k取樣率,對於20k以內訊號的正確性是否產生聽感影響,也是個有趣的題目。聽或聽不出來也不用太糾結,畢竟每個人的系統及聽力也都不一樣。
除了原本PL_2025大文章分享過的0:00-0:20這一段,在與他請益過程中,新增推薦3:33-3:54這段。
「這一段是小提琴搭配鋼琴後來搭配管絃樂的段落,可以測小提琴和三角鐵的高頻延伸」PL_2025大這麼形容。
這段一開始以提琴婉約輕語,似乎隱藏著擔心與思念。接著情緒波動傾盆而出,低音鼓像是呼應著提琴的情感,滿滿的覆蓋著、安慰著。背景很輕但又不能忽略的三角鐵聲,卻又提醒著時間飛快流逝。到3:54其實還沒過癮,接著完整聽完真的很享受。
會讓我想到「銀河英雄傳說」的「跨越光之橋」這首歌。所有的困難與深鎖的情感,就在那句「心をはだかにして」歌詞後全部宣洩出來。
若有興趣體驗測試的朋友請私訊或回文,會將A、B、C幾個測試方法的下載連結私訊提供給您。不用所有項目全測啦
,可挑個有興趣的測試項目來聽就好。歡迎一起來試試吧。

sem921431118 wrote:
聽a1 氣勢有差 但那不是物質的聲音 96k 會強點 整體氣勢 感覺...(恕刪)
這真的是非常關鍵性的結果。太棒了!sem921431118馬上就測完確認A1是聽的出來的,我也對過了他的答案,完全正確!

A: 無法辨別
A1: 盲測可以辨別
A2: 無法辨別
C: 非盲測,可辨別
這給了我一個很好的提示,將試著進一步找找,究竟影響聽感的關鍵因素是什麼?

A vs A1:
A是CD升頻96k,A1是硬把20k以上頻率成份去掉。實際上我的做法細節是先降頻到44.1k,再升頻回96k。利用這方式拿掉20kHz以上能量成份。
非常懷疑是這個做法造成的效應,或許改成設計filter來濾波看看,這方面還要再好好研究一下。
A2 vs A1:
A2把96k降頻到44.1k CD的取樣率,就沒升頻回去了。這樣就和原始CD檔分不出來。
綜合以上推敲,最可能的關鍵是96k降頻再升頻回去的動作,不知造成了什麼差異影響了聽感。
C:
如同先前所述,C包含了兩個變數:檔案內涵差異,以及DAC對不同取樣率演算法及硬體差異。也許有些人的DAC無法區分,也許有些人像是sem921431118大一樣可辨別,都是合理的。這方面就要對DAC輸出錄音,才能有進一步的分析了。
——————
暫時的推論:
有無超音波似乎不是重點,升頻演算法可能扮演著更關鍵的角色。看來會有好些功課要做做了
。再次謝謝sem921431118大這麼棒的觀察與回應!
——————————
在尋找到底什麼是造成A1聽感可辨別的原因時,我觀察了這些檔的頻譜。

利用REW讀入檔案,觀察20kHz附近頻譜(1/48 smoothing後較易判讀)。發現 A1:升降頻處理拿掉20kHz以上能量(紅線),跟A:CD(橘線)有兩個差異:A1降得更陡、更深。
因此好奇,若是用類似橘線CD的方式濾波,不做A1降升頻的動作,會不會有什麼差異呢?因此利用了python的數學函數庫scipy.signal.butter,來設計filter。最後以cutoff 20.6kHz, 35 order的Butterworth filter,造出了A3(如上藍線)。
A3的頻率響應如下,就是一個非常陡的低通濾波器。

使用它濾波的效果如下:

A1是幾乎完美的保留了原始96k檔的20kHz以下資訊,但使用Butterworth filter的A3,雖然達成了移除20kHz以上頻率成份的任務,但對於20kHz以下還是造成了影響。只是影響的地方在原本能量就較低地方,也就是底噪長相與原始96k不同(是不同,並非比較大)。
即使在A3相對上在頻譜圖分析上,還差異比較多的情形下,對聽感上造成的差異會是如何呢?
—————— 實驗結果 ——————
非常感謝sem921431118大熱心的再幫忙聽了A3。
結果:
A3: 6/10正確率,可辨別的信心度不足
這個結果代表著如同A實驗CD的濾波方式,A3一樣較難以辨別出差異。因此可以推測不是超音波拿不拿掉的問題。
不只聽了A3,sem921431118大也重複再聽了一次A1(A1-1: 檔案再亂序排列一次),結果是9/10正確率。
A1總計:19/20正確率
這樣的正確率下,A1可辨別信心度非常非常高。以sem921431118大使用耳機mdr-1A(3~100khz的頻段)來聽的經驗,在3:33-3:54秒的測試中,其中14~15秒區間較容易區別。
既然濾波斜率不是關鍵,剩下的一個謎是:「濾波後餘留的超音波底噪」。如下圖:

A1最後剩下的底噪比起A, A3要低了40dB。這會是影響聽感的關鍵嗎?還是另有其他原因呢?
—————— 延伸實驗 ——————
接下來因應此觀察,設計了兩個實驗。

A4:
與A1同樣做降升頻動作。但降頻時,同時把bit數降到16 bit與CD一樣。這樣升頻回96k時,就得到20kHz以上頻率,跟CD升頻一樣的底噪。
A5:
不做降升頻動作,改用FFT low pass filter by Blackman window。結果會得到下降斜率接近於A1的結果,且維持20kHz以上頻率的底噪與A1相同。
若A4聽不出差異,則關鍵因素與降升頻動作無關,只與20kHz以上殘餘底噪有關。同時若A5仍聽到差異,同樣證明與降升頻動作無關。結案
。但若A4仍有差異,但A5卻無差異。則聽感差異是降升頻造成
。要再進一步研究降升頻到底動了什麼?若非以上兩種情形,就會陷入更深的謎團。引發聽感差異的原因可能不只單一項目。得再想想還能怎麼追下去了。

——————————
若是您也有興趣一起探索的話,請留言或私訊,會將檔案連結寄給您喔。

這個filter會在20kHz以上boost到+20dB。謝謝sem921431118大的建議,為求更明顯可辨,也會用+40dB的方式也來試試。
頻譜圖可以很容易看出其效果:
原始:

+20dB:

+40dB:

可以看到20kHz~40kHz有多強烈被拉高能量。
對照組:將20kHz以上高頻拿掉:


在這麼大的差異下,使用宇宙戰艦大和號第九首的3:33秒處。這是sem921431118大能辨別出差異的段落,可惜我仍然聽不出差異。
若有興趣也想嘗試看看這段的話,可私訊我或留言,會將連結寄給您。
Esoteric N-01XD SE > Siltech 680i XLR > AQ C2850 > Siltech 680i XLR > AQ A80 > B&W 803D2.
電源線:
Esoteric N-01XD SE: Accuphase APL-I,
AQ C2850: Furutech DPS-4.1,
A80: TcM Golden Signature Plus
test333 A:
(1) mora-96KHz: 小提琴尾韻長 "伊伊伊伊". 03-04 秒小提琴拉高音時有共鳴感, 聽得出拉高時的層次感. 大提琴聲線清楚不會糊.
(2) mora-CD-96K: 小提琴尾韻變短 "伊伊", 水份變乾. 03-04 秒拉高音無共鳴感, 層次感減少, 大提琴聲線開始糊.
(3) mora-96K NO 20k: 小提琴尾韻變短 "伊伊", 音色變較硬/粗, 03-04 秒高音變低, 無共鳴感, 節奏速度加快.
(4) mora-96K-CD/mora-CD: 同 (2) 的缺點 + 11-18 秒黑管聲變糊.
====================
自選試聽曲 Dinna Krall 專輯 Turn Up The Quiet 的 Like Someone in Love,
來自 NativeDSD 發行的 DSD128(5.6MHz), 與 Qobuz 192Khz-24bit.

DSD128 在人聲方面, 磁性豐富, 尾音餘韻明顯, 細微的吞嚥/換氣聲都清晰可聞.
前奏的大提琴撥弦聲, 音色較佳, 餘韻較多且有力量感.
中段加入各式樂器. 其層次感, 空間定位感, 與各樂器音間的分離度, 明顯較佳.
個人感覺是, DSD128 像在錄音室, 近距離聽歌手對著大型麥克風唱歌. 而 192Khz-24bit 像是演唱會, 一些微小細節消失, 力量感較小. 這邊的力量感是指音質紮實, 頓挫迅速, 不拖泥帶水. 像是花崗岩 vs 紅土磚頭
這篇文章: PCM vs. DSD:再次回顧 說出 DSD128 與 192Khz-24bit 的差異性.
最後, 上述是在我的音響系統+聆聽空間, 所得到的個人比較.
在不同的音響系統上, 比較的差異頗大. 但重點是在於, 系統能否播出更多頻率範圍, 而沒辜負高採樣率的歌曲.
內文搜尋
X



















































































