心理聲學

跳轉到: 導航, 搜索

心理聲學 一詞似乎很令人費解,其實很簡單,它就是指「人腦解釋聲音的方式」。壓縮音頻的所有形式都是用功能強大的演算法將我們聽不到的音頻信息去掉。例如,如果我扯著嗓子喊一聲,同時輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區別。

心理聲學模型是對人聽感的統計性質的數學表述模型,它解釋人各種聽感的生理原理。

心理聲學模型可以在主觀聽感劣化不多的條件下,大大降低數字音頻信號傳輸的頻寬。它主要基於人的聽覺器官的生理結構和感知模式,通過對數字音頻信號的相應處理,去除不可聞的信號成分及引入不可聞的畸變,達到普通熵編碼無法達到的壓縮比率。

由於人耳聽覺系統複雜,人類迄今為止對它的機理和聽覺特性的某些問題總是還不能從生理解剖角度完全解釋清楚。所以,對人耳聽覺特性的研究目前僅限於在心理聲學和語言聲學內進行。人耳對不同強度和不同頻率聲音的一定聽覺範圍稱為

聲域。在人耳的聲域範圍內,聲音聽覺心理的主觀感受主要有響度、音高、音色等特徵和掩蔽效應、高頻定位等特性。其中響度、音度、音色可以在主觀上用來描述具有振幅、頻率和相位三個物理是的任何複雜的聲音,故又稱為聲音「三要素」;而對於多種音源場合的人的耳掩蔽效應等特性尤為重要,它是心理聲學的基礎。

心理聲學的幾個基本概念

1、等響度曲線

人的聽覺的靈敏度隨著頻率而改變。即通常兩個功率一樣但頻率不同的音調聽起來並不一樣響。通過等響度曲線,我們可以看出,人耳對4KHz的頻率最靈敏,即在4KHz下能被察覺出來的聲音壓力水平(響度),在其他頻率下並不能被察覺。這就給在一些不太靈敏的頻率下失真提供了條件。

2、屏蔽

我們上高中物理時學過屏蔽。就是強的聲音信號把弱的聲音信號覆蓋,導致我們無法察覺。而且,當兩個聲音在時間和頻率上很接近時,屏蔽效應就會很強。因此,我們可以在編碼時對被屏蔽的部分不編碼、不傳送。這樣,音質依然沒有大的損失,人耳也不易察覺。

3、臨界頻帶

對於人類的聽覺來說,對聲音的感知特性並不是以線形頻率為尺度來變化的(人的聽覺還沒那麼好),而是可以用被稱為臨界頻帶的一系列有限的頻段來表達。簡單的說,把整個頻帶劃分成幾段,在這每個頻段里,人耳的聽覺感知是相同的,即心理聲學特性都是一樣的。

關於「心理聲學」的留言: Feed-icon.png 訂閱討論RSS

目前暫無留言

添加留言

更多醫學百科條目

個人工具
名字空間
動作
導航
功能菜單
工具箱