400-012-8816

服務(wù)支持

Service support

【名詞解釋】數(shù)字音頻
發(fā)布日期:2019-2-28   點(diǎn)擊次數(shù):

數(shù)字音頻是通過(guò)電腦以及數(shù)字設(shè)備等方式來(lái)表示模擬信號(hào),并將其進(jìn)行錄制、回放的一種方法。與視頻的幀類似,數(shù)字音頻也是由一系列的采樣樣本組成的,聲音的回放其實(shí)就是這些樣本序列的再構(gòu)成。數(shù)字音頻有許多不同的格式,不同格式的數(shù)字音頻則是有著不同的保真度和動(dòng)態(tài)范圍。


數(shù)字音頻本質(zhì)上來(lái)講是有限的。聲學(xué)聲音和模擬信號(hào)都是由實(shí)際存在的、流動(dòng)著的波形構(gòu)成的,而數(shù)字信號(hào)則是實(shí)際存在著的物體的近似值。就像由無(wú)數(shù)的幀組成的視頻一樣,數(shù)字音頻也是由一系列的采樣樣本構(gòu)成的。


本文將會(huì)著重介紹脈沖編碼調(diào)制(PCM),這是最常用的數(shù)字音頻編碼系統(tǒng)。而其他的系統(tǒng),諸如DTS以及杜比數(shù)字等,則在電影和技術(shù)行業(yè)更為常用。


數(shù)字音頻編碼系統(tǒng)

Avid Pro Tools


在PCM音頻系統(tǒng)中,信號(hào)每秒被多次采樣,每個(gè)采樣都記錄了某一特定時(shí)刻波的振幅。由于模擬波形并不能被完美無(wú)缺地重建,因此每個(gè)采樣都是取的近似值。而當(dāng)這些樣本按順序播放時(shí),便可以準(zhǔn)確地重新再現(xiàn)聲音。


與模擬音頻中用頻率和振幅兩個(gè)要素來(lái)定義聲音一樣,數(shù)字音頻也有兩個(gè)主要的參數(shù):采樣率和位深度。采樣率指的是聲音每秒被采樣的次數(shù),而位深度指的則是每個(gè)采樣所能夠捕獲的動(dòng)態(tài)范圍量。


CD的標(biāo)準(zhǔn)采樣率為44.1kHz,看上去這個(gè)數(shù)字好像是一個(gè)很隨機(jī)的選擇,但是其實(shí)根據(jù)奈奎斯特的香農(nóng)采樣定理,采樣率必須要高于捕獲最高頻率的兩倍。而人耳的聽(tīng)覺(jué)上限是20kHz,因此需要大于40kHz的采樣率才能捕獲整個(gè)范圍(而額外的4.1kHz則是為了避免一種名為“混疊”的失真現(xiàn)象)。


理論上,44.1kHz的采樣率已經(jīng)足夠我們準(zhǔn)確地再現(xiàn)任何聲音了,但是還是有更高的采樣率的存在。


另一種最為常見(jiàn)的采樣率便是48kHz,它是電影以及視頻聲音的主要標(biāo)準(zhǔn)。這是因?yàn)樗脑O(shè)計(jì)與現(xiàn)有的每秒24幀的電影幀速率標(biāo)準(zhǔn)相互集成。而與奈奎斯特頻率類似,24幀是剛好可以使得一系列圖像看起來(lái)像是流暢的運(yùn)動(dòng)圖像的神奇數(shù)字。


而音頻采樣率必須要是幀速率的倍數(shù),才能保持同步,44.1kHz會(huì)隨著時(shí)間的推移而導(dǎo)致明顯的音畫(huà)不同步現(xiàn)象,因此48kHz的采樣率最為合適。


更高的采樣率也被廣泛使用,但這些采樣率的必要性卻飽受爭(zhēng)議。支持者稱超高頻率的采樣率巧妙增加了保真度,并為信號(hào)添加了“味道”;而反對(duì)者則認(rèn)為,44.1已經(jīng)足夠,而且采樣率越高,文件大小也會(huì)越大,并且在抖動(dòng)到較低采樣率時(shí),會(huì)無(wú)可避免地產(chǎn)生“偽陰影”。


這些更高的采樣率通常都是44.1或者48的倍數(shù),例如88.2、96以及192kHz都是現(xiàn)代設(shè)備和軟件中常用的采樣率選項(xiàng)。

數(shù)字音頻圖


比特深度決定了文件的動(dòng)態(tài)分辨率,類似數(shù)碼照片那樣。每個(gè)“比特”可以傳送4個(gè)振幅數(shù)值(兩個(gè)正值兩個(gè)負(fù)值),因此每個(gè)樣本所含的比特越多,也就代表著動(dòng)態(tài)范圍越大。


這并不意味著,比特深度越高,音量就會(huì)越大;但是,更高的比特深度聽(tīng)起來(lái)會(huì)更加真實(shí),因?yàn)樗鼈兛梢宰龅礁訙?zhǔn)確地再現(xiàn)聲音(就好比高分辨率的照片)。以下是常見(jiàn)采樣率及其統(tǒng)計(jì)數(shù)據(jù)的概述:


4-bit:16個(gè)數(shù)值,24dB的動(dòng)態(tài)范圍。有時(shí)也會(huì)用于極低保真的“bitcrushed”效果器上。


8-bit:256個(gè)數(shù)值,48dB的動(dòng)態(tài)范圍。經(jīng)常用于早期的經(jīng)典的視頻游戲系統(tǒng)。


16-bit:65536個(gè)數(shù)值,96dB的動(dòng)態(tài)范圍,CD音頻的標(biāo)準(zhǔn)比特深度。


24-bit:16777216個(gè)數(shù)值,145dB的動(dòng)態(tài)范圍,最常用的比特深度。


32或者 64-bit:“浮點(diǎn)”,目前可以做到提供最佳信噪比的數(shù)值,但是尚未被廣泛采用。


PCM音頻可以為用戶提供多種格式的編碼,這些格式分為兩大類:有損和無(wú)損。無(wú)損格式完美保留了錄制時(shí)捕獲的任何信息,但會(huì)占用較大的硬盤(pán)空間。


有損格式會(huì)創(chuàng)建壓縮文件(注意,數(shù)據(jù)的壓縮和音頻的“壓縮”是不一樣的),有損格式的文件占用的硬盤(pán)空間會(huì)明顯減少,但是同樣會(huì)犧牲一部分音質(zhì),甚至?xí)a(chǎn)生“偽陰影”。以下是常用的文件格式的概述:


無(wú)損格式

WAV (波形音頻文件格式):錄音設(shè)備在錄制原始未壓縮音頻文件時(shí)的常用格式。廣播WAV文件(.BWF)可以存儲(chǔ)大量的額外元數(shù)據(jù)。


AIFF(音頻交換文件格式):和WAV相似,是apple設(shè)備專用格式。


FLAC(免費(fèi)無(wú)損音頻編解碼器):一種開(kāi)源格式,可以在不犧牲音質(zhì)的前提下對(duì)文件進(jìn)行壓縮,但是并非所有播放器都支持。


ALAC(Apple無(wú)損音頻編解碼器):效率略遜色于FLAC,Apple設(shè)備專用。


有損格式

mp3(Mpeg音頻層III)迄今為止最常見(jiàn)的壓縮文件格式,在便攜式音樂(lè)播放器問(wèn)世時(shí)得到普及。


AAC(高級(jí)音頻編碼)一種旨在提高mp3質(zhì)量的替代方案。


OGG (Ogg Vorbis)維基百科、Spotify 以及某些視頻游戲的開(kāi)源替代品,但是個(gè)人用戶使用并不方便。(有趣的是,Vorbis其實(shí)是Terry Pratchett筆下的Discworldbook系列中的一個(gè)登場(chǎng)角色。)

分享:

產(chǎn)品推薦

相關(guān)文章

更多動(dòng)態(tài)>>