PCM格式: Pulse Code Modulation 脈沖編碼調(diào)制,它將聲音模擬信號采樣后得到量化后的語音數(shù)據(jù),是基本原始的一種語音格式。同它極為類似的還有RAW格式和SND格式。它們都是純語音格式。
WAV格式:Wave Audio Files 是微軟公司開發(fā)的一種聲音文件格式,也叫波形聲音文件,被Windows平臺及其應(yīng)用程序廣泛支持。WAV格式支持許多壓縮算法,支持多種音頻位數(shù)、采樣頻率和聲道,但WAV格式對存儲空間需求太大不便于交流和傳播。WAV文件里面存放的每一塊數(shù)據(jù)都有自己獨(dú)立的標(biāo)識,通過這些標(biāo)識可以告訴用戶究竟這是什么數(shù)據(jù),這些數(shù)據(jù)包括采樣頻率和位數(shù),單聲道(mono)還是立體聲(stero)等。
ADPCM格式:是利用對過去的幾個(gè)抽樣值來預(yù)測當(dāng)前輸入的樣值,并使其具有自適應(yīng)的預(yù)測功能與實(shí)際檢測值進(jìn)行比較,隨時(shí)對測得的差值自動(dòng)進(jìn)行量化級差的處理,使之始終保持與信號同步變化。它適用于語音變化率適中的情況,而且聲音回放過程簡短。它的優(yōu)點(diǎn)是對于人聲的處理比較逼真,一般達(dá)到90%以上,已廣泛地應(yīng)用于電話通信領(lǐng)域。
MP3格式: Moving Picture Experts Group Audio Layer III,簡稱為MP3。它是利用 MPEG Audio Layer 3 的技術(shù),采取了名為"感官編碼技術(shù)"的編碼算法:編碼時(shí)先對音頻文件進(jìn)行頻譜分析,然后用過濾器濾掉噪音電平,接著通過量化的方式將剩下的每一位打散排列,后形成具有較高壓縮比的mp3文件,并使壓縮后的文件在回放時(shí)能夠達(dá)到較接近原音源的聲音效果。它的實(shí)質(zhì)是vbr(Variant Bitrate 可變波特率)可以根據(jù)編碼的內(nèi)容動(dòng)態(tài)地選擇合適的波特率,因此編碼的結(jié)果是在保證了音質(zhì)的同時(shí)又照顧了文件的大小。
mp3壓縮率10倍甚至12倍。是初出現(xiàn)的一種高壓縮率的語音格式。
Linear Scale格式:根據(jù)聲音的變化率大小,把聲音分成若干段,對每段用線性比例進(jìn)行壓縮,但是它的比例是可變的。
Logpcm格式:基本上對整個(gè)聲音進(jìn)行線性壓縮,將后若干位去掉。這種壓縮方式在硬件上很容易實(shí)現(xiàn),但音質(zhì)比Linear Scale差一些,特別是音量較小聲音比較細(xì)膩的情況下效果較差。主要用于pure speech方面。