售前電話
135-3656-7657
售前電話 : 135-3656-7657
波形編碼的基本出發(fā)點(diǎn)是最小化原信號(hào)和重構(gòu)信號(hào)之間的差值信號(hào),最小化判據(jù)一般為以"塊”為基礎(chǔ)的差分信號(hào)的均方差,塊可以小到單個(gè)話音抽樣。波形編碼的設(shè)計(jì)要求是獲得盡可能高的信噪比(SNR)。改進(jìn)的編碼器還考慮人類(lèi)聽(tīng)覺(jué)系統(tǒng)的主觀感覺(jué)效果,為此可設(shè)置屏蔽濾波器,修正原信號(hào)和重構(gòu)信號(hào)。這樣SNR有可能下降,但主觀感覺(jué)質(zhì)量反而會(huì)提高。波形編碼器主要利用話音波形的短時(shí)相關(guān)性,特別是相鄰抽樣點(diǎn)之間的相關(guān)性來(lái)降低比特率,改進(jìn)算法還考慮了長(zhǎng)時(shí)相關(guān)性。
參數(shù)編碼的基本出發(fā)點(diǎn)是根據(jù)確定的成音模型確定模型參數(shù),雖然LPC聲碼器也是通過(guò)殘差信號(hào)的最小化進(jìn)行計(jì)算的,但是其著眼點(diǎn)是要求模型參數(shù)的最佳值,而并非SNR的最大化。
參數(shù)編碼的精度主要取決于模型本身的正確性。圖3.12所示的話音生成數(shù)字模型和實(shí)際情況還是有差距的。例如,模型采用清/濁音二元判決,也就是說(shuō)任一時(shí)刻的話音或者是純粹的清音,或者是純粹的濁音,實(shí)際情況并非完全如此,尤其是從一個(gè)音素到另一音素轉(zhuǎn)換的過(guò)渡階段比較復(fù)雜, 理論上應(yīng)采用多元判決。模型中激勵(lì)源只有兩個(gè),每次只能產(chǎn)生一種音,但實(shí)際話音有許多部分的頻譜呈諧波頻譜和噪聲譜的組合頻譜。模型假設(shè)濁音激勵(lì)是規(guī)則的周期脈沖,這也是對(duì)實(shí)際情況的一種理想化近似。另外,模型參數(shù)是按照幀周期進(jìn)行更新調(diào)整的,對(duì)于爆破音等快速變化音素的編碼來(lái)說(shuō)就有較大的誤差。凡此決定了參數(shù)編碼的固有誤差,這是由模型本身所限定的,尤論怎樣增加參數(shù)的編碼比特率,減小量化誤差,都不能使重構(gòu)信號(hào)收斂于原信號(hào)。而波形編碼則不一樣,理論上只要預(yù)測(cè)階數(shù)足夠高,量化誤差足夠小,重構(gòu)信號(hào)將收斂于原信號(hào)。這是兩種編碼方式的顯著不同之處,這一概念可由圖3.15表示。但是參數(shù)編碼的一個(gè)重要優(yōu)勢(shì)是可以有效降低編碼比特率,從而得到越來(lái)越廣泛的應(yīng)用。
參數(shù)編碼標(biāo)準(zhǔn)
有影響的話音參數(shù)編碼國(guó)際標(biāo)準(zhǔn)和地區(qū)性標(biāo)準(zhǔn)主要由ITU-T和數(shù)字蜂窩標(biāo)準(zhǔn)組織制訂,其特性如表3.4所示。它們采用的都是線性預(yù)測(cè)編碼器和碼本激勵(lì)矢量量化技術(shù)。IP網(wǎng)絡(luò)電話應(yīng)用主要使用ITU定義的三個(gè)標(biāo)準(zhǔn)。G.728比特率為16kbit/s,標(biāo)準(zhǔn)研究始于1988年,其目的是建立
一個(gè)通用的16kbit/s長(zhǎng)途質(zhì)量的話音編碼標(biāo)準(zhǔn)。它的第一個(gè)應(yīng)用是H.320低比特率可視電話。G.728對(duì)具有背景噪聲的信號(hào)或音樂(lè)具有很好的健壯性,抗隨機(jī)比特差錯(cuò)能力優(yōu)于G.711和G.721,可通過(guò)所有的網(wǎng)絡(luò)信令音,還能通過(guò)高達(dá)2400bit/s的低比特率modem信號(hào)。
CELP:碼激勵(lì)線性預(yù)測(cè)RPE-LTP:規(guī)則脈沖激勵(lì)一長(zhǎng)期預(yù)測(cè)TIA:電信工業(yè)協(xié)會(huì)RCR:無(wú)線電系統(tǒng)研發(fā)中心
G.729比特率為8kbit/s。最初由ITU-R提出此項(xiàng)研究,其目的是用于第三代移動(dòng)通信系統(tǒng)。G.729A是G.729的DSVD(話音和數(shù)據(jù)同時(shí)傳送數(shù)字系統(tǒng))型式。與G.729比特流兼容,即它們的編碼都能被對(duì)方的解碼器接收重建信號(hào)。但G.729A的復(fù)雜度降低了50%,代價(jià)是在某些運(yùn)行條件下性能稍有下降。
G.723.1為雙速率話音編碼器,作為PSTN上可視電話標(biāo)準(zhǔn)系列中的話音編碼標(biāo)準(zhǔn)。其中,6.3khit/s比特率采用多脈沖LPC編碼,對(duì)于一般的話音信號(hào),其話音質(zhì)量相當(dāng)于G.721,但對(duì)于童聲、音樂(lè)和具噪聲背景的話音輸入,其質(zhì)量不如ADPCM。5.3kbit/s比特率采用多脈沖算術(shù)碼本激勵(lì),定義該速率的目的是增加系統(tǒng)設(shè)計(jì)的靈活性。如用于低速率通道時(shí),可為視頻編碼器留出一些比特空間;可為復(fù)用系統(tǒng)提供lkhit/s的“虛信道”以傳送附加信息。該標(biāo)準(zhǔn)確定重用編號(hào)G.723,但增加一層子序號(hào)以區(qū)別于被G.726取代的原來(lái)的G.723。