售前電話
135-3656-7657
售前電話 : 135-3656-7657
話音編碼的要求可用編碼器屬性(attribute)來表示,主要屬性有比特率、時延、雜復(fù)度和話音質(zhì)量4項(xiàng)。在具體實(shí)現(xiàn)中,這些屬性往往是有矛盾的,因此必須根據(jù)實(shí)際應(yīng)用進(jìn)行取舍,對各個屬性提出折衷的要求,從而確定合適的編碼方法。
比特率
降低比特率往往是話音編碼的首要目標(biāo),它直接關(guān)系到傳輸資源的有效利用和網(wǎng)絡(luò)容量的提高。根據(jù)比特率和輸入話音的關(guān)系可將編碼器分為兩類:固定比特率和可變比特率編碼器。
現(xiàn)有大部分編碼標(biāo)準(zhǔn)都是固定比特率編碼,其范圍為0.8-64kbit/s。其中,保密電話的比特率最低,為0.8-4.8kbit/s,其原因是它的通信信道帶寬限定為4.8kbit/s以下。數(shù)字蜂窩移動電話和衛(wèi)星電話的編碼器比特率為3.3-13kbit/s,它使數(shù)字蜂窩系統(tǒng)的容量可達(dá)模擬系統(tǒng)的3-5倍。需要注意的是,蜂窩系統(tǒng)中常伴有信道編碼,使總的比特率可達(dá)20-30kbit/s。實(shí)際情況往往是根據(jù)規(guī)定的無線信道比特率確定話音編碼和信道編碼的比特率劃分。普通電話網(wǎng)的編碼速率則為16-64kbit/s。其中,特別的有一類編碼器稱為闊帶(wideband)編碼器,其比特率為48/56/64kbit(s用于傳送50Hz-7kHz的高質(zhì)量音頻信號,主要應(yīng)用于會議電視系統(tǒng)。
可變比特率編碼是近年來出現(xiàn)的新技術(shù)。根據(jù)統(tǒng)計(jì),兩方通話大約只有40%的時間是真正有聲音的,因此一個自然的想法是采用通/斷二狀態(tài)編碼。通狀態(tài)對應(yīng)有聲期,采用固定比特率編碼;斷狀態(tài)對應(yīng)尤聲期,傳送極低比特率信息(如背景噪聲特征),甚至不傳任何信息。更復(fù)雜的多狀態(tài)編碼還可根據(jù)網(wǎng)絡(luò)負(fù)荷、剩余存儲容量等外部因素調(diào)整其比特率。可變比特率編碼主要包含兩個算法。一是有聲檢測(VAD-VoiceActivityDetection),主要用于確定輸入信號是話音還是背景噪聲,其難點(diǎn)在于正確識別話音段的起始點(diǎn),確保話音的可懂度。二是舒適噪聲生成(CNG-omfortableNoiseGeneration),主要用于接收端重建背景噪聲,其設(shè)計(jì)必需保證發(fā)送端和接收端的同步??勺儽忍芈示幋a的典型應(yīng)用是數(shù)字電路倍增設(shè)備、非實(shí)時的話音存儲和CDMA移動通信系統(tǒng)。
目前IP網(wǎng)絡(luò)電話一般采用5~16khit/s固定比特率的中低速率編碼器,其效率顯著高于傳統(tǒng)的PCM編碼,復(fù)雜度又較可變比特率編碼簡單。未來發(fā)展將采用VAD技術(shù)進(jìn)一步降低比特率,以減小網(wǎng)絡(luò)電話,尤其是網(wǎng)絡(luò)多媒體通信的成本。
網(wǎng)絡(luò)時延
話音編碼器時延由以下4個部分組成:
(1)算法時延。編碼器通常都是根據(jù)一定數(shù)量的采樣值生成話音編碼的,這些值的集合稱之為一幀。某些算法還需要知道下一幀的部分?jǐn)?shù)據(jù),稱之為“前視"(Lookahead)。因此,算法時延就等于幀長和前視長度之和,其值完全取決于算法,和具體實(shí)現(xiàn)無關(guān)?! τ赑CM編碼來說,其值為125阻。對于低速率編碼來說,其典型值為20~30ms。
(2)計(jì)算時延。即編碼器分析時間和解碼器重建時間,其值取決于硬件速度。通常可認(rèn)為計(jì)算時延等于或略小于幀長,以確保下一幀數(shù)據(jù)到齊后,當(dāng)前幀已處理完畢。
算法時延和計(jì)算時延之和稱為單向編譯碼器時延。
(3)復(fù)用時延。即裝配時延。編碼器發(fā)送之前和解碼器解碼之前,必需將整個數(shù)據(jù)塊的所有比特都裝配好。
(4)傳輸時延。其值離散性很大,取決于是采用專用線還是共亨信道。對于共享信道而言,常假設(shè)傳輸時延和復(fù)用時延之和約為1個幀長。
上述4部分時延之和稱為單向系統(tǒng)時延,粗略估計(jì)至少為3個幀長3話音通信對于時延有較高的要求。對f交互式通話來說,單向時延大于150ms就可感受到通話連續(xù)性受到影響,最大可容忍時延可為400-500ms,超過此值只能進(jìn)行半雙工通信。對于具有回聲的情況,單向時延不能超過25ms,否則就需裝備回聲抑制功能。
需要指出的是,單向系統(tǒng)時延不單決定于話音編碼,它還與網(wǎng)絡(luò)環(huán)境等多種外部條件有關(guān)。對于不同的系統(tǒng),即使采用相同的編碼器,其系統(tǒng)時延也會有很大的差異。以電路倍增系統(tǒng)和蜂窩電話系統(tǒng)為例,兩者采用相同的話音編碼器,幀長20ms,前視長度5ms。在蜂窩系統(tǒng)中,每個手機(jī)裝備1個數(shù)字信號處理器(DSP),處理1個編碼器。其算法時延為25ms,計(jì)算時延為20ms,得單向編譯碼時延為45ms。又設(shè)傳輸和復(fù)用時延為20ms,若為H本或北美TOMA系統(tǒng),每載波3個用戶,則每路編碼的傳輸時延為6.67ms。另,為了減小衰落影響,系統(tǒng)信道采用二幀交織編碼,由此引入附加傳輸時延20ms。由此得該蜂窩系統(tǒng)的單向時延為45+6.67+20=71.69ms。在4倍增電路設(shè)備中,設(shè)4個群路編碼器共用1個DSP。算法時延25ms,計(jì)算時延20ms,折算到每群路為5ms,得單向編譯碼時延為30ms。又設(shè)復(fù)用和傳輸時延為20m'l,折算到每路為20/120=0.2ms。由此得該系統(tǒng)的單向時延僅為30.2ms。