首頁>>>技術>>>視像通信  視像通信產(chǎn)品

流媒體傳輸?shù)年P鍵問題研究

2007/02/07

   隨著視頻處理技術的發(fā)展,基于流媒體(stream media)傳輸?shù)囊曨l應用得到了迅速的發(fā)展。

  目前,許多實驗性的高速寬帶網(wǎng)絡都把視頻傳輸?shù)募夹g和應用作為研究的重點課題。寬帶網(wǎng)絡的競爭最終將是寬帶應用的競爭,由此誕生的基于中速網(wǎng)絡的流媒體技術正日益受到人們的關注。它推動了互聯(lián)網(wǎng)整體架構的革新,轉(zhuǎn)變了傳統(tǒng)互聯(lián)網(wǎng)呆板的內(nèi)容表現(xiàn)形式,賦予寬帶應用更多的娛樂性和互動性,必將成為未來寬帶網(wǎng)絡的主流技術。

  流媒體依賴的傳輸平臺是IP網(wǎng)絡,由于IP網(wǎng)絡的無連接包轉(zhuǎn)發(fā)機制主要應對突發(fā)性的數(shù)據(jù)傳輸而設計,不適用于對連續(xù)媒體流的傳輸。為了在Internet上有效的、高質(zhì)量的傳輸視頻流,需要多種技術的支持。本文將主要介紹流媒體傳輸中的一些關鍵技術。

一、視頻壓縮處理問題

  目前,視頻流傳輸中最為重要的編解碼標準有國際電聯(lián)的H.261、H.263、H.264,運動靜止圖像專家組的M-JPEG和國際標準化組織運動圖像專家組的MPEG系列標準,此外,在互聯(lián)網(wǎng)上被廣泛應用的還有Real-Networks的RealVideo、微軟公司的WMT以及Apple公司的QuickTime等。其中,Windows Media最新發(fā)布的windows media encoding utility v8.O beta包含了windows media audio 8(音頻)和windows media video 8(視頻)兩部分壓縮編碼系統(tǒng)。windows media video 8采用了的MPEG-4視頻壓縮技術,實現(xiàn)了在500kbps傳送速率下提供接近于dvd質(zhì)量(near-DVD quality)的畫面(分辨率640×480,每秒24幀)。Windows media video 8為電影在線下載觀看做了優(yōu)化,支持true-vbr(真正動態(tài)變量速率編碼)。Real Networks公司最新發(fā)布的real producer 8.5住制作rm文件上采用自己開發(fā)的real g2 codec,它具有很多先進的設計,例如,svt(scalable video technology),雙向編碼(two-encoding)。雙向編碼類似于vbr,它可通過預先掃描整個影片,根據(jù)帶寬的限制選擇最優(yōu)化壓縮碼率。

  ITU-T和ISO兩個國際標準化組織的有關視頻編碼的專家聯(lián)合組成JVT(Joint Video Team,視頻聯(lián)合工作組),其工作目的是制定一個新的視頻編碼標準,該標準能實現(xiàn)視頻的高壓縮比、高圖像質(zhì)量、良好的網(wǎng)絡適應性等目標。目前,JVT的工作己被ITU-T接納,新的視頻壓縮編碼標準被稱為H.264標準,該標準也被ISO接納,稱為AVC(Advanced Video Coding)標準,是MPEG-4的第1O部分。

  H.264比H.263和MPEG-4節(jié)約50%的碼率,而且對網(wǎng)絡傳輸具有更好的支持功能。它引入了面向IP包的編碼機制,有利于網(wǎng)絡中的分組傳輸,支持網(wǎng)絡中視頻的流媒體傳輸。H.264具有較強的抗誤碼特性,可適應丟包率高、干擾嚴重的無線信道中的視頻傳輸。H.264支持不同網(wǎng)絡資源下的分級編碼傳輸,從而獲得平穩(wěn)的圖像質(zhì)量。H.264標準使運動圖像壓縮技術上升到了一個更高的階段,在較低帶寬上提供高質(zhì)量的圖像傳輸是H.264的應用亮點。H.264的推廣應用為流媒體業(yè)務的推廣提供技術保證。

二、媒體同步問題

  在流媒體業(yè)務中需要保持一個數(shù)據(jù)流或者不同媒體流之間的時間關系,即媒體同步是一個重要的要求,包括媒體間同步和媒體內(nèi)同步。因為傳輸?shù)亩嗝襟w信息在時空上都是相互約束、相互關聯(lián)的,多媒體通信系統(tǒng)必須正確反應這種約束關系,以保證聲音與圖像的同步。

  媒體同步通常有三種類型:(1)流內(nèi)(intra-stream)同步;(2)流間(inter-stream)同步;(3)對象間(inter-object)同步。由于網(wǎng)絡時延導致媒體流失步,媒體同步機制可以確?蛻舳苏_地恢復媒體流的同步,即通過某種方式在媒體內(nèi)或者媒體間說明其時間關系。說明時問關系的方法有:基于間隔的方法、基于軸的方法、基于控制流的方法和基于事件的方法。對于連續(xù)媒體,應用最為廣泛的說明方法是基于軸的說明或時間戳。

  目前流媒體同步最主要的技術有:Microsoft的Windows Media Tools、SMIL語言和Microsoft Producer。Windows Media Technology是Microsoft公司提出的在IP網(wǎng)上傳播多媒體流信息的解決方案。整個方案由三個主要部分構成:(1)Media Tools;(2)Media Server:(3)Media Player。SMIL(Synchronized Multimedia Integration Language)通常稱作同步多媒體集成語言,是由3W(World Wide Web Consortium)組織規(guī)定的多媒體操縱語言?梢詫崿F(xiàn)多個流和文本信息在播放時的時間同步控制和空間位置布置。SMIL語言屬于擴展型標記語言XML(Extension Mark-up Language)的范疇,基于XML語法,是一種標記文本語言,包含URL資源管理、基于CSS的頁面編排控制、HTML超媒體鏈接。Microsoft Producer是Microsoft PowerPoint 2002或PowerPoint 2003版的附件,它使用戶更容易采集和同步音頻、視頻、幻燈片以及圖像,創(chuàng)建內(nèi)容豐富、圖文并茂的媒體演示,并可以在任何地方的網(wǎng)頁瀏覽器中進行預覽和發(fā)布。

三、媒體QoS問題

  目前,運營網(wǎng)絡提供盡力而為(best effort service)的傳送服務,業(yè)務量盡快傳送,沒有明確的時間和可靠性保障。流媒體需要有較高的QoS(quality of service)要求,QoS通常用帶寬、時延、時延抖動和分組丟失率來衡量。

  流媒體依賴的傳輸平臺是IP網(wǎng)絡,而IP QoS用下列指標來表示:傳輸服務的可靠性、延時、延時抖動、吞吐量、丟包率。目前的IP QoS主要有3種體系結構:(1)MPLS;(2)IntServ;(3)DiffServ。IntServ、DiffServ是被IETF定義的兩種QoS體系。IntServ借用傳統(tǒng)電路交換思想,在基于IP的呼叫兩端,先通過信令建立一條虛連接鏈路,然后呼叫雙方的報文都經(jīng)此鏈路傳遞,從而達到保證傳輸質(zhì)量的目的。IntServ基本思想存于以資源預留的方式實現(xiàn)QoS保障,而DiffServ則是傳統(tǒng)路由思想的延伸,實現(xiàn)簡單。它把流經(jīng)路由器的數(shù)據(jù)包按照一定的優(yōu)先級分類,然后按照優(yōu)先級順序?qū)?shù)據(jù)包轉(zhuǎn)發(fā)至下一跳路由器。多協(xié)議標簽交換(MPLS)將靈活的3層IP選路和高速的2層交換技術完美地結合起來,從而彌補了傳統(tǒng)IP網(wǎng)絡的許多缺陷。它引入了“顯式路由”機制,對QoS提供了更為可靠的保證。

  多協(xié)議標簽轉(zhuǎn)換MPLS支持特殊路由,到達同一目的地的數(shù)據(jù)包沿不同路徑進行轉(zhuǎn)發(fā)。MPLS網(wǎng)絡主要由標簽交換邊緣路由器LER和標簽交換路由器LSR組成,IntServ試圖為每一路呼叫都建立一條虛鏈路。當網(wǎng)絡規(guī)模大到一定程度時,維護鏈路狀態(tài)的工作將使核心網(wǎng)路由器不堪重負。DiffServ只著眼于網(wǎng)絡中的單個路由器,缺乏全網(wǎng)觀念。一旦網(wǎng)絡發(fā)生擁塞,采用DiffServ,報文會被阻塞。

  通過應用層質(zhì)量控制技術來改善視頻傳輸?shù)馁|(zhì)量,主要包括擁塞控制和差錯控制等幾方面。采用質(zhì)量控制的主要的原因是目前的Internet只提供Best-effort的服務,沒有質(zhì)量保證。因此,需要通過應用層的機制來實現(xiàn)質(zhì)量的控制。擁塞控制的目的是避免因為網(wǎng)絡擁塞導致包丟失而造成的質(zhì)量下降。

  對于視頻流,擁塞控制的主要方法是速率控制。速率控制的目的是基于預測的網(wǎng)絡帶寬決定發(fā)送的速率。有兩種基本的速率控制手段:基于發(fā)送端的速率控制和基于接受端的速率控制。前者主要基于反饋信息進行速率調(diào)節(jié),可以適用于單播的方式或組播的方式。對于單播的方式,有兩種速率控制方法,基于探測的方法(probe-based)和基于模型的方法(model-based);谔綔y的方法通過不斷調(diào)整速率使得包的丟失率低于一個固定的概率值;谀P偷姆椒ㄖ苯永肨CP的吞吐率模型計算速率。因此,模型法也被稱為TCP友好的速率控制方法。對于單通道的組播,只能采用基于探測的方法。在基于接受方的速率控制中,發(fā)送方不參與速率控制,而由接受方通過增加和減少通道的數(shù)量來進行速率的調(diào)整。通常,這種方法用于采用可擴展編碼的組播的情況,組播的視頻流分為多層,每個層對應組播樹的一個通道。接受方通過增加減少通道獲得不同的質(zhì)量。基于接受方的速率控制也可以分為基于探測的方法和基于模型的方法。除了基于發(fā)送方的速率控制和基于接受方的速率控制方法以外,還有一個稱為混合性速率控制的方法,兼有二者的特點,即接受方增加減少通道,而發(fā)送方同時根據(jù)反饋調(diào)整各個通道的速率;旌纤俾士刂品椒ǖ囊粋例子是目標集分組的方法。

  擁塞控制的目的是減少包的丟失,但是無法避免包的丟失。在這種情況下可能需要一定的差錯控制機制。差錯控制機制包括:

(1)FEC:FEC的目的是通過增加冗余信息使得包丟失后能夠通過其他包恢復出正確的信息;

(2)延遲約束的重傳。通常流的播放有時間限制,因此,僅有當重傳的時間小于正常的播放時間時,重傳才是有價值的;

(3)錯誤彈性編碼(Error-Resilient Encoding):在編碼中通過適當?shù)目刂,使得發(fā)生數(shù)據(jù)的丟失后能夠最大限度的減少對質(zhì)量的影響。在Internet環(huán)境下,最典型的方法是多描述編碼(MDC)。MDC把原始的視頻序列壓縮成多位流,每個流對應一種描述,都可以提供可接受的視覺質(zhì)量。多個描述結合起來提供更好的質(zhì)量。該方法的優(yōu)點是實現(xiàn)了對數(shù)據(jù)丟失的健壯性和增強的質(zhì)量。其缺點是相比單描述編碼(SDC),它在壓縮的效率上受到影響。而且由于在多描述之間必須加入一定的相關性信息,這進一步降低了壓縮的效率。

(4)錯誤的取消(cancealment):錯誤的取消是指當錯誤已經(jīng)發(fā)生后,接受端通過一定的方法盡量削弱對人的視覺影響。主要的方法是時間和空間的插值(Interpolation)。近年來的研究還包括最大平滑恢復,運動補償時間預測等。

  Real Networks采用了大量的應用層質(zhì)量控制技術來提高流傳輸?shù)馁|(zhì)量。在RealVideo采用了抗損壞(damage-resistant)的編碼和FEC技術來減少包丟失的影響,RealVideo支持兩種編碼:RealVideo standard和RealVideo fractal。前者可以支持從1Ok到500k的編碼速率,而且特別為28.8k和56k進行了優(yōu)化。為了適應網(wǎng)絡速率的變化,Real Networks采用了Sure Stream技術,該技術可以避免速率使用機制不能對每個速率進行優(yōu)化的缺點。具體的方法是:首先在一個文件中同時存儲用不同速率編碼的媒體流,其次,通過在服務器和客戶之間監(jiān)測帶寬的變化來動態(tài)的決定使用那個速率的流。這個技術的主要缺點在于不能適應速率的連續(xù)控制。

中國信息產(chǎn)業(yè)網(wǎng)(www.cnii.com.cn)



相關鏈接:
基于Wi-Fi的可視電話設計方案分析 2007-02-06
視頻通信——最生動的通信 2007-02-05
會議室視頻終端和桌面型視頻終端的區(qū)別 2007-02-05
買視頻會議系統(tǒng)注意什么 2007-01-30
如何計算視頻會議系統(tǒng)的價格 2007-01-30

分類信息: