好贴珍藏馆: VOIP关键技术

1 VOIP的基本原理与实现形式
　　IP电话系统把普通电话的模拟信号转换成计算机可联入因特网传送的IP数据包，同时也将收到的IP数据包转换成声音的模拟电信号。经过IP电话系统的转换及压缩处理，每个普通电话传输速率约占用8-11kbit/s带宽，因此在与普通电信网同样使用传输速率为64kbit/s的带宽时，IP电话数是原来的5-8倍。VOIP的核心与关键设备是IP电话网关。IP电话网关具有路由管理功能，它把各地区电话区号映射为相应的地区网关IP地址。这些信息存放在一个数据库中，有关处理软件完成呼叫处理、数字语音打包、路由管理等功能。在用户拨打IP电话时，IP电话网关根据电话区号数据库资料，确定相应网关的IP地址，并将此IP地址加入IP数据包中，同时选择最佳路由，以减少传输时延，IP数据包经因特网到达目的地IP电话网关。对于因特网未延伸到或暂时未设立网关的地区，可设置路由，由最近的网关通过长途电话网转接，实现通信业务。
　　目前VOIP系统一般由IP电话终端、网关（Gateway）、网守（Gatekeeper）、网管系统、计费系统等几部分组成。IP电话终端包括传统的语音电话机、PC、IP电话机，也可以是集语音、数据和图象于一体的多媒体业务终端。由于不同种类的终端产生的数据源结构是不同的，要在同一个网络上传输，这就要由网关或者是通过一个适配器进行数据转换，形成统一的IP数据包。IP电话网关提供IP网络和电话网之间的接口，用户通过PSTN本地环路连接到IP网络的网关，网关负责把模拟信号转换为数字信号并压缩打包，成为可以在因特网上传输的IP分组语音信号，然后通过因特网传送到被叫用户的网关端，由被叫端的网关对IP数据包进行解包、解压和解码，还原为可被识别的模拟语音信号，再通过PSTN传到被叫方的终端。这样，就完成了一个完整的电话到电话的IP电话的通信过程。网守实际上是IP电话网的智能集线器，是整个系统的服务平台，负责系统的管理、配置和维护。网守提供的功能有拨号方案管理、安全性管理、集中帐务管理、数据库管理和备份、网络管理等等。网管系统的功能是管理整个IP电话系统，包括设备的控制及配置，数据配给，拨号方案管理及负载均衡、远程监控等。计费系统的功能是对用户的呼叫进行费用计算，并提供相应的单据和统计报表。计费系统可以由IP电话系统制造商提供，也可以由第三方制作，但此时需IP电话系统制造商提供其软件数据接口。
　　在实现方式上，VOIP有电话机到电话机、电话机到PC、PC到电话机和PC到PC等4种方式。最初VOIP方式主要是PC到PC，利用IP地址进行呼叫，通过语音压缩、打包传送方式，实现因特网上PC机间的实时话音传送，话音压缩、编解码和打包均通过PC上的处理器、声卡、网卡等硬件资源完成，这种方式和公用电话通信有很大的差异，且限定在因特网内，所以有很大的局限性。电话到电话即普通电话经过电话交换机连到IP电话网关，用电话号码穿过IP网进行呼叫，发送端网关鉴别主叫用户，翻译电话号码／网关IP地址，发起IP电话呼叫，连接到最靠近被叫的网关，并完成话音编码和打包，接收端网关实现拆包、解码和连接被叫。对于电话到PC或是PC到电话的情况，是由网关来完成IP地址和电话号码的对应和翻译，以及话音编解码和打包。
　　2 VOIP的关键技术
　　传统的IP网络主要是用来传输数据业务，采用的是尽力而为的、无连接的技术，因此没有服务质量保证，存在分组丢失、失序到达和时延抖动等情况。数据业务对此要求不高，但话音属于实时业务，对时序、时延等有严格的要求。因此必须采取特殊措施来保障一定的业务质量。VOIP的关键技术包括信令技术、编码技术、实时传输技术、服务质量（QOS）保证技术、以及网络传输技术等。
　　2.1 信令技术
　　信令技术保证电话呼叫的顺利实现和话音质量，目前被广泛接受的VOIP控制信令体系包括ITU-T的H.323系列（华为公司产品采用）和IETF的会话初始化协议SIP。
　　ITU的H.323系列建议定义了在无业务质量保证的因特网或其它分组网络上多媒体通信的协议及其规程。H.323标准是局域网、广域网、Intranet和Internet上的多媒体提供技术基础保障。H.323是ITU-T有关多媒体通信的一个协议集，包括用于ISND的H.320，用于B-ISDN的H.321和用于PSTN终端的H.324等建议。其编码机制，协议范围和基本操作类似于ISDN的Q.931信令协议的简化版本，并采用了比较传统的电路交换的方法。相关的协议包括用于控制的H.245，用于建立连接的H.225，用于大型会议的H.332，用于补充业务的H.450.1、H.450.2和H.450.3，有关安全的H.235，与电路交换业务互操作的H.246等。H.323提供设备之间、高层应用之间和提供商之间的互操作性。它不依赖于网络结构，独立于操作系统和硬件平台，支持多点功能、组播和带宽管理。H.323具备相当的灵活性，支持包含不同功能的节点之间的会议和不同网络之间的会议。H.323建议的多媒体会议系统中的信息流包括音频、视频、数据和控制信息。信息流采用H.225建议方式来打包和传送。
　　H.323呼叫建立过程涉及到三种信令：RAS(Registration Admission Status）信令，H.225呼叫信令和H.245控制信令。
　　RAS信令用来完成终端与网守之间的登记注册、授权许可、带宽改变、状态和脱离解除等过程；
　　H.225呼叫信令用来建立两个终端之间的连接，这个信令使用Q.931消息来控制呼叫的建立和拆除，当系统中没有网守时，呼叫信令信道在呼叫涉及的两个终端之间打开；当系统中包括一个网守时，由网守决定在终端与网守之间或是在两个终端之间开辟呼叫信令信道；
　　H.245控制信令用来传送终端到终端的控制消息，包括主从判别、能力交换、打开和关闭逻辑信道、模式参数请求、流控消息和通用命令与指令等。H.245控制信令信道建立于两个终端之间，或是一个终端与一个网守之间。
　　此外，H.323不支持多点发送（Multicast）议，只能采用多点控制单元（MCU）构成多点会议，因而同时只能支持有限的多点用户。H.323也不支持呼叫转移，且建立呼叫的时间比较长。
　　2.2 编码技术
　　话音压缩编码技术是IP电话技术的一个重要组成部分。目前，主要的编码技术有ITU-T
定义的G.729、G.723等。其中G.729可将经过采样的64Kbit/s话音以几乎不失真的质量压缩至8Kbit/s。由于在分组交换网络中，业务质量不能得到很好保证，因而需要话音的编码具有一定的灵活性，即编码速率、编码尺度的可变可适应性。G.729原来是8Kbit/s的话音编码标准，现在的工作范围扩展至6.4-11.8Kbit/s，话音质量也在此范围内有一定的变化，但即使是6.4Kbit/s，话音质量也还不错，因而很适合在VOIP系统中使用。G.723.1采用5.3/6.3kbit/s双速率话音编码，其话音质量好，但是处理时延较大，它是目前已标准化的最低速率的话音编码算法。
　　此外，静音检测技术和回声消除技术也是VOIP中十分关键的技术。静音检测技术可有效剔除静默信号，从而使话音信号的占用带宽进一步降低到3.5kbit/s左右；回声消除技术主要利用数字滤波器技术来消除对通话质量影响很大回声干扰，保证通话质量。这点在时延相对较大的IP分组网络中尤为重要。
　　2.3 实时传输技术
　　实时传输技术主要是采用实时传输协议RTP。RTP是提供端到端的包括音频在内的实时数据传送的协议。ＲＴＰ包括数据和控制两部分，后者叫RTCP。RTP提供了时间标签和控制不同数据流同步特性的机制，可以让接收端重组发送端的数据包，可以提供接收端到多点发送组的服务质量包馈。
　　2.4 QOS保障技术
　　VOIP中主要采用资源预留协议（RSVP）以及进行服务质量监控的实时传输控制协议RTCP来避免网络拥塞，保障通话质量。
　　2.5 网络传输技术
　　VOIP中网络传输技术主要是TCP和UDP，此外还包括网关互联技术、路由选择技术、网络管理技术以及安全认证和计费技术等。由于实时传输协议RTP提供具有实时特征的、端到端的数据传输业务，因此VOIP可用RTP来传送话音数据。在RTP报头中包含装载数据的标识符、序列号、时间戳以及传送监视等，通常RTP协议数据单元是用UDP分组来承载，而且为了尽量减少时延，话音净荷通常都很短。IP、UDP和RTP报头都按最小长度计算。VOIP话音分组开销很大，采用RTP协议的VOIP格式，在这种方式中将多路话音插入话音数据段中，这样提高了传输效率。
VoIP的优势是什么？　采用了新择优技术,网络电话能达到较高的通话质量
　　使用网络电话,大幅降低国内、国际长途电话费用
　　网络电话没有传统电信业务的月租费项目
　　网络电话同网用户之间相互通话免费
　　无需增加专用设备,只要电脑具备耳麦及上网条件即可使用网络电话
　　网络电话的计费方式更透明,随时了解每笔通话时长和花销
　　网络电话沿用了常规的电话拨号方式,使用方便
　　在紧急情况下(如"9.11"事件),使用网络电话可以拨通因线路繁忙,普通电话无法拨打的地区号码
VoIP的基本传输过程简介
　　通过因特网进行语音通信是一个非常复杂的系统工程，其应用面很广，因此涉及的技术也特别多，其中最根本的技术是VoIP (Voice over
IP)技术，可以说，因特网语音通信是VoIP技术的一个最典型的、也是最有前景的应用领域。本文主要介绍VOIP的基本传输过程。
　　传统的电话网是以电路交换方式传输语音，所要求的传输宽带为64kbit/s。而所谓的VoIP是以IP分组交换网络为传输平台，对模拟的语音信号进行压缩、打包等一系列的特殊处理，使之可以采用无连接的UDP协议进行传输。
　　为了在一个IP网络上传输语音信号，要求几个元素和功能。最简单形式的网络由两个或多个具有VoIP功能的设备组成，这一设备通过一个IP网络连接。VoIP模型的基本结构图如图1所示。从图1中可以发现VoIP设备是如何把语音信号转换为IP数据流，并把这些数据流转发到IP目的地，IP目的地又把它们转换回到语音信号。两者之音的网络必须支持IP传输，且可以是IP路由器和网络链路的任意组合。因此可以简单地将VoIP的传输过程分为下列几个阶段。
　　1、语音-数据转换
　　语音信号是模拟波形，通过IP方式来传输语音，不管是实时应用业务还是非实时应用业务，道貌岸首先要对语音信号进行模拟数据转换，也就是对模拟语音信号进行8位或6位的量化，然后送入到缓冲存储区中，缓冲器的大小可以根据延迟和编码的要求选择。许多低比特率的编码器是采取以帧为单位进行编码。典型帧长为10~30ms。考虑传输过程中的代价，语间包通常由60、120或240ms的语音数据组成。数字化可以使用各种语音编码方案来实现，目前采用的语音编码标准主要有ITU-T
G.711。源和目的地的语音编码器必须实现相同的算法，这样目的地的语音设备帮可以还原模拟语音信号。
　　2、原数据到IP转换
　　一旦语音信号进行数字编码，下一步就是对语音包以特定的帧长进行压缩编码。大部份的编码器都有特定的帧长，若一个编码器使用15ms的帧，则把从第一来的60ms的包分成4帧，并按顺序进行编码。每个帧合120个语音样点（抽样率为8kHz）。编码后，将4个压缩的帧合成一个压缩的语音包送入网络处理器。网络处理器为语音添加包头、时标和其它信息后通过网络传送到另一端点。语音网络简单地建立通信端点之间的物理连接（一条线路），并在端点之间传输编码的信号。IP网络不像电路交换网络，它不形成连接，它要求把数据放在可变长的数据报或分组中，然后给每个数据报附带寻址和控制信息，并通过网络发送，一站一站地转发到目的地。
　　3、传送
　　在这个通道中，全部网络被看成一个从输入端接收语音包，然后在一定时间（t）内将其传送到网络输出端。t可以在某全范围内变化，反映了网络传输中的抖动。网络中的同间节点检查每个IP数据附带的寻址信息，并使用这个信息把该数据报转发到目的地路径上的下一站。网络链路可以是支持IP数据流的任何拓结构或访问方法。
　　4、 IP包-数据的转换
　　目的地VoIP设备接收这个IP数据并开始处理。网络级提供一个可变长度的缓冲器，用来调节网络产生的抖动。该缓冲器可容纳许多语音包，用户可以选择缓冲器的大小。小的缓冲器产生延迟较小，但不能调节大的抖动。其次，解码器将经编码的语音包解压缩后产生新的语音包，这个模块也可以按帧进行操作，完全和解码器的长度相同。若帧长度为15ms，，是60ms的语音包被分成4帧，然后它们被解码还原成60ms的语音数据流送入解码缓冲器。在数据报的处理过程中，去掉寻址和控制信息，保留原始的原数据，然后把这个原数据提供给解码器。
　　5、数字语音转换为模拟语音
　　播放驱动器将缓冲器中的语音样点（480个）取出送入声卡，通过扬声器按预定的频率（例如8kHz）播出。
简而言之，语音信号在IP网络上的传送要经过从模拟信号到数字信号的转换、数字语音封装成IP分组、IP分组通过网络的传送、IP分组的解包和数字语音还原到模拟信号等过程。