Seção: Tutoriais VoIP

 

Caso Prático VoIP: Codificação de Voz

 

Na figura 2 apresentada anteriormente pode-se ver que um dos componentes necessários para transmissão de voz numa rede de dados é o Áudio CODEC (Codificador-Decodificador). Este componente é o responsável por transformar a voz humana (um sinal analógico) em uma seqüência de bits (um sinal digital) para transmissão numa rede de dados, fazendo amostragens periódicas no sinal de voz. Em equipamentos do tipo gateways VoIP, esses CODECs são implementados através de um componente chamado DSP (Digital Signal Processor).

 

A introdução dos microprocessadores no final dos anos 70 e início dos anos 80 tornou possível usar técnicas de processamento digital de sinais (Digital Signal Processing) em um range muito maior de aplicações.

 

Durante os anos 80 a importância crescente do processamento digital de sinais levou vários fabricantes importantes (como Texas Instruments, Analog Devices e Motorola) a desenvolverem os chips DSP, ou seja, microprocessadores especializados com arquiteturas projetadas especificamente para os tipos de operações requeridas ao processamento digital de sinais.

 

Como um microprocessador de uso geral, um DSP é um dispositivo programável, com seu próprio conjunto de instruções nativas. O uso desses chips associados a algoritmos de compressão permitiu a implementação de diversas tecnologias de CODEC’s. Exemplos de chips DSP são o DSP542 e DSP549 fabricados pela Texas Instruments e usados pela CISCO Systems em seus gateways VoIP [CISCO-CODEC1].

 

Cada CODEC provê certa qualidade de voz. A medida de qualidade da voz transmitida é uma resposta subjetiva de um ouvinte. Uma medida comum usada para determinar a qualidade do som produzido pelos CODECs específicos é o MOS (Mean Opinion Score). Com o uso do MOS, um amplo range de ouvintes julgam a qualidade de uma amostra de voz (correspondendo a um CODEC particular) numa escala de 1 a 5. A partir desses resultados, é calculada a média dos scores para atribuir o MOS para aquela amostra [CISCO-CODEC2].

 

Na tabela 1 são apresentados alguns scores MOS para os CODECs mais usados. Na Tabela 2 são descritos os scores MOS.

 

Método de Compressão

Bit Rate (kbit/s)
MOS Score
Delay (ms)

G.711 PCM

64
4.1
0.75

G.726 ADPCM

32
3.85
1

G.728 LD-CELP

16
3.61
3 to 5

G.729 CS-ACELP

8
3.92
10

G.729 x 2 Encodings

8
3.27
10

G.729 x 3 Encodings

8
2.68
10

G.729a CS-ACELP

8
3.7
10

G.723.1 MP-MLQ

6.3
3.9
30

G.723.1 ACELP

5.3
3.65
30
Tabela 1: Scores MOS de alguns CODEC's [CISCO-CODEC2]
 
Score
Definição
Descrição
5
Excelente
Um sinal de voz perfeito gravado em um local silencioso
4
Bom
Qualidade de uma chamada telefônica de longa distância (PSTN)
3
Razoável
Requer algum esforço na escuta
2
Pobre
Fala de baixa qualidade e difícil de entender
1
Ruim
Fala não clara, quebrada
Tabela 2: Scores MOS [UMSIS-MOS]

 

Na tabela 3 é mostrada a banda real utilizada pelo CODEC G.729 em três tipos de meio: Frame Relay sem usar compressão, Freme Relay usando compressão, e Ethernet.

 

Codec Information
Bandwidth Calculations

Codec &

Bit Rate

Codec Sample Size
Codec Sample Interval
Mean Opinion Score (MOS)
Voice Payload Size
Voice Payload Size
Packets Per Second (PPS)
Bandwidth

G.729

8 Kbit/s

10 Bytes
10 ms
3.92
20 Bytes
20 ms
50

MP or FRF.12

26.8 Kbit/s

with cRTP

MP or FRF.12

11.6 Kbit/s

Ethernet

31.2 Kbit/s

Tabela 3: Consumo real de banda para o G.729 [CISCO-CODEC3]

 

 

Os algoritmos de compressão são patenteados e seu uso obriga o fabricante do gateway VoIP a pagar royalties ao proprietário do algoritmo. Por exemplo, o G.729 apresentado na tabela 4 é patenteado pela empresa VoiceAge Solutions [VOICEAGE]. Nessa tabela, a qualidade “TOLL” é equivalente à obtida de uma linha de uma operadora de telefonia convencional (Telephony Operator Leased Line).

 

  Características
G.729
G.729A
G.729D
G.729E
Bit Rate
8 kbit/s
8 kbit/s
6.4 kbit/s
11.8 kbit/s
Tipo
CS-ACELP
CS-ACELP
CS-ACELP
CS-ACELP
Delay
 
 
 
 
Tamanho do Frame
10 ms
10 ms
10 ms
10 ms
Lock ahead
5 ms
5 ms
5 ms
5 ms
Qualidade
TOLL
TOLL
near TOLL
TOLL
Complexidade
 
 
 
 
MIPS
20-25
10
Menor que G.729
~30
RAM
< 4K
2K
Menor que G.729
~4K
Tabela 4: As várias versões do CODEC G.729 [VOICEAGE]

 

 

Existem também algoritmos de compressão fechados (i.e., cujas especificações não são públicas nem licenciáveis). O algoritmo utilizado pela operadora de telefonia IP Skype (www.skype.com) propicia qualidade de comunicação superior, mesmo com linhas discadas (56 kbit/s).

 

Vale a pena atentar para o efeito provocado pelo ajuste do tamanho do payload nos frames IP usados para VoIP. O payload é a área de dados do frame onde a informação de voz codificada é colocada, conforme pode ser visto na figura a seguir.

 

Figura 3: Encapsulamento VoIP num frame IP [CISCO-CODEC3]

 

Quanto maior o payload, menor será o consumo de banda numa chamada VoIP, porém maior será o delay para transmitir cada frame desta chamada. Uma aplicação bem interessante é o Voice CODEC Bandwidth Calculator, da CISCO [CISCO-CODEC4] disponível na Internet para usuários registrados, o qual permite que se façam simulações do uso real de banda tendo como parâmetros de entrada o tipo de CODEC utilizado e o tamanho do payload desejado.