Seção: Tutoriais VoIP

 

Desempenho VoIP: Monitoração

 

As características do tráfego de voz gerado são dependentes principalmente do codificador utilizado.

 

Existem várias opções de codificação de voz, sendo que as mais utilizadas são:

  • G.711, que define um codec de alta velocidade para conversão do que gera um fluxo constante a uma taxa de 64 kbit/s (quando não utilizada a supressão de silêncio). Sua vantagem é sua velocidade, reduzindo o atraso fim a fim dos pacotes de voz, e sua desvantagem é o maior uso de mais largura de banda;
  • G.723.1 e G.729, que definem codecs de baixa velocidade, sendo que o G.723.1 tem duas opções de taxa de bits, 5.3 e 6.4 kbit/s e o G.729 gera uma taxa de 8Kbit/s. Em ambos, a taxa de bits é variável. Esta baixa taxa de bits gerada é a vantagem do uso destes codecs. A desvantagem é o aumento no atraso fim-a-fim do fluxo de voz, devido à complexidade computacional do algoritmo de compressão.

As aplicações de voz, usando o codec G.711 (que é o mais utilizado pelos fabricantes atualmente), geram uma vazão em nível de aplicação a taxa de bits constante de 64 kbit/s. Até alcançar o nível de rede, esta taxa sofrerá várias sobrecargas de protocolos. Considerando as aplicações de voz que seguem a recomendação H.323, amostras de áudio, em nível de aplicação, devem ser encapsuladas em pacotes RTP (Real Time Protocol), em seguida, encapsuladas nos pacotes UDP e após, IP.

 

A sobrecarga total de protocolos depende do tamanho do payload (área que contém os dados de voz) adotado no RTP. O valor usual do payload de voz em um pacote RTP é de 20 ms, ou seja, cada pacote IP transporta 20 ms de voz que corresponde a 160 bytes. Com isto, a cada 20ms será gerado um pacote IP com o tamanho de payload de 160 bytes. Assim, considerando a sobrecarga dos protocolos RTP (12 bytes), UDP (8 bytes) e IP (20 bytes), o tamanho do pacote IP gerado por uma aplicação de voz G.711 será de 200 bytes, e a taxa gerada, por fluxo, será de 80 kbit/s.

 

Parâmetro de Qualidade para uma Chamada de Voz

 

Como a maior parte das aplicações multimídia, a qualidade de voz obtida na VoIP é muito sensível ao atraso fim-a-fim, variação de atraso de chegada de pacotes e perda de pacotes. O critério mais amplamente aceito para qualidade de chamada de voz é o MOS (Mean Opinion Score).

 

O E-Model é um modelo computacional que avalia os efeitos combinados de variações em diversos parâmetros de transmissão, que afetam a qualidade conversacional na telefonia. O E-Model resulta em um número chamado de fator R, derivado de atrasos e fatores de deterioração causados pelos equipamentos. O fator R medido pode ser mapeado para um MOS estimado.

 

O fator R varia de 100 (excelente) até 0 (pobre) e, o MOS varia de 5 a 1. Um MOS estimado pode ser diretamente calculado do fator R do E-Model, conforme demonstra a figura a seguir. Nesta figura, valores do fator R do E-Model são mostrados à esquerda, com os valores correspondentes ao MOS à direita. O nível de satisfação dos ouvintes é apresentado na coluna do meio. É recomendado o uso do E-Model para avaliação da qualidade das chamadas de VoIP.

 

Figura 2: Medida de Qualidade de Chamada Telefônica

 

As recomendações sobre atraso e perda para que uma rede possibilite uma boa qualidade da chamada VoIP são: atraso fim a fim deve ser menor que 150ms; limite máximo de 50ms para a variação de atraso; taxa de perda limitada a 3% (mas recomendável é ser inferior a 0,50%). O não respeito destes limites gera degradações da qualidade de voz perceptíveis ao usuário.

 

Relação do E-Model com outros Métodos

 

Existem alguns produtos comerciais que implementam medidas de monitoração similares as utilizadas pelo E-Model. Dois deles são: o Cisco Voice Dial Control MIB e o Telchemy’s Monitoring Software. No entanto, as informações nestes produtos fazem referência ao E-Model em sua descrição.

 

Como estas informações aparentam ter sido baseadas em descrições retiradas dos próprios gateways de voz, e, nosso interesse é abordar a comparação de forma generalizada, vamos enfatizar uma comparação que independa do local no qual é implementado o modelo de monitoração.

 

Um tipo de método alternativo, razoavelmente utilizado, requer a injeção amostras de “palavras” ao longo do caminho de transmissão da voz. Esse método é conhecido como “Modelo Objetivo de Qualidade”.

 

Esse modelo compara a “palavra” inserida em uma ponta, com o resultado na saída na outra extremidade, utilizando de fundamentos psico-acústicos para fornecer uma opinião sobre as condições do canal de transmissão.

 

Porém, ainda é necessária a utilização do E-Model para monitorar as de perturbações bem como o atraso.

 

As vantagens dos métodos objetivos são:

  • Total transparência em relação aos equipamentos e regras existentes na rede;
  • Previsão das condições de qualidade, baseando-se nos fundamentos psico-acústicos junto com outros modelos de monitoração como o E-Model.

Voltado para a precisão, o E-Model foi criado para ser usado como uma ferramenta de planejamento de redes, e não como uma ferramenta de manutenção da mesma. No entanto, ele não pode prever condições que não tenham sido previamente medidas.

 

As desvantagens dos métodos objetivos são:

  • Muito complexos;
  • Em algumas condições eles não são muito precisos;
  • Eles são intrusivos, enquanto o E-Model pode ser ou não intrusivo;
  • Não revelam nada sobre a causa de problemas na qualidade.

Outro método é se basear na “Medida Direta de Nível de Pacotes”. O limiar é definido no ponto crítico a partir de onde ocorre a degradação da qualidade de voz. A vantagem desse método é o fato de ser de simples implementação. E sua desvantagem é se basear em um limiar arbitrário.

 

Composição do E-Model

 

A fórmula básica do E-Model é: R = Ro - Is - Id - Ie + A

 

Onde:

  • Ro é a Relação Sinal-Ruído;
  • Is são perturbações simultâneas na transmissão da voz;
  • Id são perturbações após a transmissão da voz, Ie são as perturbações causadas pelos equipamentos (ex: codec);
  • A é o fator de expectativa (que vem da tentativa de medir a expectativa do chamador).

O termo Id é o valor da perturbação devido ao atraso e ao eco gerado após a transmissão da voz.

 

Ele é composto pela soma das perturbações de eco causadas pelo transmissor (Idte), pelo receptor (Idle) e também pelos longos atrasos (Idd), ou seja:

 

Id = Idte + Idle + Idd

 

Dentro do E-Model, o parâmetro Idd só é calculado apenas para atrasos maiores que 100ms. Isso significa que atrasos menores que 100ms não são perceptíveis pelo usuário.

 

Nesse caso esses efeitos são considerados como incorporados nas componentes Idte e Idle.

 

A fórmula do E-model requer três medidas diferentes:

 

Figura 3: Esquema indicativo das três medidas

 

Onde:

  • T é a média do atraso de “one -way”;
  • Ta o atraso absoluto;
  • Tr o atraso de “round-trip”.

Infelizmente, sobre a perspectiva de medição, não é possível medir todos os três utilizando métodos simples de medição passiva, ou ativa.

 

No entanto, para aplicações práticas, são necessárias aproximações para esses parâmetros. A seguir apresentamos uma aproximação para a estimativa do atraso em VoIP utilizando técnicas passivas de medida.