Realmente la integración de la
voz y los datos en una misma red es una idea antigua, pues
desde hace tiempo han surgido soluciones desde distintos
fabricantes que, mediante el uso de multiplexores, permiten
utilizar las redes WAN de datos de las empresas (típicamente
conexiones punto a punto y frame-relay) para la transmisión
del tráfico de voz. La falta de estándares, así como el largo
plazo de amortización de este tipo de soluciones no ha
permitido una amplia implantación de las mismas.

Fig. 1 Ejemplo de red con conexión
de centralitas a routers CISCO que disponen de soporte VoIP.
Es innegable la implantación
definitiva del protocolo IP desde los ámbitos empresariales a
los domésticos y la aparición de un estándar, el VoIP, no
podía hacerse esperar. La aparición del VoIP junto con el
abaratamiento de los DSP’s (Procesador Digital de Señal), los
cuales son claves en la compresión y descompresión de la voz,
son los elementos que han hecho posible el despegue de estas
tecnologías. Para este auge existen otros factores, tales como
la aparición de nuevas aplicaciones o la apuesta definitiva
por VoIP de fabricantes como Cisco Systems o Nortel-Bay
Networks. Por otro lado los operadores de telefonía están
ofreciendo o piensan ofrecer en un futuro cercano, servicios
IP de calidad a las empresas.
Por lo dicho hasta ahora, vemos
que nos podemos encontrar con tres tipos de redes IP:
-
Internet. El estado actual de
la red no permite un uso profesional para el tráfico de voz.
-
Red IP pública. Los operadores
ofrecen a las empresas la conectividad necesaria para
interconectar sus redes de área local en lo que al tráfico
IP se refiere. Se puede considerar como algo similar a
Internet, pero con una mayor calidad de servicio y con
importantes mejoras en seguridad. Hay operadores que incluso
ofrecen garantías de bajo retardo y/o ancho de banda, lo que
las hace muy interesante para el tráfico de voz.
-
Intranet. La red IP
implementada por la propia empresa. Suele constar de varias
redes LAN (Ethernet conmutada, ATM, etc..) que se
interconectan mediante redes WAN tipo Frame-Relay/ATM,
líneas punto a punto, RDSI para el acceso remoto, etc. En
este caso la empresa tiene bajo su control prácticamente
todos los parámetros de la red, por lo que resulta ideal
para su uso en el transporte de la voz.
Debido a la ya existencia del
estándar H.323 del ITU-T, que cubría la mayor parte de las
necesidades para la integración de la voz, se decidió que el
H.323 fuera la base del VoIP. De este modo, el VoIP debe
considerarse como una clarificación del H.323, de tal forma
que en caso de conflicto, y a fin de evitar divergencias entre
los estándares, se decidió que H.323 tendría prioridad sobre
el VoIP. El VoIP tiene como principal objetivo asegurar la
interoperabilidad entre equipos de diferentes fabricantes,
fijando aspectos tales como la supresión de silencios,
codificación de la voz y direccionamiento, y estableciendo
nuevos elementos para permitir la conectividad con la
infraestructura telefónica tradicional. Estos elementos se
refieren básicamente a los servicios de directorio y a la
transmisión de señalización por tonos multifrecuencia (DTMF).
El VoIP/H.323 comprende a su vez
una serie de estándares y se apoya en una serie de protocolos
que cubren los distintos aspectos de la comunicación:
Direccionamiento
1-
RAS (Registration, Admision and Status). Protocolo de
comunicaciones que permite a una estación H.323 localizar otra
estación H.323 a través de el Gatekeeper.
2-
DNS (Domain Name Service). Servicio de resolución de nombres
en direcciones IP con el mismo fin que el protocolo RAS pero a
través de un servidor DNS
Señalización
1-
Q.931 Señalización inicial de llamada
2-
H.225 Control de llamada: señalización, registro y admisión, y
paquetización / sincronización del stream (flujo) de voz
3-
H.245 Protocolo de control para especificar mensajes de
apertura y cierre de canales para streams de voz
Compresión de Voz
1-
Requeridos: G.711 y G.723
2-
Opcionales: G.728, G.729 y G.722
Transmisión de Voz
1-
UDP. La transmisión se realiza sobre paquetes UDP, pues aunque
UDP no ofrece integridad en los datos, el aprovechamiento del
ancho de banda es mayor que con TCP.
2-
RTP (Real Time Protocol). Maneja los aspectos relativos a la
temporización, marcando los paquetes UDP con la información
necesaria para la correcta entrega de los mismos en recepción.
Control de la
Transmisión

RTCP (Real Time Control Protocol).
Se utiliza principalmente para detectar situaciones de
congestión de la red y tomar, en su caso, acciones
correctoras.
Tabla 1. Pila de protocolos en
VoIP
Actualmente podemos partir de una
serie de elementos ya disponibles en el mercado y que, según
diferentes diseños, nos permitirán construir las aplicaciones
VoIP. Estos elementos son:
Teléfonos IP.
Adaptadores para PC.
Hubs Telefónicos.
Gateways (pasarelas RTC / IP).
Gatekeeper.
Unidades de audioconferencia
múltiple. (MCU Voz)
Servicios de Directorio.

Fig. 2 Elementos de una red VoIP
Las
funciones de los distintos elementos son fácilmente
entendibles a la vista de la figura 2, si bien merece la pena
recalcar algunas ideas.
El Gatekeeper es un elemento
opcional en la red, pero cuando está presente, todos los demás
elementos que contacten dicha red deben hacer uso de aquel. Su
función es la de gestión y control de los recursos de la red,
de manera que no se produzcan situaciones de saturación de la
misma.
El Gateway es un elemento
esencial en la mayoría de las redes pues su misión es la de
enlazar la red VoIP con la red telefónica analógica o RDSI.
Podemos considerar al Gateway como una caja que por un lado
tiene un interface LAN y por el otro dispone de uno o varios
de los siguientes interfaces:
-
FXO. Para conexión a
extensiones de centralitas ó a la red telefónica básica.
-
FXS. Para conexión a enlaces de
centralitas o a teléfonos analógicos.
-
E&M. Para conexión específica a
centralitas.
-
BRI. Acceso básico RDSI (2B+D)
-
PRI. Acceso primario RDSI (30B+D)
-
G703/G.704. (E&M digital)
Conexión especifica a centralitas a 2 Mbps.
Los distintos elementos pueden
residir en plataformas físicas separada, o nos podemos
encontrar con varios elementos conviviendo en la misma
plataforma. De este modo es bastante habitual encontrar juntos
Gatekeeper y Gateway. También podemos ver en la figura 1 cómo
Cisco ha implementado las funciones de Gateway en el router.
Gateway de Voz sobre IP
El término pasarela de VoIP en
ocasiones también se suele utilizar para hacer referencia a
otros elementos funcionales, en tal caso se le suelen llamar
pasarelas de VoIP especiales, en tanto que se posicionan entre
redes IP para desarrollar determinadas funciones de mapping,
por ejemplo en la capa IP. Entidades específicas como proxies
VoIP, transcodificadores VoIP, traductores de direcciones de
red VoIP, etc., caen en esta categoría de pasarelas de VoIP.
-
Las pasarelas de interconexión
en este contexto son básicamente dispositivos lógicos,
aunque también pueden ser, y de hecho son, dispositivos
físicos, como se verá posteriormente. Tienen una serie de
atributos que caracterizan el volumen y tipos de servicios
que pueden proveer, por ejemplo:
• Capacidad, expresa el volumen de servicio que puede
brindar la pasarela, estando relacionado directamente con el
número de puertos que tiene (igual al número máximo de
llamadas simultáneas) y la velocidad del enlace de acceso.
• Protocolos de señalización soportados, tanto relativos a
redes de VoIP como relativos a redes SCN.
• Codecs de voz utilizados.
• Algoritmos de encriptado que soporta.
• Rango de direccionado, que es el rango o abanico de
números telefónicos que a su través se tiene acceso en la
GSTN desde la red IP. En relación con la tarificación, este
rango de direccionado puede o no estar fraccionado.
-
En general, las pasarelas de
interconexión tienen que proporcionar los siguientes
"mecanismos" o funciones
• Adaptación de señalización, básicamente tiene que ver con
las funciones de establecimiento y terminación de las
llamadas,
• Control de los medios, se relaciona con la identificación,
procesamiento e interpretación de eventos relacionados con
el servicio generados por usuarios o terminales,
• Adaptación de medios, según requerimientos de las redes.
La pasarela o gateway de
interconexión también desarrolla la función control de medios,
que se ocupa de "manejar" toda la información de control
generada por el terminal. Para el caso de comunicaciones de
voz, la información de control del nivel de usuario más a
destacar son los tonos multifrecuencia (DTMF) que produce un
teclado telefónico convencional (por ejemplo, para interactuar
con un servidor de voz). Ahora bien, dadas las características
de estas señales, en el sentido que están en el rango audible
pero no son señales de voz, sino tonos, es necesario prestar
particular atención para su trasvase por la conexión híbrida
que representa la pasarela de interconexión. Las técnicas de
compresión de voz de baja velocidad introducen considerable
distorsión en los tonos DTMF, provocando la recepción y
correspondiente decodificación incorrecta en los receptores.
Entonces, esto requiere que las señales de audio y los tonos
DTMF sean separados en la pasarela (si no lo ha sido ya en el
emisor) y conducidas de forma independiente al receptor.
-
Hay dos posibles soluciones
para el transporte de los tonos DTMF:
Transporte "dentro de banda": consiste en transportar estos
tonos, digitalizados y paquetizados, con los protocolos RTP/UDP,
mediante un formato de carga útil dedicado.
-
Transporte "fuera de banda":
conlleva a utilizar un canal de control de medios seguro (no
UDP, sino TCP) para el transporte de las señales TDMF.
El transporte de los tonos DTMF
"dentro de banda" se ve afectado por la falta de garantía en
la entrega de paquetes que el protocolo UDP ofrece, con
nefastas consecuencias para el funcionamiento del servicio en
caso de pérdida de un paquete asociado a un tono TDMF. Tiene
la ventaja de que los tonos permanecen sincronizados en el
tiempo con respecto a la voz.
En cambio, el transporte "fuera de banda" si bien gana en
seguridad respecto a la entrega segura de los paquetes,
pierden las señales su referencia exacta en el tiempo en
relación con el stream de voz. Esta es precisamente la
solución adoptada en la Recomendación H.323, mediante el canal
H.245.