1. Servicios de comunicaciones sobre IP
🎯 Idea clave
- Los servicios de comunicaciones sobre IP integran la transmisión de voz, vídeo y datos sobre infraestructuras de red basadas en paquetes sin garantía de calidad de servicio.
- El estándar H.323 define un marco completo de interoperabilidad para comunicaciones multimedia en tiempo real sobre redes IP, LAN, WAN e Internet.
- La arquitectura comprende terminales, gatekeepers, gateways y unidades de control multipunto que gestionan el ciclo completo de la comunicación.
- La señalización se distribuye entre múltiples protocolos especializados que gestionan registro, admisión, negociación de capacidades y transporte de medios.
- El sistema soporta tanto comunicaciones punto a punto como conferencias multipunto con control centralizado de recursos.
📚 Desarrollo
Definición del marco. Los servicios de comunicaciones sobre IP abarcan sistemas que permiten la transmisión integrada de voz, vídeo y datos sobre redes basadas en paquetes. El estándar H.323, denominado técnicamente Packet-based multimedia communications systems, constituye la recomendación del ITU-T que establece las bases para estas comunicaciones en entornos que pueden no ofrecer calidad de servicio garantizada.
Evolución normativa. Desarrollado inicialmente en 1996, el estándar ha evolucionado mediante versiones sucesivas hasta la versión 7 en 2009 y la versión 8 en 2022. Esta evolución ha permitido incorporar características de seguridad avanzada, movilidad e integración con la red telefónica pública, manteniendo su vigencia en entornos corporativos, de defensa y sanitarios.
Arquitectura de componentes. El sistema define cuatro entidades principales: los terminales que actúan como dispositivos de usuario; los gatekeepers que ejercen el control centralizado de zona mediante funciones de registro, admisión y autorización; los gateways que posibilitan la interoperabilidad con redes externas como la PSTN; y las unidades MCU que gestionan conferencias multipunto mediante mezcla de audio y conmutación de vídeo.
Protocolos de señalización. A diferencia de soluciones unificadas, H.323 coordina múltiples protocolos especializados. H.225.0 gestiona la señalización de llamada adaptada de Q.931 y las funciones RAS sobre UDP puerto 1719. H.245 se encarga de la negociación de capacidades de codecs y la apertura de canales lógicos. El transporte de medios utiliza RTP/RTCP, mientras que H.235 proporciona el marco de seguridad para autenticación y cifrado.
Características técnicas. El sistema utiliza codificación binaria ASN.1, resultando más eficiente en red que los protocolos textuales pero más complejo de depurar. El audio es obligatorio en todo terminal H.323, mientras que vídeo y datos son opcionales pero interoperables. H.239 permite contenido dual simultáneo, combinando señales de cámara y presentación en una misma sesión.
Operatividad de red. Los servicios pueden desplegarse en comunicaciones punto a punto directas entre terminales o en escenarios multipunto controlados por el gatekeeper y la MCU. La arquitectura permite funcionar sobre redes heterogéneas, adaptándose a las variaciones de retardo y pérdidas propias de las infraestructuras IP no reservadas.
🧩 Elementos esenciales
- H.323: recomendación ITU-T que define el marco completo para sistemas multimedia sobre redes de paquetes IP.
- Terminal: dispositivo de usuario que participa en comunicaciones de voz, vídeo y datos.
- Gatekeeper: servidor lógico de control de zona que gestiona registro, admisión, autorización y enrutamiento de llamadas.
- Gateway: pasarela de interoperabilidad entre redes H.323 y PSTN o protocolos alternativos.
- MCU (Multipoint Control Unit): componente que gestiona conferencias multipunto mediante mezcla de audio y switching de vídeo.
- H.225.0: protocolo de señalización de llamada y paquetización de flujos multimedia.
- RAS (Registration, Admission and Status): protocolo entre terminal y gatekeeper para registro, admisión de llamadas y control de ancho de banda.
- H.245: protocolo de negociación de capacidades, control multimedia y señalización de canales lógicos.
- H.235: marco de seguridad que aporta autenticación y cifrado al sistema.
- H.239: estándar para contenido dual simultáneo que permite videoconferencia con presentación.
- Codificación ASN.1: formato binario de codificación que optimiza el tráfico de red frente a protocolos textuales.
🧠 Recuerda
- H.323 no es un protocolo único sino una arquitectura paraguas que coordina múltiples recomendaciones especializadas.
- El gatekeeper es el elemento central del control de admisión y gestión de zona.
- El audio es obligatorio en todos los terminales; vídeo y datos son opcionales pero interoperables.
- RAS sobre UDP 1719 gestiona el registro y control de terminales ante el gatekeeper.
- H.323 utiliza codificación binaria ASN.1, más eficiente en red pero más compleja de analizar que SIP.
- En 2025 su uso se circunscribe a entornos corporativos heredados, sistemas de alta gama y sectores de defensa y salud.
- La señalización de llamada utiliza H.225.0/Q.931 sobre TCP puerto 1720.
- H.245 se encarga de la negociación de codecs y apertura de canales lógicos para RTP.
2. Servicios de voz y fax sobre IP
🎯 Idea clave
- Los servicios de voz sobre IP (VoIP) digitalizan, comprimen y transmiten conversaciones telefónicas mediante paquetes IP, sustituyendo la conmutación de circuitos tradicional.
- El fax sobre IP (FoIP) aplica una lógica similar a la transmisión de documentos facsímiles, aunque el protocolo analógico G3/T.30 presenta incompatibilidades específicas con la conmutación de paquetes.
- VoIP constituye la técnica de transporte, mientras que la telefonía IP representa el servicio completo que incluye señalización, encaminamiento, numeración y gestión de llamadas.
- La infraestructura central de una solución de telefonía IP es la IP-PBX, que puede adoptar la forma de equipo físico o solución software.
- Los principales organismos normalizadores son el ITU-T, la IETF y el ETSI, que establecen los estándares de códecs, protocolos y perfiles de implementación.
📚 Desarrollo
Definición de VoIP. Los servicios de voz sobre IP (VoIP, Voice over Internet Protocol) comprenden el conjunto de tecnologías que digitalizan, comprimen, segmentan en paquetes y transmiten conversaciones telefónicas a través de redes basadas en el protocolo IP. Este mecanismo sustituye la conmutación de circuitos tradicional por el transporte de paquetes, utilizando protocolos como UDP, RTP y RTCP para los flujos de medios.
Distinción conceptual. Es preciso diferenciar entre VoIP y telefonía IP. VoIP se refiere exclusivamente a la técnica de transporte de voz en paquetes IP, mientras que la telefonía IP constituye el servicio completo que permite establecer, recibir, encaminar, numerar, señalizar y gestionar llamadas utilizando dicha base técnica. Una instalación de telefonía IP incorpora terminales, centralitas, servidores de señalización, pasarelas y políticas de calidad de servicio.
Fax sobre IP (FoIP). El fax sobre IP aplica una lógica análoga a la transmisión de documentos facsímiles, aunque presenta la particularidad de que el protocolo analógico del fax tradicional (G3/T.30) resulta especialmente incompatible con la conmutación de paquetes. Para garantizar la transmisión robusta de fax G3 sobre IP se utiliza el protocolo T.38, desarrollado por el ITU-T, existiendo alternativas como el passthrough G.711 o servidores fax-to-mail.
Componentes arquitectónicos. Una solución completa de telefonía IP integra terminales (físicos, softphones o DECT IP), una centralita IP-PBX que funciona como infraestructura central, gateways (FXS/FXO, RDSI o SIP-trunk), Session Border Controllers, servidores de buzón y sistemas de supervisión. La IP-PBX puede materializarse como equipo físico dedicado o como solución software, gestionando el registro de usuarios y el encaminamiento de llamadas.
Códecs de audio. La conversación digitalizada requiere códecs específicos que determinan la calidad y el ancho de banda consumido. Los principales son el G.711 (64 kbps, calidad telefónica tradicional), el G.729 (8 kbps con compresión), el G.722 (banda ancha) y Opus (adaptativo y de código abierto). La selección del códec impacta directamente en la calidad percibida y en los requisitos de red.
Estándares y seguridad básica. Los organismos normalizadores establecen el marco técnico: el ITU-T define estándares de códecs (serie G.), señalización (H.323, H.248) y fax (T.38); la IETF desarrolla protocolos de Internet como SIP (RFC 3261), RTP (RFC 3550) y SRTP (RFC 3711); y el ETSI adapta perfiles al mercado europeo. La seguridad se fundamenta en SRTP, TLS, autenticación mediante certificados y segmentación VLAN.
🧩 Elementos esenciales
- VoIP: técnica de transporte de voz digitalizada y comprimida sobre paquetes IP mediante UDP/RTP/RTCP.
- Telefonía IP: servicio completo que añade señalización, numeración, encaminamiento y gestión a la base VoIP.
- FoIP: transmisión de fax sobre IP que utiliza T.38 para superar la incompatibilidad del protocolo G3/T.30 con conmutación de paquetes.
- IP-PBX: infraestructura central física o software que proporciona funcionalidades de centralita privada sobre IP.
- G.711: códec de 64 kbps que ofrece calidad telefónica estándar sin compresión.
- G.729: códec de 8 kbps que utiliza compresión para optimizar el ancho de banda.
- T.38: protocolo ITU-T específico para transmisión de fax G3 sobre redes IP de forma robusta.
- Gateways: dispositivos de interconexión entre redes IP y tradicionales (FXS/FXO, RDSI, SIP-trunk).
- ITU-T: organismo de la ONU responsable de recomendaciones técnicas en telecomunicaciones y estándares de fax.
- IETF: organismo que define protocolos de Internet como SIP, RTP y SRTP mediante RFCs.
🧠 Recuerda
- VoIP es la técnica; telefonía IP es el servicio completo.
- FoIP requiere T.38 porque G3/T.30 no es compatible nativamente con paquetes IP.
- La IP-PBX es el corazón de la instalación, física o software.
- G.711 consume 64 kbps; G.729 solo 8 kbps pero con compresión.
- ITU-T para H.323 y T.38; IETF para SIP y RTP.
- Los gateways permiten la interconexión con redes tradicionales.
- SRTP y TLS garantizan la seguridad de las comunicaciones.
3. Características básicas, requisitos de QoS y soluciones
🎯 Idea clave
- La calidad de voz sobre IP depende críticamente de tres parámetros de red: latencia, jitter y pérdida de paquetes, cuyos umbrales máximos tolerables siguen la recomendación ITU-T G.114.
- El transporte VoIP utiliza obligatoriamente el protocolo UDP en lugar de TCP, asumiendo pérdidas limitadas para evitar los retardos propios de la retransmisión.
- Los mecanismos de QoS no aumentan el ancho de banda disponible, sino que priorizan el tráfico sensible mediante marcado y encolamiento diferenciado.
- La implementación de DiffServ con DSCP 46 (Expedited Forwarding) y la clasificación IEEE 802.1p constituyen el estándar de facto para garantizar la prioridad del tráfico de voz en capas 3 y 2 respectivamente.
- El control de admisión de llamadas (CAC) y los buffers de jitter adaptativos actúan como soluciones complementarias para mantener la calidad percibida (MOS) por encima de 4.0.
- En el Servicio Andaluz de Salud, la coexistencia de tráficos críticos como imágenes DICOM, videoconferencia clínica y VoIP hace imprescindible una planificación de QoS rigurosa para evitar degradaciones por congestión.
📚 Desarrollo
Tres parámetros críticos. La calidad de una comunicación VoIP se sustenta en latencia, jitter y pérdida de paquetes. La recomendación ITU-T G.114 establece un retardo unidireccional máximo de 150 ms; por encima de este valor la interactividad se deteriora, y superados los 400 ms la conversación resulta impracticable. El jitter, o variación del retardo entre paquetes consecutivos, debe mantenerse igual o inferior a 30 ms para evitar cortes de audio. Respecto a la pérdida de paquetes, hasta un 1% resulta imperceptible con algoritmos PLC eficientes, pero por encima del 3-5% la degradación se hace visible e inteligible.
Protocolo de transporte y consumo. VoIP emplea exclusivamente UDP, renunciando a la fiabilidad de TCP para evitar los retardos de retransmisión que resultan contraproducentes en comunicaciones en tiempo real. El ancho de banda real por llamada incluye no solo la tasa del códec, sino las cabeceras RTP, UDP, IP y Ethernet, resultando aproximadamente 87 kbps para G.711 y 31 kbps para G.729.
Concepto correcto de QoS. Un error frecuente identifica QoS con mayor ancho de banda, cuando en realidad se trata de mecanismos de priorización del tráfico existente. Una red puede disponer de capacidad media suficiente y, no obstante, ofrecer mala calidad de voz si existen colas mal configuradas, ráfagas de tráfico o congestión en accesos. La QoS prioriza el reparto de la capacidad existente, pero no la crea.
Marcado y clasificación. En capa 3, DiffServ (RFC 2474) redefine el campo ToS de IPv4 como DSCP de 6 bits, donde el valor EF (Expedited Forwarding) o DSCP 46 (binario 101110) se reserva para tráfico de voz, garantizando baja latencia y pérdida. En capa 2, IEEE 802.1p define 8 niveles de prioridad (CoS 0-7) dentro de la etiqueta 802.1Q, siendo habitual asignar el valor 5 para VoIP y 6 para videoconferencia.
Mecanismos de encolamiento. Los switches y routers implementan colas diferenciadas mediante técnicas como LLQ (Low Latency Queuing), que combina una cola de prioridad estricta para voz con CBWFQ (Class-Based Weighted Fair Queuing) para el resto del tráfico. Esta arquitectura asegura que los paquetes de voz no esperen detrás de grandes transferencias de datos.
Soluciones complementarias. El jitter buffer, preferiblemente adaptativo, absorbe las variaciones de retardo a costa de añadir latencia procesada. Paralelamente, el CAC (Call Admission Control) bloquea nuevas llamadas cuando la red carece de capacidad suficiente, preservando la calidad MOS de las conversaciones activas y evitando la sobresuscripción del enlace.
🧩 Elementos esenciales
- LJP-150: Mnemotecnia para recordar los límites críticos: Latencia ≤150 ms, Jitter ≤30 ms y Pérdida ≤1%.
- DSCP 46 (EF): Valor de 6 bits en cabecera IP que marca el tráfico de voz con máxima prioridad en redes DiffServ.
- CoS 5: Valor habitual de prioridad IEEE 802.1p asignado al tráfico VoIP en redes Ethernet conmutadas.
- Jitter buffer: Memoria intermedia que compensa la variabilidad de llegada de paquetes, configurable en modo fijo o adaptativo.
- LLQ: Mecanismo de encolamiento que asigna prioridad estricta al tráfico de voz mientras mantiene fairness para datos.
- CAC: Función que controla la admisión de nuevas llamadas previniendo la degradación de calidad por exceso de tráfico simultáneo.
- MOS: Escala de 1 a 5 que mide la calidad percibida; el objetivo mínimo corporativo es 4.0, siendo G.711 ≈ 4.1 y G.729 ≈ 3.9.
- IntServ: Arquitectura alternativa basada en RSVP que reserva recursos por flujo individual, poco escalable en redes grandes frente a DiffServ.
- VLAN de voz: Separación lógica del tráfico telefónico que facilita la aplicación de políticas de QoS y el diagnóstico de incidencias.
- DiffServ vs IntServ: El primero escala mediante clasificación agregada por clases, mientras que el segundo ofrece garantías estrictas pero solo es viable en entornos controlados.
🧠 Recuerda
- VoIP requiere UDP, no TCP, para minimizar el retardo de transporte.
- La mnemotecnia LJP-150 resume los tres umbrales críticos de calidad de red.
- DSCP 46 binario 101110 equivale a Expedited Forwarding para voz en DiffServ.
- Un enlace infradimensionado con QoS bien configurado solo distribuye mejor la degradación, pero no elimina la congestión.
- Los valores CoS 5 (voz) y 6 (video) en 802.1p son los estándares de facto en entornos empresariales.
- El jitter obliga a elegir entre mayor buffer (más latencia) o mayor riesgo de cortes de audio.
- El CAC actúa como guardián de la calidad rechazando llamadas cuando la red está saturada.
- En el SAS, una descarga masiva de imágenes DICOM puede degradar llamadas VoIP si no existe QoS diferenciada.
- El ancho de banda real incluye cabeceras: G.711 consume unos 87 kbps y G.729 unos 31 kbps por llamada.
- La planificación de capacidad es tan importante como la configuración de QoS para garantizar el MOS ≥ 4.0.
4. Protocolos de señalización
🎯 Idea clave
- La señalización constituye el plano de control que permite establecer, modificar y terminar sesiones de comunicación multimedia sobre IP.
- Este proceso gestiona la localización de participantes, la negociación de parámetros de sesión y el ciclo de vida de la llamada, distinguiéndose radicalmente del transporte de medios.
- Los principales protocolos estándar son SIP, H.323, MGCP y H.248/MEGACO, además de soluciones propietarias como SCCP de Cisco.
- SIP utiliza sintaxis de texto plano similar a HTTP y emplea SDP para la descripción de sesiones, mientras que H.323 emplea codificación binaria ASN.1.
- La separación entre señalización (plano de control) y transporte de medios mediante RTP/RTCP es fundamental en la arquitectura de VoIP.
- El conocimiento de estos protocolos resulta esencial para el técnico especialista encargado de mantener servicios de comunicación en entornos corporativos complejos.
📚 Desarrollo
Definición y alcance. La señalización comprende el conjunto de protocolos y procedimientos que permiten localizar a los participantes en una comunicación multimedia, iniciar la sesión, negociar sus características técnicas, modificarla durante su desarrollo y finalizarla ordenadamente. Esta capa de control gestiona aspectos como la identidad de los usuarios, la resolución de direcciones lógicas a direcciones IP físicas y la administración completa del estado de la llamada.
Separación arquitectónica. Existe una distinción esencial entre el plano de control y el plano de datos. Mientras la señalización gestiona el establecimiento y gestión de la sesión, el transporte real del audio y vídeo se realiza mediante protocolos de tiempo real como RTP sobre UDP. Ambos flujos pueden transitar por caminos de red distintos, lo que explica posibles situaciones donde la llamada se establece pero falta el contenido multimedia.
Protocolos principales. Los estándares abiertos más relevantes incluyen SIP, definido por el IETF en el RFC 3261, que emplea sintaxis de texto plano similar a HTTP y utiliza SDP para la descripción de sesiones. H.323, desarrollado por la ITU-T desde 1996 hasta su versión 7 en 2009, proporciona un marco completo mediante codificación binaria ASN.1. Complementariamente, MGCP y H.248/MEGACO gestionan el control de pasarelas de medios en arquitecturas avanzadas.
Funciones específicas. La señalización cumple tareas críticas como la identificación y direccionamiento mediante URI o alias, la localización de terminales en la red, el establecimiento de llamadas mediante invitaciones y respuestas, la negociación de códecs y puertos, la gestión de transferencias y esperas, y la terminación ordenada con liberación de recursos. Además, proporciona mecanismos de autenticación, autorización y registro de eventos para garantizar la seguridad y trazabilidad.
SIP y sus mecanismos. Este protocolo basado en petición-respuesta emplea mensajes específicos como INVITE para iniciar sesiones, ACK para confirmar establecimientos, BYE para finalizar comunicaciones, REGISTER para el registro de agentes de usuario, OPTIONS para consultar capacidades y CANCEL para abortar peticiones pendientes. La negociación de parámetros del medio se realiza mediante el protocolo SDP, separando claramente la descripción de la sesión del transporte efectivo de los datos.
H.323 y arquitectura. Este estándar define cuatro componentes principales: terminales, gateways, gatekeepers y unidades de control multipunto. El gatekeeper centraliza funciones de control de admisión mediante el protocolo RAS sobre el puerto UDP 1719, resolviendo alias a direcciones IP y gestionando el ancho de banda. La señalización de llamada utiliza H.225.0/Q.931 sobre TCP 1720, mientras que H.245 gestiona la negociación de capacidades y apertura de canales lógicos para los flujos RTP.
Aplicación profesional. En organizaciones sanitarias complejas, el técnico especialista requiere comprender estos protocolos para diagnosticar servicios de voz, videollamada y colaboración sobre IP. Cualquier servicio corporativo multimedia demanda mecanismos robustos de establecimiento de sesión, negociación de parámetros, garantía de calidad y trazabilidad, haciendo imprescindible el dominio de la señalización para la integración y mantenimiento de infraestructuras de comunicaciones.
🧩 Elementos esenciales
- Plano de control: conjunto de protocolos que gestiona el establecimiento, modificación y terminación de sesiones, distinguible del transporte de contenido multimedia.
- Transporte de medios: flujo de audio y vídeo que utiliza RTP sobre UDP, independiente de la señalización y posiblemente por caminos de red diferentes.
- SIP (Session Initiation Protocol): protocolo IETF RFC 3261 de texto plano basado en petición-respuesta que utiliza SDP para negociar parámetros de sesión.
- Mensajes SIP: INVITE (iniciar), ACK (confirmar), BYE (terminar), REGISTER (registrar agente), OPTIONS (consultar capacidades) y CANCEL (cancelar petición).
- H.323: estándar ITU-T completo para multimedia sobre paquetes que emplea codificación binaria ASN.1, con versiones desde 1996 hasta la 7 en 2009.
- Componentes H.323: terminales, gateways, gatekeepers (control de admisión y registro RAS) y MCU (unidades de control multipunto).
- Protocolos H.323: H.225.0/Q.931 para señalización de llamada, H.245 para negociación de capacidades, y RTP/RTCP para transporte de medios.
- MGCP y H.248/MEGACO: protocolos específicos para el control de pasarelas de medios en arquitecturas VoIP.
- Funciones de señalización: identificación, localización, establecimiento, negociación de códecs y puertos, modificación de sesión, terminación y seguridad.
- SDP (Session Description Protocol): protocolo empleado por SIP para describir y negociar características de la sesión multimedia.
🧠 Recuerda
- La señalización gestiona el "antes" y el "después" de la llamada, mientras que RTP transporta el contenido durante la comunicación.
- SIP es textual y similar a HTTP; H.323 es binario y basado en ASN.1.
- Sin señalización, los terminales no pueden registrarse ni negociar códecs, impidiendo el funcionamiento como red telefónica real.
- El gatekeeper H.323 es el elemento central de control de admisión y gestión de registro RAS.
- La separación entre plano de control y plano de datos explica por qué una llamada puede establecerse pero quedarse sin audio.
- El técnico debe conocer estos protocolos para diagnosticar servicios multimedia en entornos corporativos sanitarios.
- SIP utiliza SDP para la descripción de sesiones, no para el transporte de medios en sí.
- H.323 utiliza puertos específicos: 1719 UDP para RAS y 1720 TCP para señalización H.225.0.
5. El estándar H
🎯 Idea clave
- H.323 constituye la recomendación fundamental del ITU-T para comunicaciones multimedia en tiempo real sobre infraestructuras IP.
- Su arquitectura modular funciona como paraguas que integra múltiples protocolos especializados según la función requerida en cada fase de la comunicación.
- El estándar está diseñado específicamente para operar sobre redes de paquetes que no garantizan calidad de servicio por sí mismas.
- Coordina funciones críticas como señalización de llamada, registro de terminales, negociación de capacidades y transporte de medios audiovisuales.
- Ha evolucionado desde su primera versión en 1996 hasta la revisión vigente de 2022, incorporando mejoras en seguridad y movilidad.
- Define entidades arquitectónicas específicas como terminales, gatekeepers, pasarelas y unidades de control multipunto para gestionar las comunicaciones.
📚 Desarrollo
Marco normativo internacional. H.323 es la recomendación emitida por la Unión Internacional de Telecomunicaciones a través de su sector de normalización ITU-T. Su denominación técnica oficial es Packet-based multimedia communications systems, estableciendo un marco completo para la transmisión integrada de voz, vídeo y datos sobre redes basadas en paquetes, incluyendo redes de área local, de área amplia e Internet.
Arquitectura paraguas. El rasgo conceptual más relevante reside en que H.323 no constituye un protocolo monolítico, sino una arquitectura modular que coordina un conjunto de recomendaciones y protocolos especializados. Cada subprotocolo resuelve una función concreta dentro del ciclo de vida de la comunicación multimedia, permitiendo flexibilidad operativa y adaptación a diferentes escenarios de red.
Funciones principales. El estándar organiza procesos diferenciados para la señalización de llamada, el registro y admisión de terminales en la zona de control, la negociación de capacidades multimedia entre endpoints, el transporte efectivo de los flujos de medios y los mecanismos de seguridad aplicables a la comunicación establecida.
Componentes fundamentales. La arquitectura define entidades específicas que interoperan en la red: los terminales como endpoints de usuario, los gatekeepers para control de acceso y resolución de direcciones mediante alias, las pasarelas para interconexión con redes telefónicas tradicionales PSTN, y las unidades de control multipunto para gestionar conferencias entre múltiples participantes simultáneos.
Protocolos asociados. La operativa de H.323 se sustenta en protocolos complementarios especializados que operan en puertos específicos: H.225.0 gestiona el registro y admisión mediante RAS sobre UDP, Q.931 controla la señalización de llamada sobre TCP para el establecimiento de conexiones, y H.245 negocia las capacidades de los medios y el control de la conferencia una vez establecida la comunicación.
Evolución histórica. Publicada inicialmente en 1996, la recomendación ha transitado por versiones sucesivas que han ampliado sus capacidades operativas. Las revisiones posteriores han incorporado características de acceso a Internet, seguridad avanzada, movilidad de terminales e integración con sistemas telefónicos tradicionales, culminando en la versión 8 aprobada en marzo de 2022 como base oficial vigente.
🧩 Elementos esenciales
- ITU-T: organismo internacional que desarrolla y publica la recomendación H.323 como parte de sus estándares de telecomunicaciones sectoriales.
- Arquitectura paraguas: modelo donde H.323 no es un protocolo único sino un marco que coordina múltiples protocolos especializados según la función específica requerida.
- Redes de paquetes: infraestructura objetivo del estándar, específicamente aquellas que no garantizan calidad de servicio como Internet o redes LAN/WAN heterogéneas.
- Terminales: dispositivos endpoint que inician o reciben comunicaciones multimedia dentro de la arquitectura H.323 y negocian sus capacidades.
- Gatekeepers: entidades de control que gestionan registro, admisión, resolución de alias numéricos y control de ancho de banda en la zona H.323.
- Gateways: componentes que permiten la interconexión y traducción de señalización entre redes H.323 y redes telefónicas tradicionales PSTN o ISDN.
- MCU: Multipoint Control Unit, entidad especializada en gestionar conferencias con tres o más participantes simultáneos mediante control de audio y vídeo.
- H.225.0: protocolo de registro, admisión y estado que opera típicamente sobre el puerto UDP 1719 para la gestión de terminales.
- Q.931: protocolo de señalización de llamada y control de conexión que utiliza el puerto TCP 1720 para el establecimiento de llamadas.
- H.245: protocolo dedicado a la negociación de capacidades multimedia y el control de los flujos de medios durante la conferencia establecida.
- Versiones: evolución cronológica desde 1996 pasando por revisiones en 1998, 1999, 2000, 2003, 2006, 2009 hasta la versión 8 de marzo de 2022.
🧠 Recuerda
- H.323 es recomendación ITU-T, no un protocolo único sino arquitectura paraguas que integra múltiples especificaciones.
- Diseñado específicamente para redes IP que no garantizan calidad de servicio por sí mismas.
- Integra voz, vídeo y datos sobre infraestructuras de paquetes heterogéneas sin requerir QoS previa.
- Gatekeeper controla registro y admisión de terminales; Gateway conecta con redes telefónicas tradicionales PSTN.
- H.225.0 gestiona RAS sobre UDP 1719 para el registro y admisión de terminales en la zona.
- Q.931 se encarga de la señalización de llamada y establecimiento de conexiones sobre TCP 1720.
- H.245 negocia capacidades de medios y controla la conferencia una vez establecida la comunicación.
- La versión 8 de marzo de 2022 constituye la base oficial vigente del estándar internacional.
- Terminal, gatekeeper, gateway y MCU son las cuatro entidades arquitectónicas fundamentales definidas por el estándar.
6. 323 para servicios multimedia sobre redes de paquetes
🎯 Idea clave
- H.323 es la recomendación ITU-T que define el marco completo para comunicaciones multimedia profesionales sobre redes de paquetes IP.
- No constituye un protocolo único, sino una arquitectura paraguas que coordina múltiples protocolos especializados según la función específica.
- Está diseñado específicamente para operar sobre redes que no garantizan calidad de servicio, como redes de área local, de área amplia e Internet.
- La versión 8 de la recomendación fue aprobada el 16 de marzo de 2022, manteniendo su vigencia como estándar de referencia en entornos corporativos y sanitarios.
- Integra voz, vídeo y datos en tiempo real, siendo el audio obligatorio mientras que vídeo y datos permanecen como opcionales.
- Ha sido durante años el estándar de referencia para servicios multimedia profesionales sobre redes de paquetes.
📚 Desarrollo
Definición normativa. H.323 constituye la recomendación del sector de normalización de telecomunicaciones de la Unión Internacional de Telecomunicaciones (ITU-T). Su denominación técnica oficial es "Packet-based multimedia communications systems", estableciendo un marco de interoperabilidad para comunicaciones en tiempo real sobre infraestructuras IP.
Arquitectura paraguas. El rasgo conceptual más relevante reside en que no se trata de un único protocolo monolítico, sino de una arquitectura modular que coordina un conjunto de recomendaciones especializadas. Cada función del ciclo de vida de la comunicación —señalización de llamada, registro de terminales, negociación de capacidades, transporte de medios y seguridad— es resuelta por el subprotocolo más adecuado para cada caso particular.
Ambito de aplicación. El estándar nace precisamente para que voz, vídeo y datos puedan funcionar sobre infraestructuras de paquetes donde existen retardo, variación de retardo y pérdidas, sin presuponer una red perfecta ni reservada. Su ámbito comprende redes de área local, redes de área amplia e Internet, permitiendo la transmisión integrada de los tres tipos de medios.
Componentes fundamentales. La arquitectura define cuatro entidades esenciales: los terminales que inician o reciben comunicaciones; los gatekeepers que gestionan registro, admisión y resolución de alias; los gateways que permiten la interconexión con redes telefónicas conmutadas tradicionales; y las unidades de control multipunto (MCU) para conferencias entre múltiples participantes.
Protocolos de señalización. H.225.0 RAS opera sobre UDP puerto 1719 para la comunicación entre terminales y gatekeepers, gestionando mensajes de descubrimiento, registro, admisión, cambio de ancho de banda, desconexión e información de estado. La señalización de llamada utiliza Q.931 sobre TCP puerto 1720, con mensajes como Setup, Call Proceeding, Alerting, Connect y Release Complete.
Control de medios. H.245 se encarga de la negociación de capacidades y el control de los medios transmitidos entre terminales. El transporte efectivo de los flujos multimedia se realiza mediante RTP/RTCP, completando el ciclo de protocolos necesarios para el establecimiento y mantenimiento de las comunicaciones.
Modos de operación. La señalización de llamada puede establecerse directamente entre terminales o mediante enrutamiento a través del gatekeeper. El modo directo simplifica el tráfico entre extremos, mientras que el modo enrutado proporciona mayor control y supervisión aunque genera mayor carga en el servidor.
🧩 Elementos esenciales
- ITU-T: organismo de normalización de las telecomunicaciones de la Unión Internacional de Telecomunicaciones que desarrolla y mantiene la recomendación H.323.
- Arquitectura paraguas: concepción de H.323 como coordinador modular de múltiples protocolos especializados y no como protocolo único.
- Gatekeeper: entidad encargada del registro, admisión, resolución de alias y control de ancho de banda de los terminales en la zona de control.
- Gateway: componente que posibilita la interconexión entre la red de paquetes H.323 y la red telefónica conmutada tradicional (PSTN).
- MCU (Multipoint Control Unit): dispositivo necesario para establecer conferencias multipunto entre tres o más terminales simultáneamente.
- H.225.0 RAS: subprotocolo de registro, admisión y estado que opera sobre UDP puerto 1719 entre terminales y gatekeepers.
- H.225.0 Q.931: protocolo de señalización de llamada sobre TCP puerto 1720, adaptado de la RDSI para el establecimiento y terminación de llamadas.
- H.245: protocolo específico para la negociación de capacidades y control de medios entre terminales durante la comunicación.
- Audio obligatorio: único medio obligatorio en H.323, mientras que vídeo y datos son tratados como opcionales según las capacidades del terminal.
- Redes sin QoS: entorno natural de operación de H.323, diseñado explícitamente para infraestructuras IP sin garantía de calidad de servicio.
🧠 Recuerda
- H.323 es una arquitectura paraguas, no un protocolo único.
- La versión 8 se aprobó el 16 de marzo de 2022.
- Puerto UDP 1719 para RAS y TCP 1720 para señalización Q.931.
- El gatekeeper gestiona registro, admisión y resolución de alias.
- El gateway conecta con la PSTN tradicional.
- Audio obligatorio, vídeo y datos opcionales.
- Modo directo versus modo enrutado por gatekeeper.
- H.245 controla la negociación de capacidades y medios.
- Diseñado para funcionar sobre redes IP con retardo y pérdidas.
- Estándar de referencia histórico para videoconferencia profesional sobre redes de paquetes.
7. Escenarios de aplicación
🎯 Idea clave
- Los escenarios de aplicación trascienden el diseño arquitectónico para abordar el uso real de las tecnologías en situaciones concretas de comunicación.
- La documentación oficial de H.323 establece un marco de referencia que contempla comunicaciones punto a punto, multipunto e interfunción mediante gateways.
- El escenario punto a punto representa la forma más elemental de comunicación multimedia sobre IP entre dos terminales o extremos.
- Los escenarios naturales abarcan la comunicación directa entre sedes, la colaboración entre varios participantes y la integración con redes heredadas.
- Los despliegues empresariales e institucionales en redes distribuidas constituyen escenarios aplicativos relevantes para organizaciones sanitarias extensas.
- La viabilidad práctica depende de resolver necesidades reales mediante direccionamiento, establecimiento de sesión y transporte efectivo de media.
📚 Desarrollo
Transición al plano operativo. Hablar de escenarios de aplicación implica evolucionar desde el diseño puramente arquitectónico hacia el plano de uso real, donde las capacidades técnicas responden a necesidades de comunicación efectivas en contextos organizacionales específicos. Esta perspectiva resulta fundamental para comprender cómo las infraestructuras teóricas se materializan en soluciones funcionales concretas.
Marco de referencia H.323. La documentación oficial del estándar H.323 resulta especialmente útil para definir estos escenarios, ya que contempla comunicaciones punto a punto, configuraciones multipunto e interfunción con otros entornos mediante el uso de gateways. Estas capacidades sugieren naturalmente distintos tipos de despliegues según las necesidades de conectividad y colaboración entre usuarios y sistemas.
Comunicación punto a punto. Un escenario básico fundamental consiste en la comunicación directa entre dos terminales o extremos multimedia, constituyendo la forma más simple de aplicación de servicios sobre IP. Dos usuarios o sistemas establecen una sesión, negocian capacidades mutuas y cursan audio, video o datos en tiempo real según los requerimientos específicos del momento.
Ámbitos de aplicación práctica. Este escenario puntual resulta aplicable a llamadas de voz convencionales, sesiones de soporte remoto con componente audiovisual, comunicación entre puestos profesionales distribuidos o interacción directa entre diferentes sedes organizacionales. Aunque aparentemente sencillo, condensa los elementos esenciales del modelo completo de comunicaciones multimedia.
Elementos operativos implicados. La implementación de este escenario involucra necesariamente mecanismos de direccionamiento, establecimiento de sesión, negociación de capacidades técnicas, transporte efectivo de media y procedimientos de cierre ordenado. Estos componentes constituyen la base sobre la que se construyen configuraciones más complejas y multifuncionales.
Escenarios extendidos. Además del intercambio directo entre dos extremos, la arquitectura contempla naturalmente escenarios de colaboración entre varios participantes simultáneos, integración con redes heredadas preexistentes y despliegues empresariales o institucionales distribuidos geográficamente, como los requeridos en entornos sanitarios extensos que conectan hospitales y centros de salud.
🧩 Elementos esenciales
- Plano de uso: dimensión operativa que trasciende el diseño técnico arquitectónico para centrarse en la aplicación práctica de las tecnologías en situaciones reales.
- H.323 como referencia: estándar que proporciona el marco conceptual para comunicaciones punto a punto, multipunto e interfunción mediante gateways.
- Escenario punto a punto: configuración básica entre dos terminales que establecen sesión directa para intercambio de audio, video o datos en tiempo real.
- Negociación de capacidades: proceso mediante el cual los extremos acuerdan parámetros técnicos antes del intercambio efectivo de información multimedia.
- Interfunción con redes heredadas: capacidad de conectar sistemas IP con infraestructuras preexistentes mediante elementos gateway especializados.
- Colaboración multipunto: escenario que permite la participación simultánea de múltiples usuarios o sistemas en una misma sesión comunicativa.
- Despliegues distribuidos: aplicaciones empresariales o institucionales que conectan múltiples ubicaciones geográficas mediante infraestructura IP unificada.
- Transporte de media: mecanismo de transmisión efectiva del contenido audiovisual una vez establecidos los parámetros de sesión entre los participantes.
- Cierre ordenado: procedimientos técnicos que finalizan la sesión de forma controlada liberando recursos y terminando conexiones adecuadamente.
🧠 Recuerda
- Los escenarios transforman la arquitectura técnica en soluciones de uso real y concreto.
- H.323 define tres modalidades fundamentales: punto a punto, multipunto e interfunción gateway.
- El escenario punto a punto es el más simple pero contiene todos los elementos esenciales del modelo completo.
- La negociación de capacidades debe preceder siempre al transporte efectivo de media entre terminales.
- Los gateways facilitan la integración imprescindible entre redes IP y sistemas heredados tradicionales.
- Los despliegues institucionales requ necesitan conectar múltiples sedes distribuidas geográficamente.
- El soporte remoto audiovisual es una aplicación típica del escenario punto a punto entre profesionales.
- El establecimiento de sesión comprende direccionamiento, negociación y acuerdo de parámetros técnicos.
- Las sesiones de soporte técnico remoto utilizan componente audiovisual sobre la base punto a punto.
- El cierre ordenado garantiza la liberación adecuada de recursos al finalizar las comunicaciones.
8. Servicios de videoconferencia
🎯 Idea clave
- El SAS utiliza H.323 como protocolo predominante para la infraestructura de videoconferencia profesional en hospitales y gerencias.
- Los terminales disponen de alias E.164 que permiten el marcado directo desde teléfonos corporativos u otras salas de videoconferencia.
- Las aplicaciones principales incluyen telemedicina, comités de tumores, reuniones de gestión y formación continuada entre profesionales sanitarios.
- La interoperabilidad con otras administraciones y plataformas modernas se garantiza mediante gateways H.323-SIP y Session Border Controllers.
- El técnico especialista debe gestionar el registro en gatekeepers, la configuración de marcaciones y la resolución de incidencias audiovisuales.
📚 Desarrollo
Infraestructura corporativa. El Servicio Andaluz de Salud mantiene H.323 como estándar fundamental para videoconferencia profesional. Los hospitales, gerencias y centros formativos disponen de terminales de fabricantes como Polycom, Cisco, Sony o Lifesize, registrados en gatekeepers centrales que gestionan el control de admisión y el enrutamiento de llamadas.
Identificación E.164. Los equipos utilizan alias numéricos E.164 que funcionan como números de teléfono propios, permitiendo a los usuarios marcar directamente desde terminales corporativos o desde otras salas, simplificando significativamente la operativa sin necesidad de direcciones IP complejas.
Aplicaciones asistenciales. Las videoconferencias soportan casos de uso crítico como telemedicina, comités de tumores multidisciplinarios, sesiones clínicas formativas, reuniones de gestión sanitaria y juntas técnicas, facilitando la colaboración entre profesionales distribuidos en diferentes centros del mapa andaluz.
Conectividad externa. Cuando los participantes se encuentran en redes externas, otras administraciones públicas, hospitales privados o sedes internacionales, la conexión se establece mediante gateways H.323-SIP y Session Border Controllers que gestionan la travesía de NAT, el cifrado de las comunicaciones y la normalización del direccionamiento entre redes heterogéneas.
Interoperabilidad moderna. La infraestructura H.323 coexiste con plataformas SIP y WebRTC actuales mediante gateways y unidades MCU multiprotocolo, permitiendo integrar soluciones de colaboración unificada y plataformas en la nube autorizadas sin interrumpir el servicio legacy existente.
Gestión técnica operativa. El técnico especialista debe dominar la operativa diaria de los terminales, los procedimientos de registro en gatekeepers, la configuración de marcaciones E.164 y la resolución de incidencias habituales como registros perdidos, llamadas que no establecen, audio sin vídeo o calidad deficiente de los medios.
Seguridad normativa. Las comunicaciones de videoconferencia en el sector público sanitario requieren cifrado y control de acceso obligatorios conforme al Esquema Nacional de Seguridad (RD 311/2022), el RGPD y la LOPDGDD, especialmente cuando involucran datos de salud en sesiones de telemedicina.
Conferencias multipunto. Las reuniones entre múltiples participantes utilizan unidades MCU que incorporan el Multipoint Controller para la gestión de la sesión y el Multipoint Processor para la mezcla de audio y el switching de vídeo, permitiendo conferencias con tres o más sedes simultáneas.
🧩 Elementos esenciales
- Alias E.164: Identificadores numéricos asignados a terminales que permiten el marcado telefónico directo entre salas de videoconferencia del SAS.
- Gatekeeper central: Entidad de control que gestiona el registro, admisión, autorización y enrutamiento de llamadas H.323 en la infraestructura sanitaria andaluza.
- Gateways H.323-SIP: Pasarelas de interoperabilidad que conectan la infraestructura propia con sistemas externos basados en protocolos modernos.
- Session Border Controller: Dispositivo de frontera que gestiona la seguridad, el NAT traversal y el cifrado en conexiones con redes externas.
- MCU: Unidad de control multipunto compuesta por Multipoint Controller para señalización y Multipoint Processor para procesamiento de medios en conferencias grupales.
- Terminales H.323: Equipos de videoconferencia de marcas como Polycom, Cisco, Sony o Lifesize instalados en hospitales y gerencias del SAS.
- Telemedicina: Servicio clínico que utiliza videoconferencia para consultas remotas, seguimiento de pacientes y soporte entre centros sanitarios.
- H.239: Extensión del protocolo que permite la transmisión simultánea de contenido dual, combinando la señal de la cámara con presentaciones de documentos.
- Esquema Nacional de Seguridad: Marco normativo que obliga al cifrado y control de acceso en las comunicaciones de videoconferencia del sector público.
- Fast Connect: Optimización del protocolo H.323 que acelera el establecimiento de llamadas reduciendo el número de mensajes de señalización intercambiados.
🧠 Recuerda
- H.323 permanece como el estándar predominante en videoconferencia profesional del SAS, especialmente en salas de alta gama.
- Los alias E.164 actúan como números de teléfono corporativos para las salas de videoconferencia.
- Los gateways y SBC son indispensables para conectar con otras administraciones, hospitales privados o sedes internacionales.
- El técnico debe conocer los procedimientos de registro en gatekeeper y la solución de incidencias típicas como pérdida de registro o calidad deficiente.
- Las conferencias entre múltiples puntos requieren MCU con funciones separadas de control y procesamiento.
- La telemedicina y los comités de tumores representan usos críticos de la videoconferencia en el entorno sanitario.
- El cifrado de comunicaciones es obligatorio según el ENS para la protección de datos de salud.
- Los terminales deben mantenerse registrados en los gatekeepers centrales para garantizar su operatividad y localización.
- La coexistencia con plataformas SIP/WebRTC modernas se resuelve mediante infraestructura multiprotocolo.
- Las videoconferencias implican gestión coordinada con operadores de red y proveedores externos cuando se cruzan fronteras de la red corporativa.