CiberForja

Diseño de una red LAN empresarial de alta disponibilidad

Diseñar una LAN empresarial de alta disponibilidad requiere redundancia en cada capa: acceso, distribución y núcleo. Aprende los patrones y tecnologías que lo hacen posible.

CCiberForja·2 de junio de 2026·15 min de lectura
Compartir:

La red LAN es la columna vertebral de cualquier organización moderna. Una caída de red no es solo un inconveniente técnico: dependiendo del sector y del tamaño de la empresa, puede representar pérdidas económicas directas, incumplimientos de SLA con clientes o, en entornos críticos como sanidad o infraestructuras, consecuencias más graves. Diseñar una red LAN con alta disponibilidad implica eliminar los puntos únicos de fallo mediante redundancia a múltiples niveles, y configurar los mecanismos de conmutación automática para que la recuperación ante fallos sea lo más rápida y transparente posible.

La alta disponibilidad en redes no se logra con un único equipamiento más caro; se logra con arquitecturas redundantes y bien diseñadas. Un switch de gama alta sin redundancia es menos disponible que dos switches de gama media correctamente enlazados. Este principio, frecuentemente ignorado por las presiones presupuestarias, es el fundamento del diseño de redes empresariales resilientes.

Esta guía cubre el modelo jerárquico de tres capas, los protocolos de redundancia de capa 2 y 3, el diseño de enlaces redundantes, las tecnologías de agregación de enlaces y las mejores prácticas para documentar y mantener una infraestructura LAN de alta disponibilidad.

El modelo jerárquico de tres capas

El modelo de diseño jerárquico de Cisco, ampliamente adoptado por la industria, divide la red en tres capas lógicas: acceso (access), distribución (distribution) y núcleo (core). Esta separación no es solo teórica; tiene implicaciones directas en cómo se despliega la redundancia y cómo se gestionan los fallos.

La capa de acceso es donde los dispositivos finales (ordenadores, teléfonos, impresoras, APs) se conectan a la red. Los switches de acceso no necesitan gran potencia de routing, pero sí deben ser fiables y soportar las funciones de capa 2 necesarias (VLANs, spanning tree, port security). La capa de distribución agrega el tráfico de los switches de acceso, aplica las políticas de routing y seguridad inter-VLAN, y conecta hacia el núcleo. La capa de núcleo transporta el tráfico agregado de toda la red con el menor número de latencia posible; aquí la velocidad es prioritaria sobre cualquier otra consideración.

Redundancia en la capa de acceso

Para evitar que la caída de un switch de acceso deje sin red a un conjunto de usuarios, la estrategia más común es conectar cada switch de acceso a dos switches de distribución diferentes mediante enlaces trunk. Esto significa que si uno de los switches de distribución falla, los usuarios de ese switch de acceso siguen teniendo conectividad a través del segundo enlace. La tecnología que gestiona este escenario en capa 2 es Spanning Tree Protocol (STP) o sus variantes mejoradas.

A nivel de servidor, la redundancia en la capa de acceso se implementa mediante NIC teaming o bonding: el servidor tiene dos tarjetas de red conectadas a dos switches de acceso diferentes. En modo activo-pasivo, una NIC está activa y la otra en espera; si la activa falla, la pasiva toma el relevo sin interrupción del servicio. En modo activo-activo (LACP), ambas NICs están activas y el tráfico se distribuye entre ellas, ofreciendo además mayor ancho de banda.

Spanning Tree Protocol: necesario pero insuficiente

STP es el protocolo que evita los bucles de capa 2 en redes con redundancia. Sin STP, los frames de broadcast circularían indefinidamente por los bucles físicos, saturando la red en segundos (broadcast storm). STP elige un switch raíz y bloquea los puertos redundantes que forman bucles, activándolos solo cuando se detecta un fallo en el camino principal. El problema del STP clásico (802.1D) es su tiempo de convergencia: puede tardar entre 30 y 50 segundos en activar un puerto bloqueado tras un fallo, lo que es inaceptable para muchas aplicaciones empresariales.

RSTP (Rapid Spanning Tree Protocol, 802.1w) reduce el tiempo de convergencia a menos de 10 segundos en la mayoría de los casos, y en redes bien diseñadas puede converger en 1-2 segundos. MSTP (Multiple Spanning Tree Protocol, 802.1s) permite tener instancias de spanning tree diferentes para distintos grupos de VLANs, lo que optimiza el uso de los enlaces redundantes. En Cisco, la implementación propietaria PVST+ (Per-VLAN Spanning Tree) crea una instancia de STP por cada VLAN, permitiendo balancear el tráfico activo entre múltiples rutas redundantes.

VSS y StackWise: eliminando STP del diseño

La mejor forma de evitar los problemas y la complejidad de STP es eliminarlo del diseño mediante virtualización de switches. Cisco Virtual Switching System (VSS) permite unir dos switches Catalyst en un único switch lógico. Desde la perspectiva del resto de la red, el VSS es un único dispositivo con múltiples slots. Los enlaces hacia el VSS pueden configurarse como port channels activos desde ambos switches físicos, eliminando la necesidad de STP para gestionar los redundantes (que son activos simultáneamente).

Cisco StackWise es una tecnología similar para switches de acceso de la gama Catalyst 9000: múltiples switches físicos se unen mediante un cable de stack dedicado y se gestionan como un único switch lógico. Esto simplifica enormemente la gestión (una sola IP de gestión, una sola configuración) y permite que los puertos de uplink al switch de distribución estén en modo activo-activo. HPE/Aruba tiene tecnologías equivalentes (IRF - Intelligent Resilient Framework y Virtual Switching Framework).

Redundancia de capa 3: HSRP, VRRP y GLBP

En la capa de distribución o en el firewall, los dispositivos de red actúan como gateways (puertas de enlace) para los hosts de cada VLAN. Si el gateway falla, los hosts pierden la conectividad a otras redes aunque la LAN local funcione perfectamente. Los protocolos de redundancia de primera salto (FHRP) solucionan este problema creando un gateway virtual compartido entre dos o más dispositivos físicos.

HSRP (Hot Standby Router Protocol) es la implementación propietaria de Cisco: dos o más routers/switches comparten una IP y MAC virtual. Uno de ellos es el activo y responde a las peticiones ARP de los hosts; el otro está en espera y toma el rol activo si el primero falla. El tiempo de conmutación es típicamente inferior a 10 segundos con la configuración de timers predeterminada, y puede reducirse a menos de 1 segundo con timers agresivos. VRRP (Virtual Router Redundancy Protocol, RFC 5798) es el equivalente estándar abierto, compatible con equipos de diferentes fabricantes. GLBP (Gateway Load Balancing Protocol) va más lejos y permite que varios dispositivos estén activos simultáneamente, distribuyendo el tráfico entre ellos.

Link Aggregation: LACP y port channels

Link Aggregation (LAG), estandarizado en IEEE 802.3ad como LACP (Link Aggregation Control Protocol), permite unir múltiples puertos físicos en un único canal lógico. Esto proporciona dos ventajas simultáneas: mayor ancho de banda (la suma de los enlaces físicos) y redundancia (si un enlace falla, el tráfico se redistribuye entre los restantes sin interrupción). Un port channel con dos puertos de 1 Gbps ofrece hasta 2 Gbps de ancho de banda con redundancia automática.

LACP es especialmente útil en los uplinks entre switches de acceso y distribución, y entre switches de distribución y el núcleo. También es estándar en los enlaces de servidores (NIC teaming con LACP). La configuración en Cisco IOS requiere crear una interfaz de port channel y asignar los puertos físicos con 'channel-group X mode active' (donde 'active' indica que el puerto iniciará la negociación LACP). En HP/Aruba, el equivalente es el 'trunk' configurado con LACP.

El diseño del núcleo: velocidad sobre todo

La capa de núcleo debe diseñarse con el menor número de saltos posible y con los switches más rápidos disponibles. En empresas medianas, un núcleo colapsado (donde las funciones de distribución y núcleo se combinan en el mismo par de switches) es una arquitectura válida y más económica que un núcleo separado. Un par de switches de distribución de gama alta (como el Cisco Catalyst 9300 o el Aruba 3810M) con VSS o IRF puede actuar como núcleo colapsado para redes de hasta varios miles de usuarios.

En empresas más grandes con múltiples edificios o campus, el núcleo debe ser independiente y estar formado por switches de muy alta capacidad (como el Cisco Catalyst 9500 o el Aruba 8400) con enlace de 10 Gbps o superior entre los nodos del núcleo. La topología del núcleo suele ser un anillo redundante o una malla parcial entre los nodos, garantizando que la caída de cualquier enlace no divida la red.

Diseño de la infraestructura física: cableado y alimentación

La alta disponibilidad no termina en la configuración lógica. La infraestructura física es igual de importante. Los switches de distribución y núcleo deben estar en racks diferentes, idealmente en salas de comunicaciones separadas, para que un incidente físico (incendio, inundación, corte de alimentación) no elimine ambos nodos simultáneamente. El cableado entre switches de acceso y distribución debe seguir rutas físicas diferentes para evitar que un corte en una canalización deje al switch de acceso sin ambos uplinks.

  • Alimentación redundante: los switches de misión crítica deben tener dos fuentes de alimentación conectadas a circuitos eléctricos independientes (idealmente uno normal y uno SAI).
  • Cableado estructurado certificado: usar fibra óptica para los enlaces troncales entre plantas o edificios, con conectores LC dúplex y latiguillos de reserva disponibles.
  • Etiquetado consistente: cada cable, puerto y switch debe estar etiquetado con su destino y VLAN, facilitando el diagnóstico de problemas y los cambios futuros.
  • Documentación actualizada: diagramas de red físicos y lógicos mantenidos en una herramienta como NetBox, Lucidchart o Visio, actualizados con cada cambio.

Monitorización proactiva de la infraestructura LAN

Una red de alta disponibilidad no solo debe recuperarse de los fallos; debe detectarlos antes de que impacten a los usuarios. La monitorización de la infraestructura LAN debe incluir: estado de cada interfaz (up/down), errores de capa física (CRC errors, input errors) que pueden indicar cables degradados antes de que fallen completamente, utilización de ancho de banda por enlace para detectar cuellos de botella, estado de los protocolos de redundancia (HSRP, LACP) y temperatura de los switches en entornos con alta densidad de equipos.

Herramientas como Zabbix, PRTG, LibreNMS o Grafana con datasources SNMP permiten construir dashboards que muestren el estado de toda la infraestructura en tiempo real. Configurar alertas proactivas (por ejemplo, cuando la utilización de un enlace supera el 70% durante más de 5 minutos) permite actuar antes de que el problema afecte a los usuarios.

Gestión de cambios y prueba de la redundancia

Uno de los principios más ignorados en la operación de redes es probar periódicamente los mecanismos de redundancia. Una red que tiene configurada la redundancia pero nunca la ha probado puede descubrir en el peor momento que un cable no estaba bien conectado, que los timers de HSRP no estaban configurados correctamente o que un port channel nunca se negoció correctamente. La recomendación es programar pruebas de failover en ventanas de mantenimiento al menos cada seis meses: apagar físicamente el switch de distribución primario y verificar que los usuarios siguen teniendo conectividad a través del secundario, y que el tiempo de recuperación está dentro de los SLA establecidos.

La alta disponibilidad no es una característica que se compra; es una propiedad que se diseña, configura y verifica. Una red nunca probada en condiciones de fallo es, a efectos prácticos, una red sin alta disponibilidad.

Errores comunes en redes LAN empresariales

Entre los errores más habituales está el diseño plano (flat network): toda la empresa en una única subred sin VLANs ni segmentación, lo que amplifica el impacto de cualquier problema de broadcast storm o ataque de red. Otro error frecuente es no configurar RSTP correctamente (leaving STP in its default 802.1D mode), lo que resulta en tiempos de convergencia de hasta 50 segundos. También es habitual tener redundancia física (dos cables) pero no la redundancia lógica configurada (por ejemplo, un port channel nunca negociado en LACP), lo que da una falsa sensación de seguridad.

Conclusión

Diseñar una red LAN empresarial de alta disponibilidad requiere una combinación de arquitectura correcta, protocolos configurados apropiadamente e infraestructura física redundante. No es necesario disponer de presupuestos ilimitados: con un par de switches de distribución bien configurados, LACP en los uplinks, RSTP o VSS en la distribución y HSRP para los gateways, cualquier empresa mediana puede conseguir una disponibilidad de red que resista fallos de hardware individuales sin interrupción del servicio. El paso más importante es empezar por el diseño correcto antes de comprar equipos.

¿Te ha servido? Compártelo

Compartir:
C
Escrito por
CiberForja

Consultor TI. Especializado en sistemas, redes y ciberseguridad.

Más sobre nosotros →

Comentarios

Sé el primero en comentar.

Deja tu comentario

Sigue leyendo

</>
🌐Redes11 min de lectura

Introducción a las redes informáticas para principiantes

Las redes informáticas son fundamentales en la era digital, permitiendo la comunicación y el intercambio de datos entre dispositivos. En este artículo, exploraremos los conceptos básicos de las redes informáticas, su importancia y cómo funcionan. Aprenderemos sobre los diferentes tipos de redes, pro

6 de junio de 2026Leer artículo →