Sistema OCO (Ovh Check Out)
Introducción
El sistema OcO es un sistema que se utiliza en nuestra infraestructura para saber el estado de los servidores.
Cada servidor que funciona en un clúster debe verificarse a sí mismo y decir al resto si va bien o no. El sistema Oco es compatible con las tarjetas de reparto de carga de Cisco type SLB/ACE (probe SMTP).
Se utiliza el puerto 79 para la comunicación. Es extremadamente simple. Se conecta al puerto y el servidor dice "OK" o "KO" y luego, la comunicación se corta.
Instalación y configuración
Configuración de IP load-balancing
Antes de instalar Oco deberá haber instalado la IP load balancing en la interfaz
lo (loopback) del servidor (lo:0, lo:1, lo:2, etc...).
Para hacer funcionar la IP load balancing al servidor, debéis añadirla como Alias en la interfaz de red.
Esta nueva Ip debe añadirse en la interfaz
lo (loopback) del servidor.
Para ello, debéis seguir las instrucciones de la guía (cambiando el interfaz eth0 por lo):
NuevoAliasIp
La nueva IP load balancing quedará configurada, por ejemplo en la interfaz
lo:0.
Configuración del sistema Oco
El sistema Oco le permitirá una monitorización del clúster activa.
Este sistema de monitorización sólo es compatible con sistemas Linux.
Para instalar y configurar el sistema Oco en su servidor basta con teclear estos dos comandos :
# wget ftp://ftp.ovh.net/made-in-ovh/oco/oco-ded.tar.gz -O oco-ded.tar.gz
# tar xzf oco-ded.tar.gz && cd oco-ded-1.15 && ./install.sh
| Atención : El sistema no funcionará si no ha configurado previamente la IP load balancing como un Alias IP en la interfaz lo |
Si no utiliza el sistema Oco, en el Manager deberá configurar su clúster en
Modo Hardware obligatoriamente.
Configuración de IP load-balancing con Oco en el Manager
Para configurar la IP Load-balancing vaya a su
Manager sección de
Servidor dedicado
Haga click en la sección Servicios
Servicios
Encontrará la opción
IP Load Balancing en la rúbrica
Gestión de IPs
IP Load Balancing
Allí podrá gestionar sus IPs Load Balancing. Existen dos modos de funcionamiento :
- Funcionamiento del clúster en Modo Hardware
- Funcionamiento del clúster en Modo Software
Modo Hardware
Si no utiliza Oco en sus servidores, deberá escoger el funcionamiento "Modo Hardware".
- Si un servidor se cae ("KO") debe marcarlo usted a mano desde el Manager (INDISPONIBLE)
- Si el servidor vuelve a estar de nuevo en línea ("OK"), debe volver a activarlo (DISPONIBLE)
Este modo esta recomendado sólo si no utiliza Oco en sus servidores.
Modo Software
Si utiliza Oco en sus servidores, deberá escoger el funcionamiento "Modo Software".
- Si es "KO", automáticamente, el servidor se retira del clúster.
- Cuando es de nuevo "OK", se añadirá de nuevo al clúster.
Nuestra infraestructura verifica periódicamente (cada 60 segundos) si su servidor (su Oco) dice "OK" o "KO".
Este modo le obliga a utilizar Oco en
todos los servidores del clúster para que funcione.
Test OK/KO del sistema
Puede verificarlo muy fácilmente de la forma siguiente:
Para poner el Oco en modo "KO" :
# echo "300" > /usr/local/oco/result/test
Así podéis comprobar qué pasa con el reparto de carga.
Luego podéis volver a ponerlo en automático con :
# rm -f /usr/local/oco/result/test
Versiones Oco avanzadas
La versión que se entrega de base, sólo verifica la respuesta el puerto HTTP (80) en las interfaces de reparto de carga (lo:0 y/o lo:1) cada 60 segundos.
script de verificación http
/usr/local/oco/bin/60sec/http
Si utiliza otras interfaces de red, si desea verificar otros puertos, deberá modificar el script que se le entrega o bien crear otro script con otra verificación, etc...
Si combina las verificaciones con el RTM, puede hacer que un servidor salga del clúster cuando tiene la carga de la memoria RAM muy alta, consume mucha CPU, está usando mucha SWAP, etc...
El sistema OcO es libre de utilizarse para cualquier uso y se distribuye bajo licencia GPL, así que es libre de modificarse y de servirse como base para otros test.
Más información
:
RealTimeMonitoring :: Real Time Monitoring (RTM)
:
ServidorMonitoring :: Como ser advertido cuando se produce una alerta sobre el servidor