Modo Rescue


Introducción


Existen dos modos de rescate OVH: el modo «win-rescue» y el modo «rescue pro».

El modo win-rescue, para servidores Windows, se describe en detalle en esta guía: ModoWinRescue.

El modo rescue pro permite acceder a los discos duros y verificar el hardware del servidor.
La principal ventaja es que no necesita contactar con el soporte técnico para programar una intervención ya que, con el modo de rescate, usted puede realizar sus pruebas en el momento que usted considere oportuno para que le cause menos molestias.

Una vez activado el modo rescue, puede realizar sus pruebas de dos formas:

  • a través de SSH (conectándose al servidor),
  • desde la interfaz (para comprobar el hardware).

Software y administración

  • Lanzar un fsck/e2fsck
  • Consultar y analizar los logs
  • Corregir problemas de software
  • Reconstruir/Verificar el RAID
  • Guardar copia de los datos
Hardware

  • memtest: para controlar la memoria (RAM)
  • cpuburn: para verificar el procesador (CPU)
  • fsck: para comprobar el sistema de archivos
  • state: para verificar el disco
  • explorer: para consultar/modificar archivos

Si alguna de las pruebas no se puede realizar o da errores, solo tiene que acceder al manager y en Soporte técnico > Incidencia técnica, describir el resultado del test, por ejemplo: «El servidor se ha quedado colgado durante el cpu burn». Enseguida procederemos a realizar la intervención necesaria para sustituir el hardware.

¡ATENCIÓN!
¡La interfaz web y el SSH no se pueden utilizar a la vez! ¡Si activa el check de los discos desde la interfaz web y monta las particiones en SSH simultáneamente puede provocar la pérdida de los datos!


¡ATENCIÓN!
Los códigos de acceso al modo rescue se envían por correo electrónico al contacto de administración.
Esa dirección de correo debe encontrarse en un servidor distinto del que va a poner en modo de rescate.
Si no le es posible cambiar esa dirección, puede consultar una copia del mensaje en su manager (en Administración > Mis parámetros > Histórico de los emails).



Arranque en modo rescue


Hay diferentes formas de iniciar un servidor en modo de rescate:

- Activándolo usted mismo desde su manager:
Usted decide cuándo quiere iniciar su servidor en modo rescue.

- Mediante una intervención técnica:
Tras la apertura de un tíquet de incidencia en el manager, por ejemplo, en caso de fallo del sistema de red.

- A través del sistema de monitoring:
Se trata de una alerta de monitoring (fallo de ping) cuya causa no es un fallo de hardware. El técnico ha dejado su servidor en modo rescue para que usted corrija el error.


A través del Manager


Para iniciar su servidor en modo de rescate, acceda a su manager, en la sección Servidor dedicado > Servicios.

Servicios


En la sección Mantenimiento, seleccione Netboot.

Netboot


En el apartado, Seleccionar Netboot, encontrará un menú en el que podrá elegir la forma de arrancar la máquina.
Seleccione rescue-pro y reinicie el servidor.

Una vez seleccionado el Netboot que desea arrancar en su Manager, puede iniciar su máquina de dos formas:

  • en SOFT a través de SSH: #/sbin/reboot
  • a través del panel de control (Webmin, Plesk...)

¡ATENCIÓN!
NO reinicie en modo HARD a menos que no tenga otra alternativa.

Una vez reiniciado el servidor, recibirá en la dirección de correo del contacto de administración la contraseña que le permitirá acceder a su servidor en modo rescue.

Consulte la guía NetBoot si necesita más información.


Por una intervención técnica


También puede ocurrir que nuestros técnicos hayan intervenido en su servidor. Si no se ha detectado ningún fallo de hardware en el servidor (por tratarse de un fallo de su configuración personal) el técnico lo deja en modo rescue para que usted pueda intervenir más fácilmente sobre él y corregir los problemas antes de volver a ponerlo en línea.

Una vez haya solucionado el fallo, recuerde no se olvide volver a seleccionar un modo de arranque habitual antes de reiniciar.



Check de hardware


Cuando el servidor esté en modo rescue, recibirá un email que contiene un enlace y una contraseña para conectarse a los tests de hardware. Una vez introducida, aparecerá la interfaz de chequeo de hardware:



Lista de checks


  • Hard Drives: Permite ver los discos instalados.
  • Processors: Hace una comprobación de la CPU. Cuando, al realizar este check, el servidor se cuelga o se reinicia en lugar de mostrar el resultado del check, es signo de que hay un problema. Si eso ocurre, comuníquenoslo de inmediato.
  • Partitions State: Verifica el disco.
  • Partitions File System: Verifica el sistema de archivos. A menudo, una incoherencia en el sistema de archivos se confunde con un disco duro defectuoso. En este caso, suele ser suficiente reinstalar el sistema operativo para que todo vuelva a funcionar, especialmente cuando el servidor pone archivos en la carpeta lost+found.
  • Partitions Explore: Explora los archivos. No es posible editarlos a través de esta utilidad, pero podremos guardar una copia, por ejemplo. Importante: Es posible leer los logs de la máquina sin acceder necesariamente por SSH.
  • Memory: Comprueba la memoria RAM. Tenga en cuenta que un memtest lleva mucho tiempo y consume mucha CPU. Si el test se cuelga o la máquina se reinicia, es posible que la CPU esté mal refrigerada o defectuosa. Si el fallo es de la RAM, debería poder llegar al final del test y obtener un informe con los errores encontrados.

Si alguna de las pruebas no se puede realizar o da errores, solo tiene que acceder al manager y en Soporte técnico > Incidencia técnica, describir el resultado del test, por ejemplo: «El servidor se ha quedado colgado durante el cpu burn». Enseguida procederemos a realizar la intervención necesaria para sustituir el hardware.

No todos los problemas pueden detectarse desde la interfaz, por ejemplo los reinicios irregulares, etc. No dude en consultar con el soporte técnico después de realizar el test para que le ayude a analizar el servidor.

¡ATENCIÓN!
¡La interfaz web y el SSH no se pueden utilizar a la vez! ¡Si activa el check de los discos desde la interfaz web y monta las particiones en SSH simultáneamente puede provocar la pérdida de los datos!

¡ATENCIÓN!
Si realiza un test de la RAM, es probable que aparezca el siguiente error hacia el 64% de progreso del test: Your server hasn't reacted for a least 20 seconds. It is probably down. You can try to refresh the page if the server crashed while doing a cpu test. It is possible that the cpu is faulty. Puede hacer clic en Aceptar, porque normalmente se debe a que la prueba que se ejecuta hacia el 64% es muy larga.


Verificación de la conexión


En la parte inferior de la pantalla, es posible realizar una prueba de velocidad de la tarjeta de red hacia la red de OVH y hacia el browser de su conexión.



Los valores de la izquierda corresponden a la subida y la bajada entre el servidor y la red interna de OVH.
Los valores de la derecha corresponden a la subida y la bajada entre el servidor y su ordenador.



Conexión SSH a la máquina


Conexión


Una vez haya arrancado en modo de rescate, conéctese a la máquina en SSH como de costumbre, pero con el pass root recibido por email.

user:~$ ssh root@nsXXXXX.ovh.net
The authenticity of host '213.186.xx.yy (213.186.xx.yy)' can't be established.
RSA key fingerprint is 02:11:f2:db:ad:42:86:de:f3:10:9a:fa:41:2d:09:77.
Are you sure you want to continue connecting (yes/no)? yes
Warning: Permanently added '213.186.xx.yy' (RSA) to the list of known hosts.
Password:
rescue:~#



Montaje de los discos


En esta fase ya está conectado pero no tiene acceso a sus archivos. Es necesario montar el sistema de archivos.
Por lo general, /dev/xda1 es la partición raíz (/), y /dev/xda2 corresponde a /home. En función del sistema(IDE, SATA, SCSI, RAID), el disco principal se llamará:
  • /dev/nfs para RPS
  • /dev/sd para SCSI, SATA, Raid Hard
  • /dev/hd para los discos IDE
  • /dev/md para los RAID Soft
  • /dev/rd/c0d0p para los raid Mylex

También puede utilizar las denominaciones devfs.


Tipo de disco


Si no sabe qué disco tiene o cuál es su tabla de particiones, puede utilizar los comandos fdisk o sfdisk para averiguarlo. A continuación mostramos un ejemplo del comando y los datos que devuelve:

rescue:~# fdisk -l

Disk /dev/hda 40.0 GB, 40020664320 bytes
255 heads, 63 sectors/track, 4865 cylinders
Units = cylinders of 16065 * 512 = 8225280 bytes

Device Boot Start End Blocks Id System
/dev/hda1 * 1 1305 10482381 83 Linux
/dev/hda2 1306 4800 28073587+ 83 Linux
/dev/hda3 4801 4865 522112+ 82 Linux swap / Solaris

Disk /dev/sda 8254 MB, 8254390272 bytes
16 heads, 32 sectors/track, 31488 cylinders
Units = cylinders of 512 * 512 = 262144 bytes

Device Boot Start End Blocks Id System
/dev/sda1 1 31488 8060912 c W95 FAT32 (LBA)


En este caso, el servidor tiene dos discos:
- el /dev/hda con el asterisco (*) que indica que es arrancable.
- el pendrive

Para montar el sistema de archivos solo tiene que teclear:

rescue:~# mount /dev/hda1 /mnt/



Particiones del disco


Para montar la partición de datos, es necesario haber montado en primer lugar la partición del sistema (/).
Normalmente la partición de datos de Linux (/home) está en la segunda partición del disco (en este caso /dev/hda2), aunque no siempre.
Si es así, montamos la partición de datos con el comando:

rescue:~# mount /dev/hda2 /mnt/home


También es posible que los datos estén en /var, por ejemplo en las distribuciones Plesk.
Para estar seguros de la configuración, después de montar la partición principal podemos ejecutar el comando:

rescue:~# cat /mnt/etc/fstab


Ese archivo contiene las particiones del servidor que se cargan al arrancar, por ejemplo:

rescue:~# cat /mnt/etc/fstab

# sis.archivos pt.montaje tipo opciones dump pass+-
/dev/hda1 / ext3 errors=remount-ro 0 1
/dev/hda2 /var ext3 defaults,usrquota,grpquota 1 2
/dev/hda3 swap swap defaults 0 0
/dev/devpts /dev/pts devpts gid=5,mode=620 0 0
/dev/shm /dev/shm tmpfs defaults 0 0
/dev/proc /proc proc defaults 0 0
/dev/sys /sys sysfs defaults 0 0


En este ejemplo se puede ver que la partición de datos /dev/hda2 se debe montar en /var y no en /home, por lo que es posible que se trate de un sistema Linux-Plesk?.
Entonces montaríamos la partición de datos con el comando:

rescue:~# mount /dev/hda2 /mnt/var



Ejemplos de montaje


A continuación se ofrecen varios ejemplos para montar los discos duros en los servidores.
Recordamos que, por lo general, la primera partición /dev/XXX1 es la partición raíz (/) y la segunda partición /dev/XXXX2 corresponde a las cuentas de usuario (/home).


1. Montaje de discos en RPS

Para los RPS que están en modo NFS, basta con introducir el comando:

rescue:~# mount -a


Los discos de la SAN (iSCSI/NFS) se montarán solos.


2. Montaje de discos en IDE

Para un disco IDE normal:

rescue:~# mount /dev/hda1 /mnt/
rescue:~# mount /dev/hda2 /mnt/home/



3. Montaje de discos en RAID

Para un disco RAID:

rescue:~# mount /dev/md1 /mnt/
rescue:~# mount /dev/md2 /mnt/home/



4. Montaje de discos en SAS/SATA

Para un disco SAS o SATA:

rescue:~# mount /dev/sda1 /mnt/
rescue:~# mount /dev/sda2 /mnt/home/



5. Montaje de discos en LVM

Para un disco con volúmenes lógicos LVM:

- Con el comando fdisk -l verificamos que existe una partición como LVM, en este caso sda5:

# fdisk -l
...
/dev/sda5 160 1045 6000277 82 Linux LVM
...


- Ejecutamos el comando pvscan para escanear las particiones LVM.
- Con el comando vgscan, el sistema detectará los grupos LVM.
- Por último, ejecutamos el comando vgchange para activar los volúmenes lógicos.


# pvscan; vgscan; vgchange -a y


Ejecutamos lvscan para ver los volúmenes lógicos disponibles:

# lvscan
ACTIVE '/dev/pve/data' [910 GB] inherit


Por último, montamos el volumen lógico en su destino, en este caso en var/lib/vz (distribución Proxmox)

# mount /dev/pve/data /mnt/var/lib/vz



6. Montaje de discos para FreeBSD-Linux

En primer lugar visualizamos los dispositivos disponibles:

rescue-bsd# ls /dev/
...
ad4
ad4s1
ad4s1a
ad4s1b
ad4s1d
...


Para montar los discos, lanzamos los siguientes comandos:

rescue-bsd# mount /dev/ad4s1a /mnt
rescue-bsd# mount /dev/ad4s1b /mnt/home


¡ATENCIÓN!
Si en algún momento se muestra el mensaje:
rescue-bsd# mount /dev/ad4s1a /mnt
mount: /dev/ad4s1a: R/W mount of / denied. Filesystem is not clean - run fsck. Forced mount will invalidate journal contents: Operation not permitted
chequee la partición con el comando rescue-bsd# fsck -t ufs /dev/ad4s1a y vuelva a montar el disco con el comando anterior.


Chroot


Una vez montados los discos, podemos editar los archivos utilizando, por ejemplo, la rutas /mnt/var/.... o /mnt/etc/lilo.conf.

Sin embargo, para realizar algunas operaciones es necesario estar en root sobre el sistema que se encuentra instalado en el disco, porque no se pueden realizar con el root del rescue.
En esos casos, hay que utilizar el comando chroot:

rescue:~# chroot /mnt/
rescue:/#


Aquí podemos ver que después de hacer un chroot, nos coloca en la raíz del servidor.
Ahora se pueden ejecutar comandos directamente en el sistema del disco.



Ejemplos de uso del modo SSH

Cambiar la contraseña root Linux y FreeBSD


Si ha perdido la contraseña root, es posible cambiarla a través del modo rescue:

# chroot /mnt/
#
# passwd



Corrección de datos del disco


También podemos modificar archivos de configuración del disco duro.
Tomemos como ejemplo /etc/fstab, suponiendo que haya sido el culpable de la indisponibilidad del servidor.
Introducimos los siguientes comandos:

# chroot /mnt/
#
# cd /etc
# ls


Esto nos sitúa en el directorio /etc del disco duro. Con el comando ls podremos ver los archivos del directorio y ver si fstab está disponible.
Si lo está, procedemos a editarlo con el editor de textos nano:

# nano fstab


Entonces solo tenemos que corregir los datos del archivo y guardarlos con Ctrl + x y aceptar con Y o S + ENTER.


Backup por FTP


Si lo desea, puede realizar un backup de los datos antes de hacer cualquier modificación o reinstalación del sistema.



Instalar la SSH key de OVH


Es posible instalar la SSH key de OVH en el servidor principal desde el modo rescue. Para ello, ejecute los siguientes comandos:

# chroot /mnt/
#
# wget ftp://ftp.ovh.net/made-in-ovh/cle-ssh-public/installer_la_cle.sh -O keyInstaler.sh
# sh keyInstaler.sh



Test de la conexión vRack a través de SSH


¡ATENCIÓN!
Esta comprobación solo se puede hacer en modo SSH contra un vRack definido en el Manager desde un servidor con tarjeta de red Gigabit Ethernet.

Para verificar la conexión con el vRack, solo hay que configurar la tarjeta Gigabit Ethernet con el número del vRack mediante el comando vconfig y hacer ping a la pasarela 172.31.255.254. Sustituya el valor XXXX de los siguientes comandos por el número de vRack que tenga asignado:

# vconfig add eth0 XXXX

# ifconfig eth0.XXXX 172.16.0.1 netmask 255.240.0.0

# ping 172.31.255.254
PING 172.31.255.254 (172.31.255.254) 56(84) bytes of data.
64 bytes from 172.31.255.254: icmp_seq=1 ttl=61 time=0.386 ms
64 bytes from 172.31.255.254: icmp_seq=2 ttl=61 time=0.367 ms
64 bytes from 172.31.255.254: icmp_seq=3 ttl=61 time=0.351 ms

--- 213.186.33.13 ping statistics ---
3 packets transmitted, 3 received, 0% packet loss, time 1998ms
rtt min/avg/max/mdev = 0.351/0.368/0.386/0.014 ms




Salida del modo rescue


Después de realizar los cambios y correcciones necesarios, hay que volver al Manager para seleccionar en Netboot el modo de arranque habitual.

¡ATENCIÓN!
Los RPS no aceptan el modo de Netboot en disco duro HD. Es necesario seleccionar el modo linux 2.6 que tuviera el servidor previamente. Consulte la guía NetBoot.

Después de seleccionar el modo y aceptar, hay que realizar el reinicio SOFT de la máquina:

rescue:~# /sbin/reboot
Broadcast message from root (pts/0) (Tue Apr 12 15:56:17 2005):
The system is going down for reboot NOW!




Conclusión


Si se respetan las reglas básicas de administración, como se explican en la guía AdministracionBasica, podrá recuperar en todo momento su servidor y reducir al mínimo el tiempo de indisponibilidad.



Más información


: NetBoot:: ¿Cómo seleccionar un kernel mediante Netboot?
: RebootDeLaMaquina :: ¿Cómo puedo reinicializar mi servidor?
: AdministracionBasica :: Administración de un servidor dedicado.
: ServidorHackee :: Cuando el servidor sufre el ataque de un hacker.
: ServidorSemiHackeado :: Una máquina atacada con un daño "reparable".
: ModoWinRescue :: Rescate en modo Rescue Win-PE