Prepárate para lo peor…

Prepárate para lo peor…

¿Alguna vez te has preguntado qué sucedería si ocurriera un desastre que afectara tus datos o tu centro de cómputo?

Imagina estos escenarios:

  1. Tu empresa utiliza los servicios de voz y datos de un proveedor llamado X, ya que este proveedor ofrece calidad, estabilidad y buenos precios en tu ciudad. Además, la vendedora es muy amable. Aunque solo un 20% de tus datos están respaldados por otro proveedor (llamémoslo Y), confías en que X es lo suficientemente estable y con buena calidad.
    Un día, ocurre un desastre: un incendio provocado por un cortocircuito en los cables eléctricos, que también afecta los cables de fibra óptica compartidos por el proveedor X y la empresa de energía. La fibra óptica se derrite y la electricidad daña la infraestructura en varias manzanas a la redonda. Como resultado, tu centro de cómputo se queda casi 24 horas sin servicio de voz ni datos.
  2. Tienes un centro de datos seguro y protegido, con niveles aceptables de temperatura y una UPS que soporta no solo el centro de datos, sino también buena parte de la operación.
    Pero un día, ocurre algo inesperado: la empresa de energía realiza algunas reparaciones y falla la luz en el edificio. Aunque no te das cuenta porque tienes UPS y una planta eléctrica, esta última no se activa. En 10 minutos, la UPS se agota y todo se apaga. La empresa de energía restaura la electricidad una hora después, pero tus servidores no se reinician automáticamente y tardan otros 15 minutos en iniciar todos los servicios necesarios.
  3. El aire acondicionado de tu centro de datos falla por alguna causa externa y se apaga durante la noche. A las 6 a.m., el centro de datos se convierte en un horno y los servidores se apagan. La persona que llega temprano no nota que el aire acondicionado está apagado y, por lo tanto, los servicios se ven afectados hasta que se da cuenta horas después.

Estas historias pueden parecer de horror para cualquier administrador de sistemas, ¿verdad? Sin embargo, son casos reales que pueden ocurrir en cualquier lugar.

¿Cómo estar preparado para incidentes como estos?

Existen planes de Continuidad de Negocio, que son documentos que consideran la posibilidad de desastres y cómo actuar frente a ellos. Algunas medidas que podrías considerar son:

  1. Migración de servicios: Tener un plan para migrar los servicios a una sede alterna en caso de desastre.
  2. Canal de datos de respaldo: Contar con canales de datos de respaldo para mantener la operación en caso de falla de los canales principales.
  3. Verificación constante: Tener personal de turno para verificar que los servicios estén funcionando adecuadamente.
  4. Generar turnos de operación: Establecer turnos de trabajo para asegurar una operación ininterrumpida las 24 horas.
  5. Documentar y etiquetar: Marcar y documentar los cables de red para facilitar su identificación y manejo.

Imagina escenarios de desastre y desarrolla planes de continuidad. Hazte preguntas y analiza sus respuestas.

Por ejemplo, pregúntate:

1. ¿Qué pasaría si falla la electricidad por un par de horas y la UPS se agota?

  • ¿A dónde irías? (centro de datos alterno)
  • ¿Qué servicios son vitales para la compañía y deberías migrar?
  • ¿Qué servidores y PCs puedes apagar para que la UPS dure un poco más?

2. ¿Qué pasaría con una falla de canales de voz o datos?

  • ¿Tienes canales de voz o datos de respaldo?
  • Si tienes canales de respaldo, ¿soportarían toda tu operación por horas/días?
  • ¿Qué sucede si desconectas un cable u otro?
  • ¿Qué hacer si se daña un dispositivo de red (switch, hub)?
  • ¿Cuánto tiempo tomaría restaurar la operación?
  • ¿Sería necesario comprar otro dispositivo y cuánto tiempo tomaría configurarlo?

3. En cuanto a los datos en tu operación:

  • ¿Tienes un sistema de copias de seguridad?
  • ¿Con qué frecuencia se realizan las copias?
  • ¿Cuántos datos podrías recuperar si los discos duros se quemaran hoy?
  • ¿Dónde están almacenadas las copias de seguridad?
  • ¿Es eficiente tu sistema de respaldo o estás utilizando discos externos o CD?

4. ¿Tienes contratos de niveles de servicio que incluyan multas que podrían afectar tu bolsillo?

Si bien estar preparado para enfrentar desastres es importante, siempre existe el elemento sorpresa. Por lo general, te das cuenta de que algo falta o falla cuando el incidente ya ha ocurrido. Sin embargo, desarrollar planes de continuidad y estar preparado para diversos escenarios puede reducir los riesgos y minimizar el impacto de los desastres en tu centro de cómputo o empresa.