3 mar 2010

El lado tecnológico del terremoto y la importancia de la continuidad de negocios

Sin duda, las dantescas escenas que nos llegan a diario desde Concepción y sus alrededores nos muestran el otro lado del terremoto que hemos vivido en Chile el sábado recién pasado: El lado tecnológico del terremoto, del cual les hablo a continuación.

La continuidad de negocio tiene por objetivo tomar todas las precauciones necesarias para hacer funcionar a una compañía - del rubro que sea - y mantener sus servicios operativos, pase lo que pase. Y para poder mantener operativo un negocio, "pase lo que pase", es necesario ponerse en el peor de los escenarios. Y hoy por hoy, difícilmente podremos imaginar un escenario peor que el que hoy está viviendo nuestro país: un violento terremoto, seguido de un tsunami que es capaz de dejar cables, edificios, centros de datos y de comunicaciones en el suelo, en cosa de segundos.

Tecnológicamente hablando, este es quizá el desafío más grande que ha tenido nuestro país en su historia. Nos hemos dado cuenta lo frágil que es nuestra humanidad sin agua y sin luz. Si nos ponemos a enumerar las consecuencias tecnológicamente visibles, los miles de cajeros automáticos reseteados, la dificultad para fabricar pan y para distribuir agua en zonas elevadas (muchas veces esta distribución se realiza con bombas eléctricas) son los primeros que se vienen a la mente colectiva. Sin embargo, podemos mirar como este evento de gran magnitud gatillo la ejecución de los planes de recuperación de desastre en las principales compañías de servicios básicos en nuestro país, empezando rápidamente el proceso de normalización de los mismos en todo el territorio afectado.

Un plan de recuperación de desastre (DRP) es parte medular del plan de continuidad de negocio (BCP). Corresponde a un documento detallado de procedimientos, que prepara a la compañía para responder rápida y eficazmente ante cualquier incidente de seguridad que pueda afectar severamente la continuidad del negocio. A este incidente es al cual llamamos "desastre". Un plan de recuperación de desastre debe ser capaz de proveer instrucciones claras y precisas, coordinando las distintas fuerzas existentes en la compañía en la más amplia variedad de desastres: Terremotos, Tsunamis, Atentados, Incendios, Inundaciones, Cortes de energía e incluso fallas de hardware de cualquiera de los servidores críticos de la compañía deberán formar parte de este vital documento.

En líneas generales, la construcción de un plan de recuperación de desastres se inicia con un árduo proceso de levantamiento de los activos de la compañía. Los activos de información corresponden a la información misma, el software y hardware que lo soportan y los procesos con los cuales opera. Una vez realizado este levantamiento, es posible determinar a través de complejos estudios de tipo económico cuales activos son más valiosos para la organización y, por ende, cuales deben ser cubiertos con una mayor cantidad de recursos por parte de la misma. Este proceso, conocido como BIA (Bussiness Impact Analysis o análisis de impacto de negocio) permite optimizar el uso de recursos, y debe considerar los costos directos e indirectos que los diferentes incidentes de seguridad causan a los activos, además de la probabilidad de ocurrencia de los mismos. Tomando un ejemplo muy actual en nuestro país, un terremoto es un incidente altamente destructivo, con una probabilidad de ocurrencia media-baja, aunque bastante más probable que un tornado (algo - hasta ahora - casi imposible en nuestro país, gracias a la Cordillera de Los Andes).

Ahora, ¿cómo medir el impacto de los incidentes? Esta es una labor a veces titánica. Si ponemos por ejemplo, la página web de un banco como un activo de información, para poder calcular el impacto de un incidente en dicho activo debe considerar, entre otros costos:
  • a) Las horas hombre que cuesta volver el sitio a su funcionamiento normal
  • b) La inversión en software/hardware que esto pueda implicar
  • c) La cantidad de transacciones que no se realizaron (medible estadísticamente)
  • d) La cantidad de clientes potenciales que no se afiliaron al banco porque el sitio estaba abajo (también medible estadísticamente)
  • e) Las multas de los entes fiscalizadores por la falla
  • f) Los clientes que decidieron dejar de ser clientes del banco por la falla
  • g) Las posibles demandas recibidas por clientes
  • h) El daño a la imagen del banco
Como se puede ver, muchos de estos valores son bastante difíciles de inferir. Sin embargo este análisis es clave para priorizar las medidas a tomar sobre los activos de la organización.

Una vez categorizados e inventariados los activos, es necesario escribir los planes de continudad de negocio. Para ello, generalmente se define una etapa inicial de reconocimiento o evaluación de los daños debido a los incidentes existentes en cada uno de los escenarios definidos, para luego definir procedimientos estándar para la recuperación de cada uno de los componentes del activo en sí. Esto, entre otras cosas, debe considerar la recuperación de los datos, de los sistemas base que soportan el activo y de los componentes de comunicación, entre otros. Así, dependiendo del escenario definido se considerará la falla de uno o varios componentes anteriormente nombrados, lo que termina facilitando la redacción del plan en sí. Bajo este prisma, en la redacción de un DRP no habrá mucha diferencia entre un terremoto y un incendio del centro de datos, ya que en ambos casos los fallos provocados a los sistemas probablemente sean muy semejantes.

Dentro de la redacción de los DRP, también es muy importante determinar la manera en que los distintos activos se relacionan entre sí. Si esto no se considera, la ejecución del DRP puede añadir problemas nuevos que no estaban considerados y que de hecho podrían superar al problema original.

Finalmente, es clave poder probar los planes y actualizarlos de manera regular. Nuestro país en estos días ha vivido una prueba de fuego, y la mayoría de las compañías clave han logrado responder de manera bastante adecuada. A pocas horas del terremoto, muchos ya poseían los servicios básicos e incluso eran capaces de colocar en los distintos medios masivos de internet (Facebook, Twitter) sus primeras impresiones del terremoto. Es más, hace pocos minutos me comuniqué por MSN con un amigo que vive en Concepción, el epicentro de esta megacatástrofe, a poco menos de 96 horas de la misma, pese a que el terremoto arrasó con el sistema interconectado central de energía eléctrica y probablemente con gran parte del sistema telefónico. Aunque suene algo frívolo, la correcta definición de los DRP de estas compañías lograron dar una respuesta relativamente rápida; de no haber estado debidamente preparados para enfrentar este gran reto, probablemente hubiesen pasado semanas antes de que estos "milagros tecnológicos" salieran a la luz.

Este artículo está dedicado al pueblo chileno, y en particular a los amigos y conocidos de la zona sur de nuestro país. Fuerza Chile.

Autor: Luis Montenegro Mena
Fuente: Blog Tips de Seguridad

Suscríbete a nuestro Boletín

1 comentario:

  1. Gracias por el articulo, me es de ayuda ahora.

    Saludos desde Concepción, Chile

    Héctor

    ResponderBorrar

Gracias por dejar un comentario en Segu-Info.

Gracias por comentar!