Un typo dejó sin servicio 15.000 sitios de Amazon ~ Segu-Info

3 mar 2017

Un typo dejó sin servicio 15.000 sitios de Amazon

3 mar 2017, 12:30:00 p.m. 1 comentario
cloud computing, incidentes

La razón de que varias páginas y servicios soportados por la nube de Amazon Web Services –entre ellos Netflix y Spotify- presentarán fallas el martes pasado se debió a un error humano, aseguró la compañía.

El reporte de Amazon apuntaba que servidores S3 experimentaban "altas tasas de error", y ello ocasionaba que servicios tan populares y demandados como Netflix, Spotify, Pinterest y Buzzfeed presentarán fallas como descargas muy lentas o en algunos casos, interrupción de servicio.
Hoy la empresa que da servicio a más de 15.000 sitios alrededor del mundo explicó la causa: un programador de la compañía escribió un comando erróneo (un typo).

Según explicó AWS a través de su página web, dicho empleado tenía la misión de depurar un problema ligado al sistema de facturación de Amazon Simple Storage Service (S3), ya que presentaba un funcionamiento lento. Para ello, debía eliminar un reducido número de servidores de un subsistema que utilizaba la facturación S3.

El trabajador escribió mal un comando y eliminó un mayor número de servidores de lo planeado, entre ellos dos subsistemas de S3: el índice —dedicado a gestionar metadatos y ubicar dependencias a S3 — y colocación —dedicado a tareas de almacenamiento—.

El subsistema de colación es primordial para los servicios de almacenamiento de la compañía, y justamente impactó a los centros de datos del norte de Virginia, Estados Unidos.

Al limitar las capacidades de colocación, el empleado ocasionó que el sistema se reiniciará por completo, y al momento de correr todos los procesos de validación y seguridad de los metadatos, dicho proceso duró más de lo que AWS tenía previsto.

Para evitar otro "error humano", la compañía está realizando algunos cambios. En palabras de la empresa: "Hemos modificado está herramienta para remover capacidad de manera más lenta y añadimos más dispositivos de seguridad para evitar inconvenientes similares de gran escala".
Finalmente, AWS se disculpó por el inconveniente y prometió hacerlo mejor.

Fuente: NetMedia

1 comentario:

Mr Floyd10 de marzo de 2017, 1:16 p.m.
Ja. Suena a que hizo un DELETE sin un WHERE :D
ResponderBorrar
Respuestas

Agregar un comentario

Gracias por dejar un comentario en Segu-Info.

Gracias por comentar!

3 mar 2017

Un typo dejó sin servicio 15.000 sitios de Amazon

1 comentario:

Sobre Segu-Info...