Ekoparty es el evento anual de seguridad informática que, por sus características únicas y su particular estilo, se ha convertido en un referente para toda Latinoamérica.

Permite a consultores, oficiales de seguridad, investigadores, programadores, técnicos, administradores de sistemas, nerds, curiosos y entusiastas de la tecnología, reunirse y disfrutar de los descubrimientos más importantes en el ámbito de la seguridad informática.

27, 28 y 29 de septiembre, Centro Cultural Konex, Buenos Aires, Argentina.

3 mar. 2017

Un typo dejó sin servicio 15.000 sitios de Amazon

La razón de que varias páginas y servicios soportados por la nube de Amazon Web Services –entre ellos Netflix y Spotify- presentarán fallas el martes pasado se debió a un error humano, aseguró la compañía.

El reporte de Amazon apuntaba que servidores S3 experimentaban "altas tasas de error", y ello ocasionaba que servicios tan populares y demandados como Netflix, Spotify, Pinterest y Buzzfeed presentarán fallas como descargas muy lentas o en algunos casos, interrupción de servicio.
Hoy la empresa que da servicio a más de 15.000 sitios alrededor del mundo explicó la causa: un programador de la compañía escribió un comando erróneo (un typo).

Según explicó AWS a través de su página web, dicho empleado tenía la misión de depurar un problema ligado al sistema de facturación de Amazon Simple Storage Service (S3), ya que presentaba un funcionamiento lento. Para ello, debía eliminar un reducido número de servidores de un subsistema que utilizaba la facturación S3.

El trabajador escribió mal un comando y eliminó un mayor número de servidores de lo planeado, entre ellos dos subsistemas de S3: el índice —dedicado a gestionar metadatos y ubicar dependencias a S3 — y colocación —dedicado a tareas de almacenamiento—.

El subsistema de colación es primordial para los servicios de almacenamiento de la compañía, y justamente impactó a los centros de datos del norte de Virginia, Estados Unidos.

Al limitar las capacidades de colocación, el empleado ocasionó que el sistema se reiniciará por completo, y al momento de correr todos los procesos de validación y seguridad de los metadatos, dicho proceso duró más de lo que AWS tenía previsto.

Para evitar otro "error humano", la compañía está realizando algunos cambios. En palabras de la empresa: "Hemos modificado está herramienta para remover capacidad de manera más lenta y añadimos más dispositivos de seguridad para evitar inconvenientes similares de gran escala".
Finalmente, AWS se disculpó por el inconveniente y prometió hacerlo mejor.

Fuente: NetMedia

1 comentario:

Gracias por dejar un comentario en Segu-Info
Si vas a dejar una consulta, procura tener habilitado tu perfil en Blogger o deja una forma de contacto.

Gracias por comentar!