11 dic. 2020

Análisis estadístico de contraseñas

La empresa Cybernews ha realizado un análisis estadístico de más de 15 mil millones de contraseñas provenientes de filtraciones o ‘leaks’ públicos entre las que se incluyen las compilaciones ‘Breach Compilation’, y ‘Collection #1-5’.

El primer dato interesante que se revela del análisis realizado por CyberNews es que, del total de 15.212.645.925 de contraseñas, únicamente 2.217.015.490 mil millones resultaron ser únicas. Esto pone de manifiesto que alrededor del 85,5% de las contraseñas utilizadas serían utilizadas en más de un servicio, e incluso que podrían ser tan simples que usuarios sin ninguna relación pensaron la misma contraseña (lo cual no resulta nada positivo).

La realidad es que la gran mayoría de usuarios utiliza contraseñas basadas en información que les resulte sencilla de recordar y este análisis desvela cuales son los patrones y categorías más comunes a la hora de pensar en una contraseña.

  • años: resulta común utilizar como parte de la contraseña (o como la propia contraseña) el año de nacimiento, aquel en el que se creó la contraseña, o un año considerado especial por el usuario. A este respecto, los años más utilizados son ‘2010’ (aproximadamente en 10 millones de contraseñas), ‘1987’ (8,4 millones) y ‘1991’ (8,3 millones). Los analistas resaltan la probabilidad de que esos años estén correlacionados con el año de nacimiento del usuario, lo cual revelaría una mayor cantidad de usuarios nacidos entre 1980 y 1990 que entre 1940 y 1980. Sin embargo, resulta poco probable que ‘2010’ sea un año de nacimiento (el usuario tendría apenas 10 años) por lo que se trataría de una referencia a un evento significativo para el usuario, así como ‘2000’ resultaría en un guiño al cambio del milenio, aunque también podrían ser los años en que la contraseña fue creada.
Fuente: CyberNews
  • nombres propios: los 10 nombres propios más utilizados aparecen entre 2,4 millones de veces (‘Daniel’, el que menos) y 7,1 millones (‘Eva’ y ‘Alex’). Los otros más populares son: ‘Anna’, ‘Max’, ‘Ava’, ‘Ella’, ‘Leo’, ‘Jack’ y ‘Ryan’. A pesar de todo, los nombres propios solo se encontraron en menos de un 1% de las contraseñas analizadas.
Fuente: CyberNews
  • deportes: otra elección deducida por los analistas es el uso de palabras relacionadas con los deportes o los equipos favoritos de los usuarios. Aunque también podría tratarse simplemente de palabras populares entre los creadores de contraseñas, el análisis estadístico parece apuntar a una relación con el deporte. En esta categoría destacan palabras como ‘suns’, ‘heat’ y ‘magic’ (Phoenix Suns, Miami Heat y Orlando Magic de la NBA), ‘reds’ (Cincinnati Red de la liga de béisbol), ‘liverpool’, ‘chelsea’ y ‘arsenal’ (clubes de fútbol europeos).
Fuente: CyberNews
  • palabras malsonantes: alrededor del 7% de las contraseñas analizadas resultaron contener palabrotas, tacos, palabras malsonantes o relacionadas con el sexo. La opción principal fue ‘ass’ (con aproximadamente 27 millones de apariciones), seguida de ‘sex’ (algo más de 5 millones). Los siguientes resultados en esta categoría son: ‘f*ck’, ‘god’, ‘sexy’, ‘butt’, ‘bitch’, ‘cow’, ‘shit’ y ‘arse’. Resultan lo suficientemente conocidas como para no necesitar de traducción.
Fuente: CyberNews
  • ciudades: otro conjunto de contraseñas presentaba nombres de ciudades o lugares (presumiblemente en los que reside el usuario). Las mayormente utilizadas son ‘abu’ (Abu Dhabi de los Emiratos Árabes Unidos), ‘roma’, ‘lima’, ‘hong’, ‘milán’, ‘londres’, ‘liverpool’, ‘austin’, ‘antonio’ (podría ser un nombre propio, pero dado que la mayoría de lo datos analizados pertenecen a usuarios angloparlantes, se puede presuponer que hace referencia a la ciudad de San Antonio en Texas, EEUU) y ‘york’.
Fuente: CyberNews
  • estaciones del año: en esta categoría se observa la preferencia por la época estival y las vacaciones. De mayor a menor uso, se pueden encontrar: ‘summer’, ‘winter’, ‘spring’ y ‘autumn’.
  • meses del año: de manera similar, los meses preferidos se corresponden con los más cálidos mientras que los correspondientes al época fría quedan para el final de la lista (de nuevo considerando que la mayoría de los datos corresponden a usuarios residentes en el hemisferio norte): ‘may’, ‘june’, ‘august’, ‘april’, ‘july’, ‘march’, ‘october’, ‘november’, ‘december’, ‘september’, ‘january’ y ‘february’. Otra hipótesis es considerar estos meses como parte de una fecha significativa para el usuario: cumpleaño, aniversario, u otro evento especial para la persona.
  • días de la semana: en esta categoría se puede deducir que el día favorito de la mayoría de usuarios se corresponde con aquel en que finalizan los días laborables y comienza el descanso del fin de semana: ‘friday’ (viernes). Aunque la elección de ‘monday’ (lunes) como segunda más utilizada o ‘saturday’ (sábado) como la última de todas parece no seguir esta misma tónica.
Fuente: CyberNews
  • comida: palabras relacionadas con alimentos se encontraron hasta en 42 millones de contraseñas (1,9% del total). Encabezan este grupo ‘ice’ (hielo), ‘tea’ (te), ‘pie’ (pastel) y ‘nut’ (nuez).
Fuente: CyberNews

Las contraseñas elegidas con mayor frecuencia se basan en cosas por las que el usuario siente preferencia o tienen un significado para él. Esto, combinado con que las contraseñas analizadas no eran demasiado complejas plantea la conclusión de que resultaría factible la averiguación de una contraseña según el usuario, los patrones y su personalidad y preferencias, siendo importante destacar que este tipo de información, a menudo, se comparte de manera inconsciente a través de las redes sociales.

A pesar de que los datos analizados se corresponden en su gran mayoría a contraseñas filtradas de usuarios angloparlantes, seguramente un gran numero de lectores se habrán visto identificados con estas categorías y usarán, o habrán usado, alguna de ellas como contraseña o parte de la misma.

Para concluir, se recomienda no utilizar contraseñas fáciles de recordar, relacionadas con el usuario, sus gustos o preferencias, etc. Es preferible utilizar un gestor de contraseñas y generar las contraseñas de manera aleatoria, resultando en una cadena sin sentido conteniendo mayúsculas, minúsculas, números, caracteres especiales y una longitud adecuada, o bien formar una frase larga con palabras aleatorias sin relación o significado lógico entre ellas.

Fuente: Hispasec | Cybernews

Suscríbete a nuestro Boletín

0 comentarios:

Publicar un comentario

Gracias por dejar un comentario en Segu-Info.

Gracias por comentar!