La "fuerza bruta" derrota una vacuna contra el spam
Un sistema de seguridad informática al que apostaron gigantes como Yahoo, Microsoft, Facebook y MySpace para controlar el envío masivo y no solicitado de mensajes comienza a ser superado por diferentes técnicas, algunas de ellas rudimentarias pero efectivas.
El spam es la peor plaga que afecta a Internet. El correo electrónico constituye, según algunos estudios (ver notas relacionadas al final) alrededor del 90 por ciento de los e-mail que circulan por la Red.
Desde hace más de una década, las empresas tecnológicas procuran encontrar alguna cura o vacuna contra esta epidemia. Uno de esos sistemas se denomina CAPTCHAS, una sigla en inglés de “Completely Automated Public Turing test to tell Computers and Humans Apart”.
Los usuarios de Internet conocen esta técnica, adoptada por gigantes como Yahoo o Microsoft. Consiste en una serie de caracteres deformados y mostrados sobre fondos confusos para evitar su reconocimiento automático. Se los encuentran cuando se abre una cuenta de correo electrónico basado en la web, o cuando se publica un comentario en un blog.
Algunas veces los CAPTCHAS llegan a extremos como los recopilados en esta nota.
Sin embargo, el volumen de spam sigue creciendo a pesar de la popularización de estos modelos destinados a evitar su funcionamiento automatizado.
Según explica en esta nota el analista tecnológico español Enrique Dans, existen tres sistemas utilizados por los “spammers” para superar al Captcha:
El primero es el más simple de todos: consiste en pagar a un humano para que lo resuelva. Un artículo en la revista electrónica estadounidense ZDNet, “Inside India’s CAPTCHA solving economy“, revela la trama desarrollada en países como India destinado a contratar personas para resolver CAPTCHAS a razón de dos dólares por cada mil.
Este sistema de “fuerza bruta”, aunque en realidad demanda inteligencia para escribir bien la clave, llega incluso a utilizar en ocasiones sistemas como el Amazon Mechanical Turk para reclutar usuarios que apoyen el posicionamiento de sitios de spam en sitios sociales como Digg, Del.icio.us y muchos otros.
Hay un método algo más sutil, que pasa por la ingeniería social: ofrecer algún incentivo no económico a cambio de la resolución de CAPTCHAS. Por ejemplo, una página web en la que los usuarios acceden a fotografías de una mujer con una prenda menos de ropa cada vez si en cada etapa resuelven el CAPTCHA solicitado, que proviene precisamente del sitio en el que el spammer pretende entrar.
La tercera vía es el empleo de algoritmos automatizados de reconocimiento de caracteres, mejorados para llegar a reconocer incluso las caprichosas deformaciones habituales en los captchas. En este caso no es necesaria una gran exactitud: la perversa matemática utilizada en el mundo de los “spammers”, capaz de lanzar 100 mil intentos por día, hace que un simple 15 poor ciento de eficiencia en la resolución de un sistema de CAPTCHAS determinado ya resulte productivo como para que compense invertir en su desarrollo.
“Los grandes sitios web, que tengan un afluente de visitas importante van a ser vulnerables si solo usan el CAPTCHA como medio para evitar el spam”, advierten desde el blog TecnoGeek. “Por lo que es necesario para ellos complementar o cambiar ese sistema por otro que todavía no este tan estudiado”, afirman desde este sitio.
“Todo sistema es potencialmente violable, sea el sistema que sea, si esta pensado para que una persona pueda poner un comentario o dar de alta una cuenta se puede terminar, como colmo, pagándola a los mismos hindúes para que, por un par de dólares más, hagan el trabajo a mano”, admiten en el sitio, que publico la caricatura superior sobre la muerte de este sistema.
Aquí, un video sobre otro sistema para sortear CAPTCHAS
Para Dans, “la mejor defensa sigue siendo la de siempre: la paciencia, los filtros sociales tipo Akismet y similares para la detección colectiva y, sobre todo, la educación de los usuarios para que jamás respondan a ese tipo de ofertas”.
Según el analista español, “para un usuario con un nivel de uso de la red razonable, el spam hoy en día ya no tiene porqué suponer un gran problema”. Sin embargo, el problema lo tienen los administradores de los sistemas utilizados por los “spammers”, que deben disponer de recursos muy grandes para atender las decenas de miles de peticiones entrando a los servidores simultáneamente y en todo momento.
Una vuelta de tuerca
Sin embargo, hay otras aplicaciones de los CAPTCHAS que inspiran a negocios inéditos. Internautas a quienes se pide que resuelvan crucigramas con palabras distorsionadas (como los CAPTCHAS) para poder entrar en portales como Facebook están ayudando, sin saberlo, a compañías como The New York Times a convertir viejos artículos de la prensa al formato digital.
Sin que los internautas lo adviertan, los científicos se están valiendo de millones de ellos por todo el mundo para convertir libros y artículos previos a la era de Internet en documentos digitales. El método, que se viene usando desde hace un año, permite procesar 160 libros al día con casi perfecta fidelidad, según un estudio de la Universidad Carnegie Mellon, que creó el programa y lo suministra gratuitamente.
Las computadoras han podido leer libros viejos y periódicos archivados por años usando los programas de reconocimiento óptico de caracteres (OCR, por sus siglas en inglés). El nuevo método toma palabras distorsionadas o borrosas que el programa no reconoció y las presenta en portales electrónicos para que las personas las descifren.
"El problema es que el OCR no es perfecto", dijo Luis von Ahn, profesor adjunto del departamento de ciencias de la información de Carnegie Mellon, en una entrevista con la agencia Bloomberg. "En los libros verdaderamente viejos, digamos, anteriores a 1900, entre un 20 y un 30% de las palabras van a salir mal", agregó.
El método fue elaborado a partir de una versión de CAPTCHA, que se usó por vez primera en el portal de Yahoo para impedir que las computadoras inscribieran direcciones falsas de correo electrónico.
Unas 45.000 páginas web, entre ellas Facebook.com y Ticketmaster.com, usan el nuevo método, llamado ReCaptcha. A la persona suele pedírsele que resuelva uno de estos crucigramas para inscribirse en el portal. Los crucigramas tienen un filtro que rechaza los programas automatizados de las personas que envían "spam" o mensajes basura o aquellas que tratan de cometer fraude.
A las personas les toma 10 segundos descifrar las palabras, lo que ahorra 150.000 horas de transcripción manual. A diario se descifran unos cuatro millones de palabras con más de un 99% de acierto, según el estudio, publicado en la revista Science Express. En el primer año, el método facilitó descifrar 440 millones de palabras, o unos 17.600 libros.
El programa pide al usuario que descifre dos palabras. Una es la palabra que de hecho hay que descifrar, y la otra una que ya se conoce. Si el usuario descifra ambas, el programa da por sentado que ambas son correctas. Se les da la misma palabra a muchos usuarios para mejorar las probabilidades de dar en el clavo.
"Durante esos 10 segundos, usted está haciendo algo asombroso", dijo Von Ahn. "Su cerebro está haciendo algo que las computadoras no pueden hacer", afirmó.
Fuente: http://www.infobaeprofesional.com/notas/71496-La-fuerza-bruta-derrota-una-vacuna-contra-el-spam.html
El spam es la peor plaga que afecta a Internet. El correo electrónico constituye, según algunos estudios (ver notas relacionadas al final) alrededor del 90 por ciento de los e-mail que circulan por la Red.
Desde hace más de una década, las empresas tecnológicas procuran encontrar alguna cura o vacuna contra esta epidemia. Uno de esos sistemas se denomina CAPTCHAS, una sigla en inglés de “Completely Automated Public Turing test to tell Computers and Humans Apart”.
Los usuarios de Internet conocen esta técnica, adoptada por gigantes como Yahoo o Microsoft. Consiste en una serie de caracteres deformados y mostrados sobre fondos confusos para evitar su reconocimiento automático. Se los encuentran cuando se abre una cuenta de correo electrónico basado en la web, o cuando se publica un comentario en un blog.
Algunas veces los CAPTCHAS llegan a extremos como los recopilados en esta nota.
Sin embargo, el volumen de spam sigue creciendo a pesar de la popularización de estos modelos destinados a evitar su funcionamiento automatizado.
Según explica en esta nota el analista tecnológico español Enrique Dans, existen tres sistemas utilizados por los “spammers” para superar al Captcha:
El primero es el más simple de todos: consiste en pagar a un humano para que lo resuelva. Un artículo en la revista electrónica estadounidense ZDNet, “Inside India’s CAPTCHA solving economy“, revela la trama desarrollada en países como India destinado a contratar personas para resolver CAPTCHAS a razón de dos dólares por cada mil.
Este sistema de “fuerza bruta”, aunque en realidad demanda inteligencia para escribir bien la clave, llega incluso a utilizar en ocasiones sistemas como el Amazon Mechanical Turk para reclutar usuarios que apoyen el posicionamiento de sitios de spam en sitios sociales como Digg, Del.icio.us y muchos otros.
Hay un método algo más sutil, que pasa por la ingeniería social: ofrecer algún incentivo no económico a cambio de la resolución de CAPTCHAS. Por ejemplo, una página web en la que los usuarios acceden a fotografías de una mujer con una prenda menos de ropa cada vez si en cada etapa resuelven el CAPTCHA solicitado, que proviene precisamente del sitio en el que el spammer pretende entrar.
La tercera vía es el empleo de algoritmos automatizados de reconocimiento de caracteres, mejorados para llegar a reconocer incluso las caprichosas deformaciones habituales en los captchas. En este caso no es necesaria una gran exactitud: la perversa matemática utilizada en el mundo de los “spammers”, capaz de lanzar 100 mil intentos por día, hace que un simple 15 poor ciento de eficiencia en la resolución de un sistema de CAPTCHAS determinado ya resulte productivo como para que compense invertir en su desarrollo.
“Los grandes sitios web, que tengan un afluente de visitas importante van a ser vulnerables si solo usan el CAPTCHA como medio para evitar el spam”, advierten desde el blog TecnoGeek. “Por lo que es necesario para ellos complementar o cambiar ese sistema por otro que todavía no este tan estudiado”, afirman desde este sitio.
“Todo sistema es potencialmente violable, sea el sistema que sea, si esta pensado para que una persona pueda poner un comentario o dar de alta una cuenta se puede terminar, como colmo, pagándola a los mismos hindúes para que, por un par de dólares más, hagan el trabajo a mano”, admiten en el sitio, que publico la caricatura superior sobre la muerte de este sistema.
Aquí, un video sobre otro sistema para sortear CAPTCHAS
Para Dans, “la mejor defensa sigue siendo la de siempre: la paciencia, los filtros sociales tipo Akismet y similares para la detección colectiva y, sobre todo, la educación de los usuarios para que jamás respondan a ese tipo de ofertas”.
Según el analista español, “para un usuario con un nivel de uso de la red razonable, el spam hoy en día ya no tiene porqué suponer un gran problema”. Sin embargo, el problema lo tienen los administradores de los sistemas utilizados por los “spammers”, que deben disponer de recursos muy grandes para atender las decenas de miles de peticiones entrando a los servidores simultáneamente y en todo momento.
Una vuelta de tuerca
Sin embargo, hay otras aplicaciones de los CAPTCHAS que inspiran a negocios inéditos. Internautas a quienes se pide que resuelvan crucigramas con palabras distorsionadas (como los CAPTCHAS) para poder entrar en portales como Facebook están ayudando, sin saberlo, a compañías como The New York Times a convertir viejos artículos de la prensa al formato digital.
Sin que los internautas lo adviertan, los científicos se están valiendo de millones de ellos por todo el mundo para convertir libros y artículos previos a la era de Internet en documentos digitales. El método, que se viene usando desde hace un año, permite procesar 160 libros al día con casi perfecta fidelidad, según un estudio de la Universidad Carnegie Mellon, que creó el programa y lo suministra gratuitamente.
Las computadoras han podido leer libros viejos y periódicos archivados por años usando los programas de reconocimiento óptico de caracteres (OCR, por sus siglas en inglés). El nuevo método toma palabras distorsionadas o borrosas que el programa no reconoció y las presenta en portales electrónicos para que las personas las descifren.
"El problema es que el OCR no es perfecto", dijo Luis von Ahn, profesor adjunto del departamento de ciencias de la información de Carnegie Mellon, en una entrevista con la agencia Bloomberg. "En los libros verdaderamente viejos, digamos, anteriores a 1900, entre un 20 y un 30% de las palabras van a salir mal", agregó.
El método fue elaborado a partir de una versión de CAPTCHA, que se usó por vez primera en el portal de Yahoo para impedir que las computadoras inscribieran direcciones falsas de correo electrónico.
Unas 45.000 páginas web, entre ellas Facebook.com y Ticketmaster.com, usan el nuevo método, llamado ReCaptcha. A la persona suele pedírsele que resuelva uno de estos crucigramas para inscribirse en el portal. Los crucigramas tienen un filtro que rechaza los programas automatizados de las personas que envían "spam" o mensajes basura o aquellas que tratan de cometer fraude.
A las personas les toma 10 segundos descifrar las palabras, lo que ahorra 150.000 horas de transcripción manual. A diario se descifran unos cuatro millones de palabras con más de un 99% de acierto, según el estudio, publicado en la revista Science Express. En el primer año, el método facilitó descifrar 440 millones de palabras, o unos 17.600 libros.
El programa pide al usuario que descifre dos palabras. Una es la palabra que de hecho hay que descifrar, y la otra una que ya se conoce. Si el usuario descifra ambas, el programa da por sentado que ambas son correctas. Se les da la misma palabra a muchos usuarios para mejorar las probabilidades de dar en el clavo.
"Durante esos 10 segundos, usted está haciendo algo asombroso", dijo Von Ahn. "Su cerebro está haciendo algo que las computadoras no pueden hacer", afirmó.
Fuente: http://www.infobaeprofesional.com/notas/71496-La-fuerza-bruta-derrota-una-vacuna-contra-el-spam.html


0 Comments:
Publicar un comentario
Gracias por dejar un comentario en Segu-Info.
Gracias por comentar!