L33tsp34k: Criptolalia contra el computador.

¡Hola a todos!

Escribo esto por una cuestión que divagó de un estudio respecto a los análisis que puede llevar a cabo un atacante para identificar el autor de un número de textos, o para identificar, entre un número X de textos cuales corresponden a cual autor.

Todo esto surgió a raíz de un artículo que habla de esto, que es creado por los compañeros de la CCC, y que lo pueden encontrar acá: Linguistics identifies annonymous users. Básicamente sostiene que:

Hasta el 80% de los usuarios de ciertos foros “anónimos” pueden ser identificados usando esta tecnología, dicen los investigadores. […]

Si nuestro dataset contiene 100 usuarios, podemos identificar al menos unos 80.

Lo cual es muy malo, porque si bien no pueden identificarte a vos individualmente, por tu estilo de escritura pueden saber que “usuarioanonimo1”, es tambien “adadada” y “wdwdwd”, aunque no sepan quien esté atrás de esos seudónimos.

Si bien es un tema interesantísimo y super importante, algo me llamó la atención:

Aunque exitoso, el trabajo enfrenta una serie de desafíos […]

Leetspeak, un dialecto popular en algunos foros, no puede ser traducido.

Leetspeak es un lenguaje utilizado por un montón de imbéciles, que consiste básicamente en cambiar letras por números: zarpado pasaría a ser z4rp4|}0, por ejemplo.

Y ahí me cayó la ficha. Hoy por hoy, cuando alguien 3mpez4|3a a hablar asi, con letras, era un imbécil  Yo estaba 100% seguro de que era un imbécil. Pero ahora, me llama la atención esto: ¿Será que hablando como un imbécil, uno evita que una PC pueda automáticamente analizar su texto? ¿Qué tan complejo puede ser parsear l33tsp34k?

Estuve leyendo respecto a esto, y resulta que bastante complejo, y parece que es un tema serio: hay un artículo de wikipedia bastante completo y bastante interesante respecto al tema: Leet.

Por ejemplo, parseate esta (omg dude, dustin is the uber leet roxor):

0MFG D00D /\Ü571N 15 T3H l_l83Я 1337 Я0XX0ЯZ

En uno de los enlaces del pié de la página, me llevó a una acepción en inglés de la palabra Argot (cuya traducción no corresponde a la palabra en castellano Argot, sinó que es mas similar a Criptolalia):

An argot (pron.:/ˈɑrɡ/FrenchSpanish, and Catalan for “slang“) is a secret language used by various groups—including, but not limited to, thieves and other criminals—to prevent outsiders from understanding their conversations.

criptolalia f. ling. Alteración de la lengua hablada para que los mensajes emitidos de este modo no puedan ser entendidos más que por aquellos que poseen el código

L33tsp34k, criptolalia donde el adversario último es una computadora, o un programador adversario.

De mas esta decir que usar leetspeak no nos va a hacer mas anónimos en absoluto, por que va a ser evidente que el boludo que está usando leetspeak creó todos los posts. Este puede ser un buen punto para empezar a investigar respecto a eso.

Un abrazo,
Pedro

One thought on “L33tsp34k: Criptolalia contra el computador.

  1. Una sugerencia Pedro: si evitas usar palabras tales como “imbécil” o “boludo” en una publicación que pretendes sea con cierto viso de seriedad, tal vez te la considere alguien conocedor, caso contrario resulta una lectura bastante burda.
    Saludos

Comments are closed.