El phishing es ese “doble” que se cuela en tu vida digital con la misma chaqueta que tu banco, tu servicio de correo o tu tienda favorita. A simple vista, la web parece legítima; el logo está donde toca, el botón de “iniciar sesión” tiene el color correcto y el mensaje te mete prisa con una excusa creíble. El objetivo es sencillo: que introduzcas usuario y contraseña, o que aceptes una acción que abra la puerta a un robo de credenciales.
Durante años, muchas defensas se han apoyado en reglas fijas: listas negras de dominios, patrones conocidos en URLs o señales “clásicas” como errores tipográficos. El problema es que los atacantes cambian el disfraz cada vez que alguien aprende a reconocerlo. Por eso, cuando una técnica se vuelve popular en la defensa, también se vuelve popular en el ataque para esquivarla. Aquí es donde los enfoques basados en datos y machine learning empiezan a marcar diferencias: no buscan un único “síntoma” rígido, sino combinaciones de señales que, juntas, delatan el engaño. Continúa leyendo «Modelos de machine learning para detectar phishing: por qué los datos ganan a las reglas»