Modelos de machine learning para detectar phishing: por qué los datos ganan a las reglas

El phishing es ese “doble” que se cuela en tu vida digital con la misma chaqueta que tu banco, tu servicio de correo o tu tienda favorita. A simple vista, la web parece legítima; el logo está donde toca, el botón de “iniciar sesión” tiene el color correcto y el mensaje te mete prisa con una excusa creíble. El objetivo es sencillo: que introduzcas usuario y contraseña, o que aceptes una acción que abra la puerta a un robo de credenciales.

Durante años, muchas defensas se han apoyado en reglas fijas: listas negras de dominios, patrones conocidos en URLs o señales “clásicas” como errores tipográficos. El problema es que los atacantes cambian el disfraz cada vez que alguien aprende a reconocerlo. Por eso, cuando una técnica se vuelve popular en la defensa, también se vuelve popular en el ataque para esquivarla. Aquí es donde los enfoques basados en datos y machine learning empiezan a marcar diferencias: no buscan un único “síntoma” rígido, sino combinaciones de señales que, juntas, delatan el engaño.

Qué ha estudiado Sultan Qaboos University y por qué importa

Un trabajo firmado por Ahood Al Darmaki y colaboradores, publicado en The Journal of Engineering Research, evaluó de forma comparativa diez clasificadores de aprendizaje automático para la detección de sitios de phishing. La idea no es nueva en sí misma —aplicar modelos a un problema de ciberseguridad—, lo valioso está en el enfoque: comparar bajo las mismas condiciones, con métricas estándar y usando tres conjuntos de datos públicos, de modo que el rendimiento no dependa de un “caso bonito” elegido a medida.

Cuando se leen titulares sobre detección automática, es fácil caer en el “mucho porcentaje y poco contexto”. Este estudio intenta poner contexto: no basta con decir “acierto el 98%”, porque una empresa puede perder dinero tanto si bloquea páginas legítimas (falsos positivos) como si deja pasar una trampa (falsos negativos). En el mundo real, un filtro demasiado agresivo puede interrumpir ventas, accesos a servicios o procesos internos; uno demasiado permisivo deja el camino libre a la suplantación.

Las señales que mira un modelo: URL, dominio y contenido

Para identificar un sitio sospechoso, los modelos analizados se alimentan de características que provienen de tres zonas: URL, dominio y contenido. Es parecido a cómo juzgas si una nota que te dejan en la puerta es del repartidor habitual: miras el remitente, la dirección escrita, el papel, el tono del mensaje y si hay detalles que no cuadran.

En la URL, suelen contar cosas como longitud, uso de caracteres extraños, presencia de subdominios excesivos o trucos típicos para parecer “oficial”. En el dominio, importan señales relacionadas con el registro, la reputación o patrones que se asocian a infraestructuras usadas para fraude. En el contenido, entran aspectos del propio sitio: estructuras, elementos que imitan servicios conocidos o ciertas huellas técnicas.

El estudio destaca que la combinación de estas fuentes de información puede cambiar mucho el resultado según el dataset. Algunos conjuntos de datos permiten detecciones casi perfectas; otros son más “peleones” porque incluyen muestras con características más complejas o menos evidentes. Esta idea es clave para entender por qué un modelo puede verse fantástico en un entorno y más discreto en otro: el entrenamiento y la evaluación dependen de qué tan representativos son los ejemplos del mundo real.

Los ganadores: Random Forest y SVM cúbica por encima del 95%

Entre los diez clasificadores probados, dos destacan por consistencia: Random Forest y la SVM cúbica (Cubic SVM). En la evaluación reportada, ambos superan el 95% de precisión y, lo más relevante, lo hacen con un equilibrio sólido entre precisión y recall en los tres conjuntos de datos.

Traducido a lenguaje de calle: no solo “aciertan mucho”, sino que aciertan sin sacrificar demasiado uno de los dos extremos del problema. La precisión te dice, cuando el sistema señala “esto es phishing”, cuántas veces tiene razón. El recall te dice cuántos ataques consigue atrapar del total de ataques existentes. En un entorno corporativo, ese equilibrio es el que reduce el ruido en el equipo de seguridad sin dejar agujeros por donde se cuelen campañas activas.

Que Random Forest salga bien parado tiene sentido práctico: es un método basado en conjuntos de árboles de decisión que, en conjunto, suele manejar bien relaciones no lineales y mezclas de señales heterogéneas (como mezclar datos de URL, dominio y contenido). La SVM con un núcleo cúbico puede capturar fronteras de decisión más complejas que una separación “simple”, lo que ayuda cuando el ataque intenta parecerse mucho a lo legítimo.

Por qué las reglas estáticas se quedan cortas ante un enemigo que muta

Las reglas son como un cartel de “prohibido pasar” en una puerta concreta. Funcionan hasta que el atacante entra por la ventana, cambia la puerta de sitio o fabrica una copia de la llave. La investigación remarca que las técnicas de phishing evolucionan rápido y superan a los enfoques basados únicamente en reglas estáticas; los modelos basados en datos, entrenados con ejemplos representativos, están mejor situados para adaptarse a patrones diversos.

Esto no significa que las reglas no sirvan. En ciberseguridad, lo habitual es una defensa por capas: reglas para bloquear lo obvio, reputación para frenar infraestructuras conocidas, y modelos de machine learning para capturar combinaciones de señales que cambian con el tiempo. La clave es entender que el modelo necesita mantenimiento: si el mundo cambia, el conjunto de entrenamiento debe actualizarse para no quedarse “congelado” en los trucos del año pasado.

La trampa de los porcentajes y el papel del dataset

Un punto que este tipo de estudios pone sobre la mesa es que el rendimiento depende mucho del dataset. Es como entrenar a alguien para reconocer billetes falsos usando solo falsificaciones burdas: cuando aparezcan copias sofisticadas, se notará el salto de dificultad. Aquí, los autores señalan que algunas bases permitieron detección casi perfecta, mientras otras exigieron más a los modelos por la complejidad de las características.

Para cualquier organización que piense en adoptar estos enfoques, este detalle es el recordatorio más útil: pedir “un modelo que funcione” no basta. Hay que preguntar con qué datos se entrenó, si esos datos se parecen a los ataques que recibe tu sector, si hay sesgos (por ejemplo, demasiados ejemplos de un tipo de phishing) y cómo se mide el éxito en producción. La métrica bonita en laboratorio se vuelve peligrosa si no encaja con tu realidad operativa.

Qué viene después: deep learning y conjuntos de datos más grandes

Los autores plantean como línea futura explorar deep learning y bases de datos más amplias para ganar robustez. Es una dirección lógica, especialmente si se quiere capturar señales más ricas del contenido o patrones más sutiles que no se describen bien con características manuales. Aun así, el aprendizaje profundo no es magia automática: suele pedir más datos, más cómputo y un cuidado extra para evitar que el modelo aprenda “atajos” que no generalizan.

En la práctica, muchas empresas buscan un equilibrio: modelos suficientemente potentes para reducir el fraude, suficientemente explicables para justificar decisiones y suficientemente eficientes para funcionar en tiempo real. Un detector de phishing que tarda demasiado llega tarde; uno que no se entiende complica auditorías y respuesta a incidentes.

Lo útil para el día a día: defensas más realistas y menos ruido

La aportación de este estudio, difundida también por TechXplore/Science X, está en mostrar que, cuando se comparan varios modelos con criterios homogéneos, ciertos enfoques clásicos del machine learning siguen siendo muy competitivos en ciberseguridad. En un momento en el que todo parece empujar hacia lo “más grande” y lo “más profundo”, recordar que técnicas como Random Forest o SVM pueden ofrecer rendimiento alto y estable es una noticia práctica: son modelos con una huella operativa asumible y que, bien entrenados, pueden integrarse en pipelines de detección sin convertir la infraestructura en un monstruo.

La lección final es bastante cotidiana: para detectar el engaño, no basta con mirar un solo detalle. Igual que tú no juzgas un mensaje solo por el remitente o solo por el tono, los sistemas más fiables mezclan señales y aprenden de ejemplos reales. Cuando ese aprendizaje se mantiene actualizado, el disfraz del phishing dura menos.