Google Gemini 3: vulnerabilidades expuestas en minutos

El nuevo modelo de inteligencia artificial Gemini 3 Pro, desarrollado por Google, fue sometido recientemente a una prueba de seguridad por parte de Aim Intelligence, una startup surcoreana especializada en «red-teaming». Esta técnica consiste en estresar los sistemas de IA para encontrar sus puntos débiles, como si se tratara de simular ataques éticos para evaluar la resistencia de una infraestructura digital. Lo preocupante es que el modelo fue jailbreakeado en tan solo cinco minutos, revelando un nivel de vulnerabilidad que ha puesto en entredicho su robustez frente a usos maliciosos.

El término jailbreak, aunque comúnmente asociado a dispositivos como smartphones, se ha adaptado en el mundo de la inteligencia artificial para describir cuando un modelo es inducido, mediante instrucciones indirectas o creativas, a realizar acciones para las que fue explícitamente programado a evitar. En este caso, Gemini 3 Pro terminó generando contenidos extremadamente peligrosos, incluyendo métodos detallados y viables para la fabricación del virus de la viruela. Continúa leyendo «Google Gemini 3: vulnerabilidades expuestas en minutos»

Roblox frente a la lupa: tensión entre crecimiento y seguridad infantil

Roblox ha lanzado una nueva función de verificación de edad que ha provocado un intenso debate sobre los límites entre la innovación, la privacidad y la protección infantil. La medida exige a los usuarios escanear su rostro si desean acceder a las funciones de mensajería de la plataforma, un cambio significativo en una red social ampliamente usada por niños y adolescentes.

La iniciativa tiene un objetivo claro: fortalecer las medidas de seguridad en una comunidad que crece sin freno, con millones de usuarios activos en todo el mundo. Sin embargo, esta tecnología, que depende de la autenticación biométrica, plantea dudas sobre cuán efectivo es este método para proteger a los menores y hasta qué punto la empresa está dispuesta a priorizar esa seguridad frente a su modelo de crecimiento. Continúa leyendo «Roblox frente a la lupa: tensión entre crecimiento y seguridad infantil»

La era del ciberespionaje impulsado por IA: un caso que redefine la defensa digital

Un informe reciente de Anthropic describe una operación que marca un antes y un después en la historia del ciberespionaje con inteligencia artificial. Se trata de la primera campaña documentada en la que un ataque de esta magnitud fue ejecutado, en su mayor parte, por un sistema de IA actuando como agente autónomo. La investigación detalla cómo un grupo estatal chino logró manipular un modelo avanzado para llevar a cabo intrusiones complejas con una intervención humana mínima.

La magnitud del descubrimiento no reside solo en la sofisticación técnica, sino en la velocidad con la que estas capacidades han evolucionado. Anthropic llevaba meses registrando señales claras de que los modelos estaban alcanzando niveles de autonomía y destreza técnica que podían cambiar el equilibrio de poder en la ciberseguridad global. Continúa leyendo «La era del ciberespionaje impulsado por IA: un caso que redefine la defensa digital»

Claude, el asistente de Anthropic, implicado en un ciberataque automatizado a escala global

Lo que hasta hace poco parecía una escena sacada de una película de ciencia ficción se ha convertido en realidad: un modelo de inteligencia artificial ha sido empleado como herramienta principal en una sofisticada campaña de ciberespionaje internacional. Según informó Anthropic, empresa desarrolladora del asistente de IA Claude, un grupo de hackers patrocinado por el estado chino logró utilizar su tecnología para ejecutar ataques cibernéticos contra bancos y organismos gubernamentales en distintos países.

La novedad de este caso radica en que la mayor parte del ataque fue llevada a cabo de forma autónoma por la inteligencia artificial, sin intervención humana constante. Anthropic lo describió como «el primer caso documentado de un ciberataque a gran escala ejecutado sin intervención humana significativa», lo cual marca un punto de inflexión en la historia de la ciberseguridad. Continúa leyendo «Claude, el asistente de Anthropic, implicado en un ciberataque automatizado a escala global»

La ciberseguridad ante un nuevo reto: cómo la IA está cambiando las reglas del juego del cibercrimen

El panorama de la ciberseguridad está experimentando una transformación sin precedentes con la aparición de malware con inteligencia artificial integrada. Esta nueva modalidad representa un cambio profundo respecto a usos anteriores, donde la IA servía principalmente como herramienta de soporte para tareas técnicas o de productividad. Ahora, el software malicioso empieza a incorporar IA directamente en su funcionamiento, lo que le permite adaptarse en tiempo real, modificar su comportamiento y generar código malicioso al vuelo.

Google Threat Intelligence Group (GTIG) ha identificado por primera vez familias de malware como PROMPTFLUX y PROMPTSTEAL, que utilizan modelos de lenguaje de gran escala (LLM) mientras se ejecutan. Esta característica les permite ocultar su código, esquivar sistemas de detección y generar nuevas funciones maliciosas bajo demanda. Es decir, no vienen ya programados con su carga maliciosa, sino que la crean según la situación, como un ladrón que cambia de táctica dependiendo de la cerradura que se encuentra. Continúa leyendo «La ciberseguridad ante un nuevo reto: cómo la IA está cambiando las reglas del juego del cibercrimen»

Seguridad inteligente en bloques de pisos: así funciona Ring Intercom Video

El ecosistema de dispositivos inteligentes para el hogar sigue creciendo, y Amazon acaba de añadir una pieza clave pensada especialmente para quienes viven en bloques de pisos. Se trata de Ring Intercom Video, un sistema que ofrece a los vecinos la posibilidad de ver, hablar y permitir el acceso a visitantes desde su móvil o desde dispositivos compatibles como el Echo Show. Este avance es una evolución del Ring Intercom original lanzado en 2022, que ya permitía abrir el portal a distancia, pero ahora suma una capa visual y comunicativa mucho más completa. Continúa leyendo «Seguridad inteligente en bloques de pisos: así funciona Ring Intercom Video»

Character.AI limita el acceso a adolescentes: un giro hacia la seguridad en la IA conversacional

Character.AI, una de las plataformas de inteligencia artificial conversacional más populares del momento, ha decidido restringir el acceso a sus chatbots a los usuarios menores de 18 años. Esta decisión llega en un contexto de creciente presión por parte de autoridades regulatorias, expertos del sector y familias preocupadas por el impacto de estas tecnologías en los adolescentes.

La medida entrará en vigor el 25 de noviembre de 2025 y supone un cambio significativo en la forma en que la plataforma interactúa con sus usuarios jóvenes. Hasta esa fecha, los menores de edad podrán utilizar la aplicación solo durante un máximo de dos horas al día, una cifra que la empresa planea reducir progresivamente. Además, se les animará a usar los bots con fines creativos, como generar ideas para videos o contenido multimedia, y no para establecer vínculos emocionales o de compañía. Continúa leyendo «Character.AI limita el acceso a adolescentes: un giro hacia la seguridad en la IA conversacional»

Anthropic pone a prueba la seguridad de Claude 4.5 Opus con un desafío inédito contra jailbreaks

Anthropic, la startup de inteligencia artificial con sede en San Francisco, está preparando el lanzamiento de su modelo Claude 4.5 Opus, el más avanzado de su familia Claude 4.5. Ya se han presentado dos variantes anteriores, Claude 4.5 Sonnet y Claude 4.5 Haiku, pero ahora todas las miradas apuntan al modelo que podría definir el futuro inmediato de esta tecnología. La razón: un enfoque intensivo en blindar la IA contra los llamados jailbreaks.

Claude 4.5 Opus, cuyo nombre en clave interno es Neptune V6, ha sido enviado recientemente a un grupo de expertos en seguridad conocidos como red-teamers. El objetivo no es otro que poner a prueba la capacidad del modelo para resistir manipulaciones externas, concretamente los intentos de hacer que la IA ignore sus propios filtros de seguridad. Continúa leyendo «Anthropic pone a prueba la seguridad de Claude 4.5 Opus con un desafío inédito contra jailbreaks»

Un auge sin precedentes en ataques DDoS pone en jaque a infraestructuras clave

Los ataques distribuidos de denegación de servicio (DDoS) han escalado a niveles nunca antes vistos, alcanzando dimensiones que muchos expertos ya califican como «tsunami digital». De acuerdo con un informe reciente publicado por DigiCert, se han registrado eventos que alcanzaron picos de hasta 3,7 terabits por segundo, una cifra que refleja la potencia desmedida que pueden tener estas ofensivas digitales.

Estas cifras no solo representan un aumento cuantitativo, sino también cualitativo: los atacantes están perfeccionando la mezcla entre precisión quirúrgica y fuerza bruta masiva, combinando ataques dirigidos con campañas de «bombardeo por alfombra» que logran saturar redes enteras en cuestión de segundos. Continúa leyendo «Un auge sin precedentes en ataques DDoS pone en jaque a infraestructuras clave»

Tus cuentas podrían estar entre las 180 millones expuestas en Have I Been Pwned

Have I Been Pwned, una de las plataformas más confiables para verificar si nuestros datos han sido comprometidos, ha incorporado recientemente dos nuevos conjuntos de información que afectan a millones de personas. El más grande de ellos incluye 183 millones de cuentas con correos electrónicos y contraseñas filtradas, mientras que el segundo, vinculado al sitio MyVidster, contiene cerca de 4 millones de registros adicionales. Esta actualización, impulsada por el investigador Troy Hunt en colaboración con Synthient, pone sobre la mesa la persistente amenaza de los llamados stealer logs. Continúa leyendo «Tus cuentas podrían estar entre las 180 millones expuestas en Have I Been Pwned»