Cómo detectar audio generado por IA usando AudioSeal

La inteligencia artificial está transformando el mundo de la tecnología, pero también plantea serios desafíos. Una de las preocupaciones más recientes es el uso de IA para crear audios falsos que pueden ser utilizados en estafas y campañas de desinformación. Para enfrentar este problema, Meta ha desarrollado una herramienta innovadora llamada AudioSeal.

¿Qué es AudioSeal?

AudioSeal es una herramienta que permite insertar marcas de agua en los clips de audio generados por IA. Estas marcas son señales ocultas que pueden ser detectadas pero son imperceptibles para el oído humano. La tecnología detrás de AudioSeal tiene el potencial de identificar exactamente qué partes de un archivo de audio han sido creadas por IA, lo cual es crucial en un mundo donde los deepfakes de voz están en aumento.

Cómo Funciona

AudioSeal utiliza dos redes neuronales. Una se encarga de generar las señales de marca de agua que se incrustan en los audios. La otra red neuronal se dedica a detectar estas señales rápidamente. Esto permite que la marca de agua sea localizable, es decir, puede ser identificada incluso si el audio ha sido recortado o editado.

Beneficios de AudioSeal

Uno de los mayores beneficios de AudioSeal es su alta precisión en la detección. Según Hady Elsahar, científico de investigación en Meta, el sistema logró entre un 90% y un 100% de precisión en sus pruebas. Esto representa una mejora significativa en comparación con los intentos anteriores de marcar audios generados por IA.

Además, AudioSeal está disponible de forma gratuita en GitHub, lo que significa que cualquiera puede descargarlo y comenzar a usarlo para añadir marcas de agua a los clips de audio generados por IA.

Desafíos y Limitaciones

A pesar de sus ventajas, AudioSeal enfrenta varios desafíos. Por ejemplo, aunque Meta ha desarrollado esta herramienta, no ha anunciado planes para aplicarla en los audios generados por sus propias herramientas. También hay una falta de estándares en la industria para las marcas de agua en contenido generado por IA, lo que complica su adopción masiva.

Vulnerabilidad a Manipulaciones

Otro problema es que las marcas de agua pueden ser vulnerables a manipulaciones. Los investigadores encontraron que cuanta más información se conoce sobre el algoritmo de marca de agua, más fácil es eliminar o falsificar estas señales. Esto plantea una limitación fundamental: si un atacante tiene acceso al detector de marcas de agua, el sistema se vuelve frágil.

Opiniones de Expertos

Ben Zhao, profesor de ciencias de la computación en la Universidad de Chicago, destaca la capacidad de AudioSeal para localizar marcas de agua a lo largo de todo el audio, incluso si ha sido editado. Considera que esta herramienta es superior a cualquier sistema anterior de marcas de agua en audio.

Por otro lado, Claire Leibowicz, jefa de integridad de IA y medios en la organización sin fines de lucro Partnership on AI, señala que, aunque las marcas de agua son una solución popular en el sector tecnológico, aún hay escepticismo sobre si realmente aumentarán la confianza del público en la información que consumen. Esto se debe a la facilidad con la que pueden ser manipuladas.

El Futuro de AudioSeal

AudioSeal es un avance prometedor en la lucha contra la desinformación y las estafas con audios falsos. Sin embargo, para que esta herramienta sea efectiva a gran escala, será necesario superar varios desafíos técnicos y adoptar estándares en la industria. La comunidad tecnológica deberá colaborar para mejorar la robustez y la aplicabilidad de estas marcas de agua.

El equipo de Meta presentará su trabajo en la International Conference on Machine Learning en Viena, Austria, en julio. Esto podría ser un paso importante hacia una adopción más amplia y hacia la creación de estándares para la detección de audios generados por IA.

Podéis acceder al estudio en arxiv.org/pdf/2401.17264.