Marcas de agua en archivos de audio, para identificar voces artificiales

Hoy en día no es muy difícil detectar si una voz ha sido creada por Inteligencia Artificial o no, pero cada día es más difícil, por lo que hay que comenzar a pensar en cómo identificarlas de forma sencilla.

Es ahí donde tiene sentido Resemble AI, una nueva empresa de inteligencia artificial que propone una solución al creciente problema del audio falso.

La empresa propone un proceso de «marca de agua» llamado PerTh que utiliza modelos de aprendizaje automático para incorporar paquetes de datos en el contenido de voz generado.

Esta capa adicional de seguridad dificulta la eliminación de los datos y proporciona una forma de verificar si Resemble generó un determinado clip. Los paquetes de datos están estrechamente vinculados a la información del habla, pero son imperceptibles, lo que los convierte en una solución al problema del audio falso.

El objetivo es identificar si un discurso de un famoso que se hace viral es realmente de él o ha sido creado por un ordenador, luchar contra las Fake News, algo extremadamente complejo en un mundo donde las caras, las voces y los textos pueden ser creados por IA.

El sistema ideado solo funciona con los audios creados con la tecnología de Resemble AI, ya que quieren ser transparentes con el proceso y evitar que los agentes maliciosos usen su propia tecnología para engañar.

En Tc tenéis dos audios de ejemplo, uno con marca de agua y otro sin, para verificar si alguien es capaz de identificar el procesado, que solo tiene componentes adicionales a frecuencias inaudibles, mezclado con un sistema que hace que sea realmente difícil de eliminar, ya que no siempre aparece a una frecuencia fija.

Una buena idea que seguramente veremos en otras plataformas dentro de no mucho tiempo.