Esta IA de Facebook puede reproducir un estilo de letra sólo en base a una palabra

Entre los proyectos recientes de Facebook, una cuota importante de su atención se ha centrado en la investigación en torno a la inteligencia artificial y sus múltiples posibilidades de aprovechamiento.

Su más reciente proyecto en esta área, TextStyleBrush, es una IA capaz de reconocer el estilo de una tipografía manuscrita o en estilo imprenta, utilizando como base una imagen que al menos tenga una palabra.

Un clonador de tipografías basado en IA

Este nuevo modelo de inteligencia artificial presentado permite, además de reproducir el estilo de una tipografía, modificar y reemplazar el texto presente en las fotos analizadas.

El proyecto fue dado a conocer aún en una fase preliminar, durante una investigación que sigue en curso. El propósito perseguido por sus desarrolladores es aportar en la generación de mensajes personalizados, subtítulos y otros recursos audiovisuales, incluyendo también las posibilidades que suma hoy el desarrollo de la realidad aumentada, campo en el que Facebook también ha tomado parte.

TextStyleBrush se proyecta como una herramienta capaz de interpretar varios tipos de rotaciones y transformaciones de las escrituras, analizando caracteres especiales y variaciones propias del texto registrado a mano alzada. La dinámica tras esto es similar a lo que ya hemos conocido con generadores de imágenes y textos basados en otros sistemas de IA.

Este modelo se basa en una adaptación propia de StyleGAN2, una red generativa inicialmente presentada por Nvidia, pero que posteriormente fue liberada con la publicación de su código.

Facebook afirmó que esta herramienta, una vez liberada en una de sus versiones definitivas y estables, podría ser capaz de trabajar de manera totalmente autosuficiente, basando su trabajo únicamente en el análisis del texto en las imágenes procesadas.

El trabajo de análisis del texto que ejecuta TextStyleBrush es más complejo que lo conocido hasta ahora en sistemas de similar tenor, pues, mientras la mayoría se centra netamente en los aspectos visuales de cada palabra, esta IA contempla el escenario completo de una imagen, para formarse de un contexto más completo y así evitar la dependencia de constantes repeticiones de los ciclos de entrenamiento de esta tecnología.

Si bien, una utilidad práctica para esta herramienta podría ser su aplicación en traductores o aplicaciones de similar envergadura, también se abre la posibilidad de que esta clase de recursos se utilice para actividades maliciosas, como nuevos modos de phishing u otras posibilidades. Facebook asumió esta eventualidad, según lo reseñado en su anuncio, comprometiéndose con aportar datos referenciales para la investigación de los deepfakes.

Un informe completo con los detalles de este proyecto fueron publicados por Facebook en su blog dedicado a proyectos de IA, mientras que el desglose de sus aspectos más técnicos se especifican en un paper.