Microsoft lanza Seeing AI para Android, para reconocimiento y descripción del entorno

Publicado el

seeing ai

Microsoft ha dado un gran paso adelante al lanzar Seeing AI en la plataforma Android, una herramienta que promete ser un aliado valioso para personas con ceguera o baja visión.

Lo primero que me impresionó fue la gratuidad de Seeing AI. Pensar que una aplicación tan avanzada es gratuita me parece un ejemplo claro de cómo la tecnología puede y debe ser inclusiva. Su llegada a Android, con más de 3.000 millones de usuarios alrededor del mundo, supone una democratización de la tecnología accesible.

Seeing AI llega así a más usuarios y trae novedades en IA generativa. Esto significa descripciones más ricas del entorno y la posibilidad de interactuar con la app para obtener información específica de documentos escaneados.

Otro aspecto a destacar es el esfuerzo de Microsoft por romper las barreras idiomáticas. Con 18 idiomas disponibles y planes de llegar a 36, la aplicación se posiciona como un recurso global.

Funcionalidades destacadas de Seeing AI

Entre las funciones de Seeing AI, algunas me parecen particularmente útiles:

  • La lectura rápida de textos, ideal para etiquetas o carteles.
  • Escaneo y descripción detallada de documentos, manteniendo el formato original.
  • Reconocimiento de productos mediante códigos de barras, un detalle que puede simplificar mucho las compras diarias.

Todo lo que ofrece

Seeing AI ofrece una gama de herramientas para asistir en diversas tareas cotidianas:

  • Texto Corto: La aplicación lee en voz alta el texto en cuanto aparece frente a la cámara.
  • Documentos: Proporciona guía de audio para capturar una página impresa y reconoce el texto manteniendo su formato original.
  • Productos: Escanea códigos de barras, guiando al usuario mediante señales acústicas, y proporciona información sobre el producto, incluyendo datos del paquete cuando están disponibles.
  • Personas: Permite guardar los rostros de las personas para su reconocimiento posterior, ofreciendo estimaciones sobre su edad, género y expresión.
  • Moneda: Reconoce billetes de diferentes divisas.
  • Escenas: Da una descripción general de la escena capturada. Permite explorar la foto moviendo el dedo por la pantalla para localizar distintos objetos.
  • Mundo: Experiencia de Realidad Aumentada Auditiva para explorar entornos desconocidos, anunciando los objetos alrededor con Audio Espacial (requiere un dispositivo con LiDAR y iOS 14 o superior).
  • Navegación Interior: Disponible en el Canal Mundo, permite crear rutas dentro de edificios, como «entrada a aula», y navegar siguiendo el sonido (necesita un dispositivo con procesador A9 o superior y iOS 14 o más).
  • Colores: Identifica y describe colores.
  • Escritura a Mano: Lee texto manuscrito, como en tarjetas de felicitación (disponible en algunos idiomas).
  • Luz: Emite un tono audible que corresponde a la luminosidad del entorno.
  • Imágenes en Otras Aplicaciones: Al seleccionar «Compartir» y luego «Reconocer con Seeing AI», describe imágenes de aplicaciones como Mail, Fotos, Twitter, entre otras.
  • Explorar Fotos: Ofrece descripciones de fotos guardadas en el dispositivo.

Recordemos que Seeing AI no es un proyecto nuevo. Lanzado en 2017 para iOS, ha sido un referente en tecnología asistiva.

Me gustaría animaros a probar esta aplicación. Ya sea en Android o iOS, tener una herramienta como Seeing AI puede cambiar la percepción que tenemos sobre la tecnología y la accesibilidad. Para mí, ver cómo la tecnología puede mejorar la vida de las personas es una de las facetas más gratificantes de mi trabajo.