Google prueba un sistema de reconocimiento de voz offline, 7 veces más veloz

google reconocimiento de voz

Google anda probando un nuevo sistema de reconocimiento de voz en dispositivos móviles, útil tanto para smartphones como para wearables y otros equipos, con mejoras tan grandes que hasta funciona sin Internet, es más acertado, resulta en promedio 7 veces más veloz y ocupa menos recursos técnicos que el software actual.

Por supuesto, aunque el «Ok, Google» tienen un nivel de reconocimiento enorme, no son pocas las veces que se ve limitado por el continuo requerimiento de una estable conexión a Internet o la combinación hardware/software del dispositivo. Claro, vale entender que los servidores de Google son los que posibilitan el reconocimiento en tiempo real y ese intercambio de información entre el equipo local y el remoto puede producir un cierto retraso. Continúa leyendo «Google prueba un sistema de reconocimiento de voz offline, 7 veces más veloz»

Apple compró la compañí­a de reconocimiento de voz Novauris Technologies

novauris

Apple sigue intentando mejorar su tecnologí­a de reconocimiento de voz para hacer de Siri una asistente virtual perfecta, y da un paso más hacia dicho objetivo adquiriendo la compañí­a especialista en reconocimiento de voz Novauris Technologies.

Novauris Technologies, compañí­a fundada en 2002, fue liderada por el CEO Yoon Kim junto a los cofundadores Melvyn Hunt y John Bridle, y hasta el momento de la adquisición ha sido una compañí­a dedicada enteramente a las tecnologí­as de reconocimiento de voz y responsable de productos como DragonDictate o Dragon NaturallySpeaking. Ha sido responsable, también, de la tecnologí­a ASR de reconocimiento de voz automático utilizada para acceder a información almacenada de forma local en nuestro dispositivo móvil o en servidores remotos.

Esta última caracterí­stica es, probablemente, la que haya llamado la atención de Apple de cara a realizar la adquisición – el hecho de que operen en servidores y de forma local, además del hecho de poseer el motor en sí­.

Según leemos en TechCrunch, fue adquirida por Apple el año pasado pese a que la noticia no haya salido a la luz hasta ahora, y en el sitio web de Novaris tampoco se ha publicado ninguna nota oficial sobre la adquisición.

Post-adquisición, Apple trabaja ahora en mejorar la tecnologí­a que soporta a Siri.

Google Chrome se actualiza, permitiendo el reconocimiento de voz a las aplicaciones web

Demo Web Speech API

¿Has actualizado ya a la versión estable de Google Chrome que acaba de salir? Si es así­, tienes que saber que esta nueva versión ya dispone de soporte para la API Web Speech, de manera que las aplicaciones web que estén preparadas para ello, podrán recibir instrucciones ví­a voz por parte de los usuarios. Igual ahora mismo no hay muchas aplicaciones que incorporen el reconocimiento de voz, con lo que para ello Google ha lanzado una página demostrativa, la cual funciona con la nueva versión de Google Chrome.

En dicha demo, habrá que elegir el idioma deseado, habilitar el uso del micrófono del sistema por parte de Google Chrome, y comenzar la redacción a través de instrucciones de voz. Dicha redacción podrá ser usada para copiarse al portapapeles del sistema o formar parte del mensaje de correo electrónico que se quiera realizar.

Además de ello, especí­ficamente para Windows, ahora viene desactivada la instalación silenciosa de extensiones, lo que añade más seguridad y fiabilidad, teniendo el usuario que aceptar aquellas extensiones que desea instalar, evitando así­ sorpresas que igual no son agradables.

Ya sólo te queda comprobar si ya se ha actualizado automáticamente tu versión de Google Chrome, o de lo contrario, actualizarlo manualmente. O si no usas Google Chrome, ahora es buen momento de darle una oportunidad.

Enlace: Demo speech | Ví­a: Google Chrome Blog

Evernote para Android se actualiza integrando reconocimiento de voz

Desde el blog de Evernote anuncian una actualización para la versión en Android con interesantes nuevas caracterí­sticas.

La más notable es la posibilidad de crear notas mediante la tecnologí­a de reconocimiento de voz, es decir que con solo dictarle a la aplicación podrá transcribir las notas. Esto tiene varios detalles interesantes, como por ejemplo, que veremos cómo se va escribiendo la nota a medida que vamos hablando en tiempo real, sin necesidad de terminar todo el dictado. Podemos escoger si guardar tanto la nota escrita junto con el audio o solamente la nota.

Desde el blog dicen que esta nueva caracterí­stica solo estará disponibles en dispositivos que corran en Android Ice Cream Sandwich, aunque también se ha encontrado que se actualizado esta opción en otros dispositivos.

Tambien han presentado novedades en cuanto al widgets, que si deseas probarla tendrás que descargarla desde Google Play, donde promete muchas opciones de personalización y nuevas funcionalidades.

Ví­a: Evernote blog

Twitter Voice – Para escribir en Twitter usando audio y el sistema de reconocimiento de voz de Google

Nos presentan ahora Twitter Voice, una nueva aplicación Android que permite escribir Tweets mediante dictado por voz usando la tecnologí­a de reconocimiento de voz de Google.

La idea surgió porque a veces quieres escribir sobre algo que te está pasando en este momento pero no tienes tiempo de entretenerte escribiendo en el teclado del teléfono, por falta de tiempo o porque estás haciendo alguna otra cosa. Con la aplicación es mas fácil, rápido y seguro avisar de retenciones en la AP-7, por ejemplo.

La aplicación se encuentra en Inglés y Castellano. Se encuentra traducida también al catalán, aunque la tecnologí­a de reconocimiento de voz en dicho idioma aún no funciona muy bien.

Prueba la búsqueda por voz en español


Poder buscar en Internet usando un micrófono en lugar de un teclado es algo posible desde hace algunos meses, aunque el sistema solamente reconocí­a palabras en inglés.
Y uso el pasado porque informan en TNW que ya están adaptando el motor de reconocimiento de voz en otros idiomas, algo que he podido comprobar personalmente usando la extensión para Google Chrome Voice Search.
Al instalarla veréis un micrófono en los campos de búsqueda de cualquier sitio web, incluyendo el buscador de Google o el de wwwhatsnew.com, aquí­ arriba.
Pulsad el micrófono y decid, en vuestro idioma, lo que queréis buscar. El sistema intentará reconocer la palabra y la mostrará en el campo correspondiente.
Por supuesto la función no es perfecta, ni siquiera ha sido anunciado oficialmente que ya está disponible en otros idiomas, aunque el porcentaje de aciertos en mis pruebas ha sido bastante aceptable.

iSpeech – SDK para construir sistemas de reconocimiento de voz en móviles


iSpeech ha lanzado una plataforma que nos permite programar sistemas de reconocimiento de voz y de transformación de texto a audio para iOS, Android y BlackBerry.
El servicio es gratuito para los desarrolladores de aplicaciones móviles y está disponible para los programadores web que quieran usar el sistema usando la API. En la web el precio es de $.005 por palabra, pero en la versión móvil no hay coste.
Una buena noticia para los que quieran integrar este tipo de sistemas en sus apps, algo que cada vez vemos de forma más frecuente, matando poco a poco a los viejos teclados.
Link: iSpeech | Ví­a RWW

WebTalks: lector de feeds para Android que te permite escuchar una web como si fuese una radio


WebTalks es una interesante aplicación móvil para terminales con Android que se puede usar para diversos propósitos. Básicamente ofrece mediante tecnologí­a de sintetizacion de voz, como si estuviésemos escuchando la radio, y en cualquier idioma, la escucha de cualquier contenido web que le dictemos de viva voz a través de nuestro propio terminal. Se trata de un lector de canales RSS que usa tecnologí­a avanzada de sí­ntesis de voz y reconocimiento de voz.
Los usos que le podemos dar son varios, desde la lectura de cualquier sitio web que le indiquemos o usemos algunas de las webs favoritas por defecto hasta la lectura de nuestras suscripciones de Google Reader, marcando ya por leí­das aquellas entradas que hemos escuchado. Igualmente podemos utilizarlo para aprender idiomas, y para personas con problemas de visión, pues reducir la brecha en el uso de los smartphones.
WebTalks permite su integración con nuestras suscripciones de Google Reader para la lectura de las mismas y de Google Traductor, para la detección del idioma para ser dictado en el idioma adecuado. Igualmente puede ser usado en modo offline, de modo que puede leer cualquier contenido web cargado previamente.
Según nos comenta su responsable, WebTalks acaba de lanzar la versión 1.2.1, y hasta finales de este mes de mayo se puede conseguir por un 30% de descuento a través de Android Market.
Link: WebTalks en Android Market