El reconocimiento de voz de Google en iOS y Android ya es más preciso en ambientes ruidosos

Google

En las últimas horas, el equipo de Google ha anunciado a través de un artí­culo publicado en su blog oficial de investigación una importante mejora en su sistema de reconocimiento de voz en iOS y Android. Concretamente, dicha mejora nos permitirá disfrutar de aumento en la calidad del reconocimiento de nuestra voz incluso en los ambientes más ruidosos. Y no solo eso, sino que también necesitará menos tiempo para procesar la información.

Gracias al trabajo del equipo de ingenieros de la compañí­a y a los cambios realizados, el sistema de reconocimiento de voz presente en las aplicaciones de búsqueda de Google para iOS y Android ahora es capaz de predecir los fonemas de las palabras de un modo mucho más rápido, además de diferenciar entre sonidos muy similares. Como ya os adelantábamos, para los usuarios de la aplicación de búsqueda de Google esta mejora se traduce en un aumento de precisión, eficiencia y rápidez importante a la hora de resolver sus distintas peticiones. De hecho, el equipo de Google afirma que su sistema ahora es incluso capaz de reconocer murmullos en los entornos más ruidosos.

Si estáis interesados en probar la mejora en el sistema reconocimiento de voz de la compañí­a, podéis hacerlo descargando de forma gratuita la versión más reciente de la aplicación a través de la App Store o Google Play. Además de ello, esta mejora también está presente a la hora de dictar texto en Android.

Fuente: Google.

Cómo usar la voz para escribir en un Documento de Google

dictado por voz

 

Hace unos dí­as señalamos media docena de importantes novedades en los Documentos, Hojas de cálculo y Formularios de Google. Pues bien, hoy hablamos un poco más de una de esas llamativas funciones presente al trabajar con los Documentos: El poder ingresar texto mediante la voz.

Así­ es, ya es posible, aunque inicialmente solo desde Chrome, aprovechar las herramientas de reconocimiento de voz de Google para escribir un documento sin la necesidad de teclear. Para ello, dentro de cualquier documento nuevo o antiguo, solo debes ir al menú Herramientas y pulsar en «Escritura por voz» (o «Dictado por voz» pues puede cambiar el nombre según la localización).

Enseguida, aparecerá una pequeña ventana flotante con el icono de un micrófono el cual, tras pulsarlo, iniciará la captura y reconocimiento de la voz para ingresarla al documento. Si se vuelve a oprimir, la detección se detendrá.

En fin, una pequeña guí­a en formato GIF puede resultar bastante útil para ver lo fácil que es darle uso: Continúa leyendo «Cómo usar la voz para escribir en un Documento de Google»

Amazon libera a Alexa, su asistente de voz presente en el Amazon Echo

alexa voice service

Si eres un fabricante y/o desarrollador y deseas que el dispositivo multimedia en el que trabajas disponga de un software de voz que pueda responder a usuales consultas como cuál es el estado del clima, del tráfico o qué significa cierta palabra, puedes aprovechar el Alexa Voice Service (AVS), un asistente de voz creado por Amazon para su dispositivo Amazon Echo pero que ya cualquier interesado puede descargar e implementar de forma gratuita en sus propias creaciones.

En esencia, para usar el servicio que se ofrece como Developer Preview sino es que para implementar una adaptación ya realizada por un tercero, basta con que el dispositivo tenga un micrófono para recibir las órdenes, una salida de audio y que esté conectado a Internet. La magia entonces de AVS es procesar en sus servidores lo capturado de la voz de los usuarios y devolverlo como respuestas de audio de las que el desarrollador y/o fabricante podrá disponer a su antojo. Continúa leyendo «Amazon libera a Alexa, su asistente de voz presente en el Amazon Echo»

En Holanda, un banco permite utilizar tu voz para gestionar tu cuenta bancaria

Realizar gestiones bancarias por Internet requiere introducir códigos PIN, contraseñas y demás medidas de seguridad para verificar nuestra identidad, lo cual suele retrasar en mayor o menor medida la velocidad a la que realizamos nuestras gestiones bancarias online. En Holanda, el banco ING lleva un tiempo trabajando en nuevas formas de mejorar la gestión de nuestra cuenta bancaria.

Imagen de shutterstock.com
Imagen de shutterstock.com

Gracias a la colaboración con Nuance (proveedor de soluciones de voz para empresas) y a la tecnologí­a biométrica de voz desarrollada por esta empresa, los clientes de este banco pueden utilizar su voz para realizar todo tipo de tareas con la app para dispositivos móviles, como identificarse o comprobar el saldo disponible en sus cuentas. Ahora, gracias al feedback recibido por los usuarios, ING ha incorporado la posibilidad de realizar pagos usando tan solo la voz. En Nuance consideran que se trata de una forma mucho más conveniente de gestionar tu cuenta bancaria desde un dispositivo móvil. Concretamente, afirman que el uso de la voz resulta mucho más seguro que el de las tí­picas medidas de seguridad, argumentando que el reconocimiento de voz no es susceptible a ataques de fuerza bruta. Además, explican también que cualquier intento de engaño serí­a grabado.

Actualmente, la posibilidad de realizar pagos usando la voz ha sido incluida en la más reciente actualización de la app de ING para iOS y Android. Además, los usuarios de dispositivos iOS con Touch ID también pueden utilizar su huella dactilar para identificarse a la hora de realizar un pago a través de la app.

Fuente: Nuance.

Google ralentiza las reproducciones pares de voz en su herramienta de traducciones

reproduccióntraducionporvoz

Interesante descubrimiento el efectuado desde el blog G.O.S. sobre la herramienta de traducción de Google, en el que se relata que las reproducciones pares de por voz de aquellos textos pendientes por traducir o ya traducidos serán ralentizados, quizás, para que los propios usuarios puedan entender y comprender mejor las pronunciaciones de las mismas de manera clara y ní­tida. Eso es interesante para comprender mejor estos textos, sobre todo, en caso de estar aprendiendo nuevos idiomas, entre otros posibles motivos.

En este sentido, la primera reproducción se reproducirá a una velocidad normal, a la que ya estamos acostumbrados, mientras que la segunda vez que demos a reproducir, dicha reproducción se realizará a una velocidad ralentizada. La tercera reproducción vuelve con la velocidad normal y, obviamente, la cuarta reproducción también será ralentizada, y así­ sucesivamente.

Es como si se indicase a Google que hable más despacio, lo que facilitará la comprensión de las propias frases indicadas. Desde dicha publicación se da cuenta también de que la URL de la página del traductor de Google que realiza la reproducción por voz ralentizada utiliza el parámetro «ttsspeed = 0.24», que es el encargado de permitir una reproducción más pausada.

Sin duda, una función más que interesante, la cual es bastante desconocida para la mayorí­a de los usuarios que usamos esta herramienta,

Amazon Echo ya se encuentra disponible para su reserva a cualquier usuario de Estados Unidos

En el pasado mes de noviembre nos hicimos eco del lanzamiento de Amazon Echo, el asistente por voz a través de un dispositivo fí­sico desarrollado por Amazon con el objetivo de permitir a los usuarios, mediante diferentes comandos de voz, solicitar diferentes tipos de informaciones, que serán obtenidas a través de la web. Por aquel entonces, el acceso para la compra de este dispositivo estaba accesible únicamente por invitación al precio de 199 dólares.

AmazonEcho

Siete meses más tarde, Amazon abre la posibilidad de que cualquier usuario de los Estados Unidos que lo desee, pueda adquirir una unidad de Amazon Echo sin necesidad de invitaciones, pudiendo desde hoy reservar la misma, la cual comenzará a ser enviadas a partir del 14 de julio.

Durante todo este tiempo, Amazon Echo ha evolucionado para ofrecer más prestaciones y mejorar las existentes, incluyéndose también dentro del concepto del Internet de las Cosas, de modo que además de poder solicitar y obtener información en muchos aspectos, los usuarios también podrán controlar ví­a voz las luces y otros dispositivos conectados, aunque para ello, también tendrán que realizar desembolsos adicionales para adquirir nuevos equipos compatibles, como puedan ser los enchufes Belkin Wemo y el sistema de iluminación inteligente Philips Hue, entre otros.

También incluye soporte para Pandora, Audible y Amazon Prime Music, así­ como para IFTTT, Google Calendar, entre otras posibilidades.

El coste de Amazon Echo será de 179,99 dólares. Recordar que Amazon Echo es un dispositivo circular que cuenta con siete micrófonos para captar las voces desde cualquier lugar de la habitación, disponiendo también de dos altavoces para difundir el audio a 360º para que llegue a cualquier punto de la sala.

Narro, una aplicación que lee los textos de las urls que indiquemos

captura-26

Usando una voz artificial capaz de detectar textos en 10 idiomas diferentes, Narro.co ofrece la posibilidad de transformar en audio los textos de las urls que indiquemos.

Para probarlo solo tenemos que crear una cuenta y comenzar a indicar direcciones web en la que se encuentren los artí­culos que queremos «leer». Narro se encargará de detectar el texto (eliminará banners e información extra) y ofrecerá el archivo de audio con el contenido.

El objetivo de Narro es transformarse en una herramienta que pueda incluso crear podcasts de medios de forma automática, aunque usando una voz artificial es muy difí­cil conseguir un público fiel. Sea como sea, puede ser bastante práctico para escuchar nuestras noticias preferidas mientras conducimos, por ejemplo.

Narro se integra con varias herramientas de podcast y permite cambiar la voz en caso de que no nos guste la asignada, y ofree también un bookmarklet que podemos poner en la barra de favoritos para pulsarlo cuando queramos leer la noticia que tenemos abierta en el navegador.

La opción gratuita solo permite 20 textos al mes, y no ofrece la posibilidad de leer el texto que copiemos y peguemos directamente en el sistema (solo lee contenido ví­a urls), aunque siempre es posible pagar 4 dólares al mes para eliminar ese lí­mite.

Touchless Chat permite mantener conversaciones sin tocar la pantalla [Android]

ToculessChat

Presentado dí­as atrás por su propio desarrollador, Joaomgcd, en el subreddit Android, Touchless Chat es una aplicación móvil para dispositivos Android que aprovecha el potencial de Google Now para posibilitar a los usuarios mantener conversaciones con sus contactos a través de las principales aplicaciones de mensajerí­a móviles simplemente mediante comandos de voz, sin necesidad de tocar la pantalla de los propios dispositivos. Es compatible además con la aplicación Tasker y con relojes bajo Android Wear.

Touchless Chat soporta SMS y las aplicaciones de mensajerí­a Hangouts, WhatsApp, Facebook, Telegram, Viber, Skype y Threema, aunque también funcionan con las aplicaciones Tango, Wechat y myEnigma con algunas dificultades, según se indica desde la sección de aplicaciones soportadas desde su web oficial.

Otros aspectos a tener en cuenta con respecto a Touchless Chat es que permitirá establecer comunicaciones con los contactos directamente a través de las respectivas aplicaciones por defecto a través de los widgets que se podrán colocar en el escritorio de Android, y además, no será necesario tener el dispositivo rooteado para su instalación. La aplicación se encuentra disponible de manera gratuita a través de Google Play Store, financiado mediante publicidad, siendo compatible con dispositivos Android desde la versión 4.3 en adelante.

Desde la página de perfil de Touchless Chat se hace un llamamiento a los usuarios de que para desinstalar la aplicación, será necesario desactivar el modo administrador, o bien utilizar la opción incorporada que posibilita su desinstalación. En la FAQ disponible en su web oficial hay más información al respecto, tanto en este asunto como a otros que serán interesantes conocer de antemano.

3 formas de realizar llamadas teléfonicas usando urls

Desde hace varios años hay empresas que están trabajando para permitir realizar llamadas telefónicas sin que sea necesario conocer números de cada persona. El objetivo de estas propuestas es asociar una url a cada usuario, y cada vez que alguien pulse en ese link (o acceda directamente), se realizará una llamada en el origen.

Veamos tres opciones de las que ya hemos hablado en el pasado:

toky.co: Seguramente la más completa, ya que cuenta con aplicaciones móviles. Cuando alguien accede a nuestra url, recibimos una llamada, ya sea en el móvil o en el navegador, con versión android ya disponible y iOS en camino. Usa WebRTC, estando disponible en navegadores Chrome, Firefox y Opera.

captura-105

vox.io: La idea es semejante, aunque en este caso no tiene versión móvil. Al registrarnos (algo que no es obligatorio), podemos asociar un número de teléfono a nuestra cuenta, de forma que cuando alguien pulse en nuestro enlace, se activará nuestro número y recibiremos la llamada. Como veis, la filosofí­a de funcionamiento es diferente, ya que internamente sí­ necesita de nuestro número, aunque quien llama nunca lo conoce.

captura-106

zingaya: Por un precio mensual recibiremos las llamadas de cualquier visitante que pulse en el link que publiquemos en nuestra web. Es una conocida solución, no gratuita, que está disponible en varios paí­ses, con tarifas diferentes para cada uno. Dispone de buzón de voz, histórico de llamadas, posibilidad de configurar horarios de atención al cliente, llamadas a varias lineas y mucho más.

Toky, para realizar llamadas telefónicas sin usar números

captura-72

En los últimos años hemos visto ya algunas iniciativas que pretenden sustituir los números de las llamadas telefónicas. El objetivo, en la mayorí­a de ellas, es permitir que cualquier persona pueda llamarnos teniendo una url en su poder, no un número, y en Toky (toky.co) apuestan por la idea con una solución moderna y adaptada al mundo móvil.

Nos lo presentan como una plataforma de llamadas de voz que permite que recibamos llamadas desde un link personal. Cada usuario tendrá una url especí­fica (toky.co/diegopolo, por ejemplo), y al compartirlo con otras personas permitiremos que puedan llamarnos usando tanto el navegador como el móvil (ya tienen app android).

Las llamadas usando el navegador usan tecnologí­a WebRTC, pueden realizarse desde cualquier navegador moderno compatible con ella. Desde android el funcionamiento es semejante, recibimos las llamadas de quienes clican en nuestro enlace particular.

Ya están creando la versión para empresas, con el objetivo de conectar de forma gratuita a clientes con compañí­as usando únicamente el link configurado al crear la cuenta.

En su página web tenéis un pequeño ví­deo mostrando el ejemplo de cómo desde el navegador se realiza una llamada a un dispositivo android, así­ como el aviso indicando que la versión iOS ya está en camino.