Con el objetivo de que la experiencia con Alexa, el asistente virtual de Amazon, sea más natural y fluida, Amazon acaba de lanzar dos nuevas características basadas en su tecnología Neural TTS (NTTS), tecnología de texto a voz presentada este pasado verano, que permite recibir una experiencia de voz mucho más natural.
Por un lado, Alexa ahora puede ofrecer respuestas bajo diferentes tonos emocionales de felicidad o de decepción en función de las preguntas que se les realicen y el tipo de resultados que ofrezcan, y por otro lado, Alexa también puede ofrecer respuestas bajo estilos de habla diferentes para diferentes tipos de contenidos.
La primera de ellas está únicamente disponible para los usuarios de los Estados Unidos, y la segunda, además de estar disponible para los usuarios de los Estados Unidos, también ofrece un estilo de habla de noticias específico de Australia para los usuarios de aquel país.
Respuestas emocionales
Acorde a Amazon, los usuarios pueden hacer que Alexa ofrezca una respuesta de tipo feliz/emoción cuando ellos respondan correctamente a una pregunta de trivial o ganen un juego, y de la misma manera pueden hacer que Alexa ofrezca una respuesta de tipo decepcionado/empático cuando se le pregunte por los resultados del equipo deportivo favorito y este haya perdido, a modo de ejemplos.
Amazon señala que en sus pruebas, la satisfacción con Alexa ha aumentado en un 30% con esta característica.
Respuestas con estilos de habla
Por el momento, Amazon ha traído dos estilos de habla diferentes: noticias y música. Estos estilos cambian la forman en la que Alexa expresa los contenidos por voz con respecto a la forma de habla habitual de Alexa. En el caso de las noticias, Alexa adopta un estilo similar al de los presentadores de informativos.
Si bien estos dos estilos de habla están desde ahora disponibles en los Estados Unidos, la compañía señala que los usuarios de Australia pueden habilitar el estilo de habla específico de noticias de aquel país.
En las pruebas llevadas a cabo, el estilo de noticias llega a ser un 31% más natural, mientras que el estilo de música llega a ser un 84% más natural.
Estas dos características deberán ser activadas expresamente por los usuarios.
Para desarrolladores
Amazon también se dirige a los desarrolladores instándoles al uso de las etiquetas SSML, de reciente lanzamiento, para que las respuestas de sus habilidades en Alexa puedan ser emocionales y de estilo, pudiendo participar en el foro de desarrolladores para consultar cualquier duda que puedan tener.
Crédito de imagen: Amazon