Impresionante demostración de sí­ntesis de voz con HTML5

Publican en chromestory.com el resultado de una demostración realizada hoy por Acapela donde muestran una aplicación capaz de generar voz, en varios idiomas y con diferentes sentimientos, usando HTML5.
Podéis ver la demostración, de 9 slides, aquí­, asegurandoos de que el navegador utilizado es la última versión de Google Chrome.
En las diapositivas podréis interactuar con el sistema, escribiendo texto para que sea leí­do de forma automática, generando efectos, aumentando o disminuyendo la velocidad de la locución o generando un mp3 con el resultado.

Sorprendente y muy, muy rápido.

CloudTalk – Mensajes de voz entre teléfonos inteligentes


Si tenéis un iPhone o teléfono con Android no podéis dejar de probar CloudTalk, una aplicación que nos permite comunicarnos con nuestros contactos usando mensajes de voz, siendo extremadamente sencillo y práctico de utilizar.
La idea no es tener un buzón de voz y sí­ un diálogo en tiempo real, sin necesidad de realizar ninguna llamada y agilizando la conversación con un sistema semejante al de whatsapp.com.
Con este sistema también es posible enviar fotos, ví­deos o texto, aunque el objetivo principal es utilizar la voz como protagonista.
Un buen producto de mensajerí­a instantánea que promete hacer mucho ruido en los próximos meses.

[Capturas de pantalla] Búsqueda por voz testeándose en Google

Los usuarios de terminales móviles con Android quizás estén familiarizados a la hora de usar las búsquedas de voz a través de sus terminales mediante Google Voice Search.
Pues bien, parece ser que Google está testeando esta posibilidad a través de su buscador internacional, Google.com, donde el buscador detectará en nuestra configuración si nuestro equipo tiene un micrófono disponible, y en caso afirmativo, mostrar un widget donde poder redactar nuestros comandos ví­a voz.
De momento no está disponible para todos los usuarios, aunque algunos ya informaron de haber visto esta nueva función. Os dejamos con algunas capturas:
Continúa leyendo «[Capturas de pantalla] Búsqueda por voz testeándose en Google»

La entrada de voz mediante HTML, lo más destacado de Google Chrome 11


Hace ya algunas horas que tenemos con nosotros la nueva versión estable del navegador de Google, Google Chrome, que en su versión 11, entre otras caracterí­sticas, tenemos la posibilidad de que las páginas nos puedan escuchar, de manera que no necesitemos ni plugins ni aplicaciones de terceros para que nuestras voces puedan ser recogidas de forma nativa por las páginas que así­ lo soporten.
Un claro ejemplo lo tenemos en el traductor de Google, en el que dentro del cuadro de textos, en su parte inferior derecha, encontramos el icono de un micrófono que nos permitirá habilitarlo e introducir nuestros textos de viva voz, eligiendo el idioma en el que deseamos que sea traducido, y además, podamos escucharlo.
Además, detrás de esta nueva versión hay otras nuevas tecnologí­as incorporadas, que podemos explotar sus funcionalidades, al menos para poder probarlas, a través de chromeexperiments, donde encontraremos más de 200 ejemplos albergados en dicho directorio para que nos permita ver como podrí­amos interactuar con los nuevos sitios web de última generación de aquí­ a poco tiempo.
Ví­a: Google Chrome Blog

Speechify – La extensión que nos permite hablar con el navegador web


Ayer os mostramos que la versión beta de Chrome 11 usa la opción de interpretar la voz de los usuarios en algunas páginas web, algo que ya puede probarse usando una nueva extensión únicamente útil en dicha versión de google Chrome.
Speechify se instala en forma de icono al lado de la barra de búsqueda, permitiendo recibir órdenes ví­a micrófono para que busque lo que estamos diciendo, sin necesidad de escribir nada.
Podemos probarlo con Google, Hulu, Amazon, Youtube y muchos otros sitios que acepten este canal de entrada de datos.
Aunque sólo funciona en inglés, es un buen recurso para demostrar el futuro próximo de los navegadores web.
Link: Speechify | Ví­a techcrunch

Versión beta de Chrome 11 permite que hablemos con el navegador

Llevamos unos dí­as bastante ocupados con versiones nuevas de los navegadores: Chrome 10, Firefox 4, IE 9… y ahora informan que la beta de Chrome 11 está preparada para recibir e interpretar audio (nuestra voz).
Lo que han hecho es usar una API que permitirá a los programadores crear aplicaciones que interpreten la voz y la transformen en texto, abriendo las puertas a un sin fin de posibilidades.
Si ya estáis usando la versión beta de Chrome 11, podéis probar esta función en slides.html5rocks.com/#speech-input, sin Flash ni Plugin, sólo HTML5.
Via chrome.blogspot.com y Techcrunch.

Herramientas gratuitas para pasar de texto a voz en diferentes idiomas


Entre los recursos que más atención me llaman son aquellos que tratan el tema de reconocimiento de voz y sí­ntesis de la misma a partir del texto. De hecho hace algunos meses os indicamos algunos programas especializados en este tema.
Sobre este segundo tema, pasar de texto a voz de forma rápida con resultados lo más naturales posibles, hay mucho material que puede ser analizado en la web, existiendo un artí­culo bastante completo en efrontlearning.net con algunas de las opciones disponibles.
Entre ellas me ha llamado la atención la demostración online de The Center for Speech Technology Research, donde podemos indicar una frase de hasta 70 caracteres y obtener la voz en varios idiomas, con diferentes acentos.
Además de estar incluido el español, podemos usarlo para distinguir el inglés de Escocia, de Inglaterra o de Estados Unidos, por ejemplo, haciendo pronunciar las frases que deseemos (las posibilidades en el mundo académico son ilimitadas).
En el mismo artí­culo comentan algunas opciones de código abierto, como MARY, escrito en JAVA, así­ como soluciones 100% web como www.spokentext.net o www.yakitome.com.
Un mundo muy interesante con muchas aplicaciones esperando su evolución.
Actualización: Algunas de estas herramientas son las que utliza vozme.com para realizar su trabajo.

Bodalgo – Transfórmate en un locutor profesional

Bodalgo es un proyecto que permite poner en contacto a locutores con empresas que estén buscando la voz adecuada para su proyecto.
Como usuarios podemos registrarnos para formar parte de su base de datos, participando de castings junto con otros 2500 usuarios que ya participan en 50 idiomas diferentes.
Po rotro lado, las empresas pueden publicar un casting gratis, y encontrar la voz exacta que buscan; femenina, infantil, barí­tono, etc.

[…] empresas de casting, departamentos de mercadeo, empresas de producción audiovisual o de audio libros, en fin, todas aquellas empresas que necesiten una voz profesional para doblajes, audiolibros, presentaciones, publicidad, cursos de idiomas, entre muchos otros ejemplos.

Un interesante ‘marketplace’ gratuito de voces profesionales donde podemos encontrar una forma de ganar dinero con nuestra voz.

Blaving – Un nuevo sistema de microblogging que funciona con la voz


Si Twitter es un sistema de «microblogging«, Blaving serí­a un sistema de «micropodcasting«.
Disponible en español, inglés y portugués, nos ofrece la posibilidad de actualizar nuestra cuenta con grabaciones de voz de hasta dos minutos, siguiendo la misma filosofí­a de seguidores y seguidos de la mayorí­a de las redes sociales actuales.
Definido como el nuevo «Twitter de voz» por la empresa responsable (Pmovil, argentino-brasileña), cuenta con la posibilidad de compartir su contenido en Facebook, Twitter y Orkut.
Con versión para móviles entra fuerte en esta categorí­a, veremos si a la gente le convence compartir sus experiencias de esta forma, ya que compartir enlaces lo veo algo complicado usando solamente la voz…

Extensión nos permite buscar en Internet usando la voz


Voice Search es una extensión, para Google Chrome, que nos permite usar la voz para encontrar resultados en algunos buscadores.
Funciona en inglés, con lo que si decimos «kittens» nos encontrará gatitos en el buscador principal configurado, o «google images kittens» para encontrar sus fotos en Google Image.
Ya viene configurado con los buscadores de Google, Wikipedia, YouTube, Bing, Yahoo, DuckDuckGo y Wolfram|Alpha, aunque podemos añadir más, viendo un icono de un micrófono al lado de la caja de texto de los sitios añadidos.
Para que funcione deberemos configurar el navegador activando la variable –enable-speech-input. Para hacer esto en Windows 7, por ejemplo, tendremos que apretar el botón derecho sobre el icono de Google Chrome (cerrado) y cambiar la execución con este comando:

%LocalAppData%\Google\Chrome\Application\chrome.exe –enable-speech-input

Podéis obtener más información en la página de la extensión y en la de su creador.