Digg vuelve a la carga: así es la beta que quiere competir con Reddit (y por qué su “podcast diario” es lo más raro)

Hubo un tiempo en que Digg era el lugar al que ibas cuando querías “desenterrar” lecturas largas, vídeos curiosos o noticias con chispa. Nació en 2004 con una idea sencilla y muy potente: la comunidad propone enlaces, el resto vota y un algoritmo decide qué sube a la portada. Si hoy te suena a Reddit, no es casualidad. La diferencia grande era que Digg no se organizaba en espacios creados por usuarios al estilo de los subreddits, pero el espíritu era parecido: un termómetro colectivo de lo interesante.

Ese equilibrio se rompió a partir de 2010. Según recuerda Lifehacker, Digg encadenó rediseños drásticos que cambiaron hábitos básicos: apareció DiggBar, una barra que se superponía encima del contenido como un marco incómodo, y se recortaron funciones como “bury”, el equivalente a un downvote moderno. Entre cambios de dueño y experimentos como una portada más curada manualmente, Digg fue perdiendo tracción justo cuando Reddit empezaba a convertirse en el gigante que hoy conocemos. Continúa leyendo «Digg vuelve a la carga: así es la beta que quiere competir con Reddit (y por qué su “podcast diario” es lo más raro)»

FluentVox: texto a voz con IA en Laravel con clonado de voz y aceleración por GPU

FluentVox es un paquete para Laravel que lleva la síntesis de voz (text-to-speech, TTS) a un terreno muy familiar para quienes trabajan con este framework: una API fluida, encadenable y con “sensación Laravel”. La propuesta es clara: envolver el motor Chatterbox de Resemble AI en una capa de PHP que permita generar audio desde texto con una experiencia más cercana a construir una consulta Eloquent que a pelearse con scripts dispersos.

El anuncio llega desde Laravel News, donde se presenta como una opción pensada para uso real en producción, no como una demo. El detalle importante es ese “pensado para producción”: incluye detección automática del hardware disponible, descarga de modelos, herramientas de diagnóstico y un flujo de instalación que intenta quitarle dramatismo a todo lo que normalmente acompaña al TTS moderno. La fuente original sitúa a Resemble AI como el motor subyacente y a FluentVox como el puente “laravelizado” que ordena el caos. Continúa leyendo «FluentVox: texto a voz con IA en Laravel con clonado de voz y aceleración por GPU»

Pipit: dictado gratuito y privado en Mac que también entiende órdenes de voz

Hablarle al ordenador para que escriba por ti ha pasado muchos años en esa categoría de “suena bien, pero no termina de funcionar”. O fallaba con acentos y ritmos naturales, o era caro, o exigía enviar tu voz a servidores remotos con la misma alegría con la que uno le contaría un secreto a un desconocido en el metro. Lo interesante de Pipit es que cambia el enfoque: es una app gratuita para macOS centrada en voz a texto que funciona offline, lo que la vuelve especialmente atractiva para quien valora la privacidad.

La propuesta se entiende con una metáfora sencilla: si el dictado en la nube es como pedirle a alguien que transcriba tu audio en otra habitación (y confiar en que no copie nada), el dictado local es como tener una libreta en tu bolsillo. Nadie más la ve, nadie la procesa, nadie la guarda fuera de tu control. Según contó Lifehacker en un artículo firmado por Justin Pot, Pipit transcribe sin conexión y, por tanto, mantiene el audio en tu propio equipo, sin depender de servicios externos para lo básico. Continúa leyendo «Pipit: dictado gratuito y privado en Mac que también entiende órdenes de voz»

OpenAI y la nueva fiebre del audio: cuando hablar vuelve a ser la interfaz

OpenAI está redoblando su inversión en audio con una ambición que va bastante más allá de que ChatGPT “suene mejor”. Según una información publicada por The Information, la compañía ha reorganizado durante los dos últimos meses varios equipos de ingeniería, producto e investigación para rehacer a fondo sus modelos de voz. El objetivo no sería solo mejorar la experiencia en pantalla, sino preparar el terreno para un dispositivo personal audio-first que, siempre según esa misma fuente, llegaría aproximadamente dentro de un año.

La idea de un aparato centrado en la voz encaja con una intuición que se repite en Silicon Valley: la pantalla, sin desaparecer, empieza a estorbar en muchos momentos del día. Si el teléfono fue el mando a distancia de nuestra vida digital, el audio aspira a convertirse en el “manos libres” permanente. La consecuencia práctica es clara: la conversación deja de ser un complemento para convertirse en el canal principal. Continúa leyendo «OpenAI y la nueva fiebre del audio: cuando hablar vuelve a ser la interfaz»

NotebookLM apuesta por el audio: así funcionará su nuevo modo «Lecture»

NotebookLM, la herramienta de Google orientada a la organización de notas con inteligencia artificial, se prepara para introducir un cambio significativo en una de sus funciones más destacadas: los Audio Overviews. Aunque la aplicación no alcanza las cifras de descarga de otras propuestas de Google, ha conseguido posicionarse como una de las más valoradas por su constante evolución. Ahora, todo indica que se avecina una mejora sustancial que podría cambiar la forma en la que los usuarios consumen contenido generado por IA. Continúa leyendo «NotebookLM apuesta por el audio: así funcionará su nuevo modo «Lecture»»

Chrome convierte cualquier página web en un podcast: así funciona la nueva función de lectura en voz alta

Google ha dado un paso más hacia una experiencia de navegación personalizada y accesible con una innovadora función en Chrome para Android. Se trata de una versión mejorada de «Escuchar esta página«, que permite convertir cualquier sitio web en un podcast estilo conversacional, gracias a la inteligencia artificial.

Esta característica, que está siendo desplegada de forma progresiva, reemplaza la voz robótica tradicional por una dinámica interacción entre dos voces generadas por IA, lo que transforma la lectura automatizada en una experiencia mucho más entretenida y humana. Continúa leyendo «Chrome convierte cualquier página web en un podcast: así funciona la nueva función de lectura en voz alta»

Google Gemini ya permite subir archivos de audio: lo que debes saber

Google acaba de incorporar una mejora significativa en su asistente de inteligencia artificial Gemini: la posibilidad de subir archivos de audio para analizarlos, transcribirlos o resumir su contenido. Esta función era una de las más solicitadas por la comunidad desde que se habilitó la carga de archivos en la plataforma, y ahora, tras una actualización silenciosa, finalmente está disponible en Android, iOS y también en la versión web.

Josh Woodward, vicepresidente de Google Labs y responsable de Gemini, confirmó la noticia a través de su cuenta en X (antes Twitter), calificando esta mejora como la “solicitud número uno” de los usuarios. Y no es para menos. Desde hace meses, Gemini podía procesar imágenes, documentos PDF, e incluso videos, pero la ausencia del audio se sentía como una omisión extraña, especialmente en un mundo donde las notas de voz, los podcasts y los mensajes grabados se han vuelto parte esencial de la vida digital cotidiana. Continúa leyendo «Google Gemini ya permite subir archivos de audio: lo que debes saber»

Plaud Note: el asistente de notas con IA que transforma la forma en que trabajamos

Plaud Note es algo más que un dispositivo para grabar audio, es una herramienta de productividad que ha sabido combinar un diseño minimalista con la potencia de la inteligencia artificial. Su tamaño, similar al de una tarjeta de crédito, y su peso ultraligero de apenas 30 gramos hacen que se convierta en un acompañante discreto pero poderoso. En las pruebas realizadas, sorprende cómo desaparece en el bolsillo o en la parte trasera del móvil gracias a su sistema magnético compatible con MagSafe.

Continúa leyendo «Plaud Note: el asistente de notas con IA que transforma la forma en que trabajamos»

Meta refuerza su apuesta por el audio con la compra de WaveForms

Meta ha dado un nuevo paso en su estrategia de consolidación en el sector de la inteligencia artificial con la adquisición de WaveForms, una startup especializada en tecnología de voz impulsada por IA. Aunque los detalles financieros del acuerdo no han sido revelados, esta operación refuerza la posición de Meta en el desarrollo de herramientas de audio avanzadas, particularmente bajo su nueva unidad llamada Superintelligence Labs. Continúa leyendo «Meta refuerza su apuesta por el audio con la compra de WaveForms»

Auriculares con audio 3D bioadaptativo: cuando la música se ajusta a tu oído

Escuchar música con auriculares siempre ha sido una experiencia personal, pero ahora la tecnología está llevando esa personalización a un nuevo nivel. Los auriculares con audio 3D bioadaptativo prometen una revolución silenciosa pero significativa: ajustar cada canción a tu forma de oír. No se trata sólo de ecualizadores o modos preestablecidos; hablamos de sistemas que entienden cómo funciona tu oído y remezclan el sonido para ti.

Continúa leyendo «Auriculares con audio 3D bioadaptativo: cuando la música se ajusta a tu oído»