Convierte tu Raspberry Pi en un asistente de IA local con Max Headbox

Publicado el

asistente IA

La Raspberry Pi 5 ha demostrado ser mucho más que una simple placa para entusiastas de la electrónica. Lo que comenzó como una herramienta educativa hoy se transforma en el centro de proyectos que rozan lo futurista. El desarrollador Simone Marzulli ha llevado esta idea al siguiente nivel, creando un agente de inteligencia artificial completamente local que funciona de forma autónoma en una Raspberry Pi, sin necesidad de depender de servidores externos. Su invento, bautizado como Max Headbox, es un ejemplo brillante de cómo combinar privacidad, accesibilidad y creatividad.

Una IA que no necesita de la nube

Marzulli se propuso un objetivo muy claro: que ningún dato saliera de la Raspberry Pi. En tiempos donde la privacidad digital es una preocupación constante, lograr que un agente conversacional de IA funcione sin conexiones a la nube es una proeza que muchos valoran. El enfoque de Simone fue el de utilizar modelos de lenguaje abiertos y ejecutarlos de manera eficiente dentro de los límites de la placa. Esto significa que toda la capacidad de procesamiento, reconocimiento de voz y generación de respuestas ocurre en el dispositivo local.

Para lograr esto, seleccionó cuidadosamente modelos pequeños pero potentes. En concreto, usó Qwen3 1.7b para la parte «agente» (la que toma decisiones y realiza tareas) y Gemma3 1b para la parte conversacional, enfocada en respuestas más naturales y emocionales. Ambos modelos operan dentro del rango de 1.000 a 2.000 millones de parámetros, ideal para un equilibrio entre rendimiento y capacidad de expresión.

Un diseño pensado para la interacción

Max Headbox no es solo un software corriendo en segundo plano. Es un dispositivo físico con pantalla, carcasa y ventilación, pensado para estar sobre un escritorio como un pequeño asistente de voz con rostro animado. Marzulli utilizó una pantalla táctil y una carcasa de GeeekPi, junto con un ventilador para mantener la temperatura bajo control. Lo llamativo es que el «rostro» del asistente es un emoji animado de Microsoft Fluent, modificado con GIMP, que reacciona a las interacciones del usuario.

El sistema reconoce comandos por voz mediante una palabra clave, pero también permite iniciar y detener la grabación con simples toques en la pantalla. Una barra de colores en movimiento indica el estado del sistema: azul cuando está listo para escuchar, rojo cuando está grabando y un arcoíris cuando está procesando la respuesta.

Componentes necesarios para replicarlo

Quienes quieran montar su propio Max Headbox pueden seguir los pasos detallados que Simone ha documentado en GitHub. Para empezar, es necesario contar con una Raspberry Pi 5, preferiblemente de 8 o 16 GB de RAM para mayor fluidez. A esto se suma un micrófono USB compatible (Marzulli sugiere uno en particular) y el conjunto de pantalla, carcasa y ventilador de GeeekPi.

En cuanto al software, hay que instalar:

  • Ruby 3.3.0
  • Node 22
  • Python 3
  • Ollama, una herramienta que facilita la ejecución de modelos de lenguaje.

Para la parte de reconocimiento de voz, se utilizan dos componentes clave: Vosk API para detectar la palabra clave y faster-whisper para transcribir rápidamente lo que el usuario dice.

Crear herramientas personalizadas

Una de las funcionalidades más interesantes de Max Headbox es que se le pueden añadir «herramientas» que el agente puede utilizar. Estas herramientas son módulos en JavaScript que se definen mediante un objeto con cuatro campos: nombre, parámetros que acepta, descripción y la función que ejecuta la tarea. Esta estructura sencilla permite que cualquiera con conocimientos básicos de programación pueda personalizar las funciones del asistente.

Por ejemplo, podrías crear una herramienta para anotar rápidamente ideas en un archivo de texto, controlar dispositivos inteligentes en casa o buscar información en una base de datos local. Las posibilidades son tan amplias como la creatividad del usuario.

Un proyecto para aprender y explorar

Max Headbox no es solo un asistente práctico, también es una puerta de entrada para quienes quieren aprender cómo funciona la inteligencia artificial en el mundo real. Armar este sistema es como montar un pequeño laboratorio de IA en tu escritorio, donde puedes experimentar con modelos, interfaces y funciones adaptadas a tus necesidades.

Este tipo de proyectos refuerzan el valor educativo de la Raspberry Pi, y al mismo tiempo demuestran que es posible construir soluciones de IA respetuosas con la privacidad, sin depender de grandes corporaciones ni conexiones permanentes a Internet.