Microsoft presenta Mu: su nuevo modelo de IA que mejora la configuración en Windows 11

Publicado el

imagen-sobre-Mu-nuevo-modelo-de-IA-que-mejora-la-configuracion-en-Windows-11

Windows 11 ha dado un paso hacia una experiencia más intuitiva y personalizada con la incorporación de Mu, un modelo de inteligencia artificial desarrollado por Microsoft. Este modelo funciona de forma local en los equipos Copilot+ y ha sido diseñado para facilitar el acceso y modificación de ajustes dentro del sistema operativo, usando lenguaje natural. A continuación, repasamos las características técnicas y funcionales de Mu, y cómo está cambiando la forma en que interactuamos con Windows.

¿Qué es el modelo Mu?

Mu es un modelo de lenguaje pequeño (SLM) que se ejecuta directamente en el dispositivo, sin depender de la nube. Esto es posible gracias al uso de la unidad de procesamiento neuronal (NPU) de los equipos Copilot+. Tiene una arquitectura de codificador-decodificador basada en transformadores y cuenta con 330 millones de parámetros, una cifra modesta si se compara con modelos de lenguaje más grandes, pero ideal para tareas locales que exigen rapidez y eficiencia.

El modelo fue entrenado en Azure Machine Learning utilizando GPUs A100, partiendo de la familia de modelos Phi desarrollada por Microsoft. A través de una técnica conocida como destilación, se logró reducir el tamaño del modelo original manteniendo un rendimiento similar, algo crucial para su uso en dispositivos con recursos limitados.

Inteligencia artificial integrada en la configuración de Windows 11

El principal uso actual de Mu es potenciar los agentes de IA dentro del menú de configuración de Windows 11. Estos agentes permiten que el usuario describa con palabras lo que quiere hacer (por ejemplo, «activar el modo oscuro» o «aumentar el brillo por la noche») y el sistema se encarga de ejecutar la acción o guiar al usuario hasta el ajuste correspondiente.

Esta funcionalidad se asemeja a tener un asistente personal dentro del sistema operativo. Ya no es necesario recordar en qué menú está cada opción: solo hace falta decirlo y la IA se encarga.

Optimizado para funcionar sin latencia

Uno de los retos más importantes al integrar Mu en Windows fue lograr tiempos de respuesta muy bajos. Microsoft asegura que el modelo puede responder a más de 100 tokens por segundo y completar tareas en menos de medio segundo, algo fundamental para una experiencia fluida.

Esto se logró gracias a varias estrategias:

  • Diseño eficiente del modelo, ajustando el tamaño de las capas y la distribución de parámetros.
  • Uso de datos específicos de tareas, con más de 3,6 millones de ejemplos usados para entrenar el modelo.
  • Técnicas de entrenamiento avanzadas como la adaptación de rango bajo (LoRA) y el etiquetado sintético.

Estas técnicas permitieron que Mu entienda cómo las personas se refieren a tareas comunes de forma natural, incluso si la frase tiene ruido o es informal.

Limitaciones actuales y ajustes contextuales

Como todo sistema basado en lenguaje, Mu enfrenta ciertos retos:

  • Las frases vagas o demasiado cortas (“brillo”, por ejemplo) no ofrecen suficiente contexto.
  • Algunas acciones pueden tener significados múltiples (“aumentar brillo” puede referirse a la pantalla del portátil o a un monitor externo).

Para resolver esto, Microsoft mantiene los resultados de búsqueda tradicionales en consultas poco claras y entrena a Mu para que priorice los ajustes más comunes en caso de ambigüedad.

Una apuesta por la eficiencia local

La decisión de ejecutar Mu totalmente en el dispositivo responde a una tendencia creciente: llevar la inteligencia artificial al borde (edge computing). Esto mejora la privacidad, reduce la dependencia de Internet y permite una respuesta más rápida.

El modelo también está optimizado para trabajar con el hardware especializado de los nuevos PC con NPU, lo cual abre la puerta a una nueva generación de asistentes inteligentes locales, más allá de la nube.

El futuro de los agentes de IA en Windows

Aunque por ahora su aplicación está centrada en la configuración, no es difícil imaginar un futuro en el que agentes como los impulsados por Mu puedan ayudarte a redactar correos, crear automatizaciones o gestionar aplicaciones sin necesidad de abrir menús ni seguir rutas complejas.

Microsoft sigue entrenando y ajustando el modelo, con el objetivo de que reconozca cada vez más funciones del sistema y pueda comprender mejor el lenguaje humano en toda su variedad.