Phi-4-reasoning-vision-15B: el modelo multimodal compacto de Microsoft que “piensa” solo cuando conviene
Microsoft Research ha presentado Phi-4-reasoning-vision-15B, un modelo multimodal de 15.000 millones de parámetros con pesos abiertos, pensado para combinar visión y lenguaje sin disparar costes de cómputo ni latencia. La idea es sencilla de entender con un ejemplo cotidiano: no necesitas sacar una calculadora científica para apuntar un número de teléfono, pero sí para resolver… <a href="https://wwwhatsnew.com/2026/03/07/phi-4-reasoning-vision-15b-el-modelo-multimodal-compacto-de-microsoft-que-piensa-solo-cuando-conviene/">Continúa leyendo »</a>