Rendimiento del ASUS ProArt P16 con modelos LLM locales (Ollama + Docker)

Publicado el

proart 16

¿Te ha pasado que sales de viaje, necesitas retocar un guion o un proyecto en pleno tren y, justo cuando la conexión se va… zas, tus herramientas en la nube se cuelgan? A mí me pasó en el AVE Madrid‑Barcelona — 200 km/h, Wi‑Fi de chiste — y juré que la próxima vez llevaría mi propio “servidor” en la mochila. Ahí empezó mi romance con el ProArt P16 de ASUS, un portátil que me acompaña en todas las batallas.

Me ayuda a crear flujos n8n con IA de Ollama para hacer un RAG de demostración para mis clientes, o para no depender de la nube si necesito a la IA para redactar cualquier cosa.

En este vídeo os cuento el principio

El hardware (traducido a “cosas que importan”)

  • CPU – Ryzen AI 9 HX 370. 12 núcleos, 24 hilos y una NPU de 50 TOPS que, por ahora, es más promesa que realidad.
  • GPU – RTX 4070 Laptop con 8 GB de VRAM (si pillas la 5070, ganas 4 GB extra). Básicamente, la llave a la fiesta CUDA.
  • RAM – 64 GB LPDDR5X @ 7500 MHz. Traducido: puedes abrir Chrome con 40 pestañas y seguir generando texto sin que todo explote.
  • SSD – 4 TB PCIe 4.0. DeepSeek 14 B pesa más de 140 GB; aquí cabe sin hacer malabares.
  • Térmicas – Tres ventiladores y 120 W compartidos que aguantan sesiones largas sin estrangular la GPU.

En castellano: es un portátil que no hace “throttlefest” en cuanto llevas diez minutos de inferencia.

¿Cuántos tokens por segundo da la máquina?

Modelo (4‑bit)VRAM realVelocidad típica*
Gemma 7 B≈ 8 GB30–35 t/s
Qwen 7 B≈ 11 GB22–30 t/s
Llama‑2 13 B≈ 12 GB28–34 t/s
DeepSeek 14 B Distill≥ 14 GB8–12 t/s

¿Y el DeepSeek completo?

Olvídate: necesita unos 24 GB de VRAM. Se puede hacer off‑load a RAM, pero verás 3–5 t/s y la batería llorará.

Cosas que he aprendido a base de prueba‑y‑error

  • Cuantiza en Q4_K_M siempre que puedas. Pierdes un 3 % de calidad y ganas un 30 % de VRAM.
  • OLLAMA_CUDA=1 en Windows es tu amigo si ves que la GPU se queda al 0 %.
  • Bloquea los clocks con nvidia-smi -lgc 300,1980 y notarás menos dientes de sierra en los benchmarks.
  • Enchufado a la corriente, el P16 se mantiene en 90 °C constantes. En batería el TDP baja y la velocidad cae a la mitad.

¿Hace ruido?

Sorprendentemente poco. Los ventiladores suenan como un susurro grave (no ese “zumbido aspiradora” típico de gaming). Con auriculares ni lo notas. Sin ellos… bueno, es soportable; digamos un 30 % más silencioso que un Zephyrus.

Mi veredicto (subjetivo, claro)

Si lo tuyo es escribir, programar o editar vídeo con un copiloto local, el ProArt P16 te cubre las espaldas. Gemma y Qwen se portan bien, y si necesitas algo más gordo, siempre queda la opción de tirar de Docker + TensorRT‑LLM para exprimir cada milisegundo.

¿Es barato? Ni de lejos. ¿Es demasiado grande para el sofá? Un poquito. Pero, oye, cambia eso por autonomía creativa sin conexión y se vuelve un trato bastante dulce.

Próximos pasos

A medida que me voy acostumbrando a esta nueva forma de trabajar, le voy encontrando las cosquillas y me atrevo con modelos nuevos. Ya os iré contando.

Enlace: asus.com

Publicado en

Comparte en: