La startup que entrena robots jugando a Fortnite: General Intuition levanta 320 millones a una valoración de 2.300 millones de dólares

Cuando entró al laboratorio de General Intuition en Nueva York, la periodista que cubría el artículo para TechCrunch se encontró con algo que no esperaba: una pantalla mostrando a una IA jugando a algo parecido a Fortnite, llevando 100 horas consecutivas de partida sin interrupción. Lo que hizo que Pim de Witte, CEO de la empresa y uno de sus fundadores, desviara su atención hacia el otro lado de la sala fue un robot cuadrúpedo acercándose. «El mismo cerebro que alimenta al agente en el juego alimenta al robot», dijo de Witte, de 31 años.

General Intuition confirmó este 25 de junio de 2026 que ha levantado 320 millones de dólares a una valoración de 2.300 millones (≈ 2.024 millones de euros), lo que informa Kyle Wiggers en TechCrunch. La ronda eleva el total captado a 454 millones de dólares (≈ 400 millones de euros), tras el seed de 134 millones de octubre de 2025, uno de los mayores de la historia de la IA.

La tesis: los videojuegos son el dado de entrenamiento que la robótica necesita

La teoría detrás de General Intuition parte de una limitación real de los modelos de lenguaje grandes. Los LLMs son muy buenos en texto porque han consumido prácticamente todo el texto disponible en internet. Pero el razonamiento espaciotemporal —saber cómo moverse por el espacio, anticipar consecuencias físicas, entender que las paredes no se atraviesan y las escaleras se suben— no está en el texto. Está en la experiencia de hacer cosas.

Los videojuegos, argumenta de Witte, son la forma más escalable de generar esa experiencia a coste razonable. La plataforma Medal, de la que General Intuition es un spin-out, tiene 10 millones de usuarios activos mensuales que suben 2.000 millones de clips de juego al año de decenas de miles de títulos distintos. Esos clips no son simples vídeos: llevan incorporadas las etiquetas de acción, es decir, qué botones pulsó el jugador en cada fotograma.

Esa capa de datos es lo que diferencia a Medal de YouTube o Twitch. Competidores que intentan inferir acciones a partir de vídeo solo disponen del vídeo. General Intuition tiene el vídeo más las acciones. «La mayoría de competidores intenta inferir acciones a partir del vídeo solo, lo que de Witte argumenta que es insuficiente para el razonamiento causal que necesitan los agentes reales», escribe TechCrunch.

El dato histórico que mejor ilustra el valor percibido de ese dataset: a finales de 2024, OpenAI ofreció 500 millones de dólares por adquirir Medal. De Witte rechazó la oferta y en su lugar creó General Intuition como empresa separada. No hay mejor validación del activo que la voluntad de pago de un competidor.

Cómo funciona el modelo y qué pueden hacer ya sus agentes

El producto central es un modelo de mundo (world model): en lugar de usar un motor de juego convencional que renderiza fotogramas con reglas físicas predefinidas, General Intuition genera el entorno fotograma a fotograma mediante un modelo de difusión. Los investigadores detrás de la metodología —entre ellos los co-fundadores Eloi Alonso, Vincent Micheli (autores del paper sobre DIAMOND, un world model basado en difusión) y Adam Jelley— publicaron trabajos influyentes sobre cómo construir entornos de simulación para agentes sin necesitar un motor de juego.

La demo más llamativa: un periodista pudo controlar un agente en el world model de General Intuition y comprobó que las paredes eran sólidas, las escaleras escalables y las sombras se proyectaban correctamente según la posición del sol. «De los millones de horas de juego, de alguna manera aprendió que las paredes son paredes, las escaleras son para subir y las sombras se alargan al atardecer», escribe el reportaje.

El mundo simulado no es el producto final: es el gimnasio de entrenamiento. Lo que General Intuition quiere vender es el agente entrenado en ese gimnasio, no el entorno en sí. La distinción importa comercialmente: competidores como World Labs (Fei-Fei Li, 1.000 millones de dólares en febrero de 2026) o Decart (300 millones) venden el entorno de simulación. General Intuition vende la inteligencia que emerge del entrenamiento en ese entorno.

El análisis de 2026 sobre cómo la IA se está poniendo a trabajar ya identificaba los videojuegos como «bancos de pruebas baratos y rápidos para entrenar sistemas que aspiran a robótica y autonomía en el mundo físico». General Intuition es la materialización directa de esa tesis.

El trabajo de DeepMind sobre world models tiene un enfoque similar, aunque distinto en motivación. En la cobertura del nuevo equipo de DeepMind para simulación del mundo real, las aplicaciones previstas incluyen exactamente las que de Witte cita: robótica, drones de búsqueda y rescate, entornos donde el error tiene coste físico.

Quién invierte y qué harán con el dinero

La ronda fue liderada por Khosla Ventures y General Catalyst, los mismos inversores del seed. Se suman Jeff Bezos, Eric Schmidt, el piloto de Fórmula 1 Nico Rosberg (con inversiones en tecnología de movilidad), y varios investigadores de Google DeepMind y MIT. La presencia de DeepMind e investigadores del MIT en el cap table sugiere que hay interés genuino en el problema más allá del retorno financiero.

La mayor parte del capital irá a escalar capacidad de cómputo, con un acuerdo de acceso a infraestructura con CoreWeave ya firmado. Una porción está reservada para hacer la API del agente más accesible a desarrolladores externos a finales del verano de 2026. General Intuition está constituida como empresa de beneficio público, lo que le permite explícitamente priorizar misiones sociales (mencionan drones de búsqueda y rescate en entornos sin GPS).

Dreamer 4, un agente de IA de referencia del sector que también aprende a partir de datos de vídeo sin etiquetas de acción, demuestra que hay más de un camino técnico hacia este tipo de inteligencia espacial. La diferencia que reivindica de Witte es el dataset etiquetado, que hace el aprendizaje más preciso.

Mi valoración

Una valoración de 2.300 millones antes de tener ingresos relevantes es una apuesta grande sobre una hipótesis técnica que todavía no ha demostrado la transferencia del mundo virtual al físico a escala. Eso es lo que más me preocupa.

Lo que más me convence es la especificidad de los datos de Medal. Dos mil millones de clips anuales con etiquetas de acción es un activo genuinamente difícil de replicar, especialmente porque el mercado de intercambio de gaming genera esos clips de forma orgánica, sin coste de anotación humana.

Lo más estructuralmente significativo es el momento en que esto emerge. El mercado de world models en 2026 tiene capital de Runway, World Labs, Odyssey (310 millones de Amazon y Nvidia), AMI Labs de Yann LeCun (1.000 millones), y ahora General Intuition. La tesis compartida es que el razonamiento espacial es la capacidad que los LLMs actuales no tienen y que la inteligencia general requiere. Si esa tesis es correcta, quien resuelva el problema de la transferencia virtual-a-real tiene una ventaja enorme. Si no lo es, hay mucho dinero bien gastado en infraestructura de simulación.

La pregunta a 12 meses: ¿abre General Intuition su API antes de final de verano y consigue que terceros construyan productos reales sobre sus agentes? Ese es el test de si la tecnología sale del laboratorio.

Preguntas frecuentes

¿Qué es Medal y cómo se relaciona con General Intuition?

Medal es una plataforma para subir y compartir clips cortos de videojuegos, similar en concepto a TikTok pero exclusiva para gaming. Tiene 10 millones de usuarios activos mensuales y genera 2.000 millones de clips al año. General Intuition fue creada en octubre de 2025 como spin-out de Medal por su fundador, Pim de Witte, para usar ese dataset de juego —que incluye las acciones del jugador, no solo el vídeo— para entrenar agentes de IA con razonamiento espaciotemporal.

¿Cuándo estará disponible el agente de General Intuition para desarrolladores?

La empresa ha confirmado que planea hacer su API más accesible para desarrolladores antes de finales del verano de 2026. Por ahora no hay fecha concreta. La empresa priorizará escalar la capacidad de cómputo con la nueva ronda antes de un lanzamiento amplio.

¿En qué se diferencia General Intuition de otros world models como los de Google DeepMind o World Labs?

La diferencia principal es el activo de datos: General Intuition tiene acceso exclusivo al dataset de Medal con etiquetas de acción (qué botones se pulsaron en cada momento). Eso permite un aprendizaje causal que otros sistemas, que solo tienen vídeo sin acciones, no pueden hacer tan fácilmente. Además, el foco de General Intuition está en vender el agente entrenado (la inteligencia), no el entorno de simulación (el mundo virtual), mientras que otros como World Labs se centran en el entorno como producto principal.