Internet Archive Switzerland ha nacido este mayo de 2026 con una misión que va mucho más allá de guardar copias de páginas web. Lo cuenta Alvy en Microsiervos el 8 de mayo, citando la entrada del blog del Internet Archive original del 6 de mayo: la nueva fundación sin ánimo de lucro con sede en Suiza no quiere ser simplemente otro espejo del archivo fundado por Brewster Kahle en 1996. Su proyecto más ambicioso es archivar sistemáticamente los modelos de inteligencia artificial generativa actuales y futuros antes de que muten, sean retirados o desaparezcan sin dejar rastro reproducible.
Es una de esas iniciativas que cobra su verdadero peso cuando te paras a pensar en la magnitud del problema: los modelos de IA de 2024 probablemente ya no existen en su forma original. ¿Alguien los guardó? La respuesta, hasta ahora, es que no.
Qué es Internet Archive Switzerland y por qué importa que esté en Suiza
Internet Archive Switzerland (internetarchive.ch) es una fundación sin ánimo de lucro alineada con el Archivo de Internet original, fundado en San Francisco en 1996 por Brewster Kahle con el objetivo de proporcionar acceso universal al conocimiento. Desde entonces, el archivo ha acumulado más de 866 mil millones de capturas de páginas web, 10,6 millones de vídeos, 4,8 millones de imágenes y más de 44 millones de libros digitalizados.
La iniciativa suiza no actúa en solitario: se suma a redes similares en Canadá y en Europa, con la idea de distribuir geográficamente las copias de seguridad de internet para reducir el riesgo de pérdida ante catástrofes, censura o colapso institucional. La elección de Suiza no es accidental: el proyecto apela expresamente a la «neutralidad y estabilidad legal suiza» para alojar materiales que en otras jurisdicciones podrían enfrentar restricciones. En un contexto geopolítico en el que la censura de contenidos digitales se ha acelerado desde 2022, eso tiene peso real.
Conviene recordar aquí el acuerdo entre Google y la Wayback Machine para mostrar versiones archivadas en los resultados de búsqueda: ese paso, anunciado en 2024, reconocía que la web se borra más rápido de lo que se archiva. Internet Archive Switzerland es otra respuesta al mismo problema, con jurisdicción diferente y ambición mayor.
El Gen AI Archive: archivar cómo pensaban las IAs de 2025
El proyecto más llamativo de la fundación suiza es el Gen AI Archive (Archivo de IA Generativa), desarrollado junto con la Universidad de St. Gallen. La idea: archivar todas las versiones de todos los modelos de inteligencia artificial actuales y futuros de forma sistemática.
La motivación es precisa y está bien argumentada. Los modelos de IA se entrenan, actualizan y retiran continuamente sin dejar apenas rastro público de cómo funcionaban o qué comportamiento tenían. GPT-3, Bard en su versión original, los primeros modelos de imagen de 2022: buena parte de esos sistemas ya no son reproducibles ni auditables. Alguien que en 2030 quiera estudiar el comportamiento de los modelos de 2024 va a tener muy poco material con el que trabajar.
El Gen AI Archive quiere solucionar eso. La pregunta es si llegará a tiempo para los modelos actuales, antes de que sus versiones de 2025 y 2026 queden ya obsoletas y sean retiradas.
Para quien siga la historia del Internet Archive, la fragilidad que demostró durante el ataque DDoS de 2024 —que afectó el acceso a sus servicios durante varios días— es un recordatorio de que incluso los archivos más robustos tienen puntos débiles. Distribuir geográficamente los datos es exactamente la respuesta correcta.
Archivos en Peligro y el problema del patrimonio digital amenazado
Además del Gen AI Archive, Internet Archive Switzerland lanza Endangered Archives (Archivos en Peligro), una iniciativa para rescatar colecciones digitales amenazadas por guerras, catástrofes naturales, censura institucional o simple colapso de los sistemas que las albergan.
Esto no es nuevo como concepto, pero sí como escala. La idea de que el archivo digital puede perderse tan fácilmente como el analógico es algo que no todo el mundo interioriza. La web es más frágil de lo que parece: los enlaces mueren, las plataformas cierran, los gobiernos modifican o eliminan contenidos. Ese fenómeno tiene nombre técnico —link rot— y sus consecuencias son medibles.
En este punto encaja la historia de la alianza entre Cloudflare e Internet Archive para mantener activos sitios web caídos temporalmente: fue un primer reconocimiento institucional, en 2020, de que la infraestructura de la web necesita redundancia activa, no solo archivos pasivos. Internet Archive Switzerland añade otra capa a esa redundancia, con jurisdicción neutral.
Mi valoración
Llevo siguiendo el Internet Archive desde los tiempos en que guardar una URL en Wayback Machine era algo que hacías manualmente, convencido de que esa página iba a desaparecer pronto. El salto de los primeros cientos de miles de millones de capturas a los más de 866 mil millones actuales da una idea del volumen de trabajo acumulado. Y aún así, la web se borra más rápido de lo que se archiva.
Lo que más me convence del proyecto suizo es precisamente el ángulo del Gen AI Archive. Es una idea que debería haber surgido antes, y el hecho de que sea una institución académica —la Universidad de St. Gallen— la que impulse la iniciativa da garantías de rigor metodológico que un proyecto puramente privado no daría.
Lo que más me preocupa es la escala del reto técnico. Archivar modelos de lenguaje grandes supone guardar ficheros de decenas o cientos de gigabytes, más todo el contexto de entrenamiento, las evaluaciones y el comportamiento documentado. Para modelos propietarios —GPT-4, Claude, Gemini— ni siquiera está claro que sus creadores vayan a facilitar ese acceso voluntariamente. El Gen AI Archive puede quedarse con los modelos de código abierto y poco más.
Lo más estructuralmente significativo es que esta iniciativa plantea por primera vez la pregunta de quién tiene responsabilidad sobre la preservación de los sistemas de IA. Los fabricantes los retiran cuando les conviene. Los reguladores no tienen mandato claro. Y los usuarios que dependieron de una versión específica de un modelo para sus investigaciones o sus flujos de trabajo no tienen ningún recurso. Internet Archive Switzerland intenta llenar ese vacío.
Mi predicción: en los próximos doce meses veremos al menos otra fundación similar en Asia. El problema de la preservación de modelos de IA es demasiado evidente para que solo una institución lo aborde.
Preguntas frecuentes
¿Qué es Internet Archive Switzerland y en qué se diferencia del Internet Archive original?
Internet Archive Switzerland (internetarchive.ch) es una fundación sin ánimo de lucro lanzada en mayo de 2026 con sede en Suiza. Su misión general es similar al Internet Archive original —preservar el conocimiento humano en formato digital— pero añade dos proyectos propios: el Gen AI Archive para documentar sistemáticamente modelos de IA generativa, y Endangered Archives para rescatar colecciones digitales amenazadas por guerras, censura o colapso institucional. La diferencia clave es la jurisdicción: Suiza ofrece neutralidad legal que puede facilitar la conservación de materiales que en otras jurisdicciones enfrentarían restricciones.
¿Por qué es importante archivar modelos de inteligencia artificial?
Los modelos de IA se actualizan y retiran continuamente sin que quede registro público de cómo funcionaban. Sin un archivo sistemático, es imposible auditar el comportamiento histórico de esos sistemas, reproducir experimentos realizados con versiones anteriores o estudiar su evolución. El Gen AI Archive, desarrollado junto a la Universidad de St. Gallen, pretende resolver ese vacío de forma proactiva antes de que más modelos de 2024 y 2025 desaparezcan sin rastro.
¿Cómo puedo acceder al archivo de páginas web históricas de Internet?
El recurso más accesible es la Wayback Machine (web.archive.org), que lleva capturando páginas desde 1995 y acumula más de 866 mil millones de capturas. Desde 2024, Google integra también enlaces a la Wayback Machine en sus resultados de búsqueda para acceder a versiones archivadas de páginas que han cambiado o desaparecido.
