En WWWhatsnew.com hemos tenido la oportunidad de entrevistar a Joaquín Cuenca, CEO de Freepik, para analizar el impacto de DeepSeek en el panorama actual de la inteligencia artificial. Durante la conversación, Cuenca compartió sus reflexiones sobre este innovador avance que está cambiando las reglas del juego en la industria de la IA.
Una reducción drástica en los costos de creación de modelos
Una de las principales novedades que plantea DeepSeek es su capacidad para reducir los costos de entrenamiento de modelos de inteligencia artificial. Cuenca señaló que, mientras que anteriormente el desarrollo de un modelo avanzado podía costar alrededor de 150 millones de dólares, con DeepSeek el costo se reduce a tan solo 5 millones. “Esto evidentemente es un gran avance en la optimización de modelos”, afirmó.
Cuando se le preguntó cómo habían logrado esta optimización, Cuenca destacó la aplicación de soluciones técnicas novedosas, basadas tanto en técnicas de compresión como en optimización de entrenamiento.
Estas innovaciones, aunque podrían parecer lógicas, demuestran la importancia de integrar técnicas avanzadas de manera efectiva. “Hay que quitarse el sombrero ante este logro”, subrayó Cuenca.
Simplicidad como clave del éxito
Otro aspecto que destacó el CEO de Freepik es la simplicidad del modelo de razonamiento de DeepSeek. A diferencia de otros sistemas que iteran múltiples veces para encontrar la respuesta óptima, el enfoque de DeepSeek es directo y minimalista, lo que lo hace más eficiente y adaptable. “Esto es espectacular porque se puede aplicar sobre cualquier modelo de base, no solo sobre el que ellos han desarrollado”, comentó Cuenca.
¿Un impacto en la carrera hacia la inteligencia artificial general?
Al ser consultado sobre el impacto de DeepSeek en proyectos como Stargate, que buscan alcanzar la inteligencia artificial general, Cuenca opinó que este tipo de avances no detendrá la inversión en grandes infraestructuras, pero que sí representa un paso importante hacia una IA más eficiente. “Esto demuestra que cualquier mejora que se haga en la optimización de recursos puede ser aplicada y escalada para mejorar los modelos actuales”, afirmó.
Sin embargo, también aclaró que mientras siga siendo posible escalar modelos y obtener mejores resultados, las grandes inversiones continuarán. “Cuando lleguemos a un punto en el que aumentar la capacidad no genere mejoras significativas, entonces tendremos que buscar otros caminos”, agregó.
Beneficios para empresas de capa de aplicación
Cuenca también compartió su perspectiva sobre cómo este avance podría beneficiar a empresas como Freepik, que trabajan en la llamada “capa de aplicación”. Según él, mientras que las empresas que desarrollan modelos enfrentan una competencia feroz, las empresas que crean aplicaciones basadas en estos modelos están en una posición privilegiada.
“Para nosotros, cada vez hay más modelos disponibles y de mayor calidad. Esto significa que podemos ofrecer mejores servicios a nuestros usuarios sin aumentar los costos”, explicó. Además, comparó la situación con la industria de los ordenadores: “Si los modelos son como las CPUs, nosotros somos como Microsoft o Apple. Usamos esos modelos para crear productos accesibles y valiosos para los usuarios”.
La reducción de costos y sus implicaciones
DeepSeek también promete reducir los costos de las APIs, algo que podría beneficiar directamente a las empresas. Cuenca explicó que esto podría traducirse en:
- Menores costos para las empresas: Esto podría significar mayores márgenes o la posibilidad de ofrecer más servicios al mismo precio.
- Mayor variedad de opciones: Con modelos más accesibles, las empresas pueden elegir las soluciones que mejor se adapten a sus necesidades.
- Beneficio para los usuarios: Al final, la competencia empuja a que las mejoras se traduzcan en un mejor servicio para los consumidores.
Desafíos en el horizonte
A pesar de sus ventajas, DeepSeek también enfrenta ciertos límites. Cuenca mencionó que, aunque los costos de entrenamiento se han reducido, el costo de inferencia sigue siendo similar al de otros modelos avanzados como GPT-4. Esto significa que el verdadero impacto de estas técnicas se verá en cómo evolucionan los costos de implementación en el tiempo.
Desde WWWhatsnew.com seguiremos atentos a los avances en este apasionante campo.