DeepSeek presenta mHC: la ingeniería (y la matemática) para entrenar LLM con menos fricción
Cuando hablamos de modelos de lenguaje cada vez más capaces, casi siempre miramos el resultado final: un chatbot que razona mejor, un generador de código más fino, un asistente que entiende contexto largo. DeepSeek ha puesto el foco en otra parte del iceberg: el proceso de entrenamiento. Su propuesta, mHC (siglas de Manifold-Constrained Hyper-Connections), se… <a href="https://wwwhatsnew.com/2026/01/05/deepseek-presenta-mhc-la-ingenieria-y-la-matematica-para-entrenar-llm-con-menos-friccion/">Continúa leyendo »</a>