Por qué las startups de IA están tomando el control directo de sus datos

Durante mucho tiempo, entrenar modelos de inteligencia artificial implicaba recolectar grandes volúmenes de datos desde internet o mediante plataformas de microtareas mal remuneradas. Pero este enfoque está cambiando rápidamente. Un número creciente de startups de IA está invirtiendo en la generación y curación manual de datos propios, entendiendo que la calidad de estos insumos es determinante para lograr modelos más precisos, fiables y competitivos.

Un ejemplo claro es Turing, una empresa centrada en modelos de visión artificial. Su estrategia pasa por recolectar vídeos directamente de personas realizando tareas cotidianas y oficios manuales. En lugar de depender de registros ya existentes, Turing contrata a personas como artistas, cocineros o electricistas para grabarse usando cámaras GoPro durante varias horas al día mientras trabajan. Esta metodología, aunque intensiva y costosa, les permite obtener datos con una riqueza y variedad que sería muy difícil de replicar con enfoques tradicionales. Continúa leyendo «Por qué las startups de IA están tomando el control directo de sus datos»

Reddit demanda a Anthropic por uso indebido de datos: la privacidad de los usuarios en juego

La reciente demanda de Reddit contra Anthropic marca un nuevo capítulo en la batalla por el control y uso ético de los datos en la era de la inteligencia artificial. Esta disputa legal pone sobre la mesa un tema crucial: la privacidad y el consentimiento de los usuarios en plataformas abiertas frente al uso comercial de contenido generado por la comunidad. Continúa leyendo «Reddit demanda a Anthropic por uso indebido de datos: la privacidad de los usuarios en juego»

¿Memoria o plagio? El debate sobre el uso de contenido con derechos en los modelos de IA

En el corazón de una revolución tecnológica sin precedentes, los modelos de inteligencia artificial como GPT-4 parecen estar aprendiendo más de lo que deberían. Una reciente investigación sugiere que, al entrenar estos sistemas, algunas empresas —incluida OpenAI— podrían haber incluido obras protegidas por derechos de autor sin el consentimiento de sus autores. Pero, ¿qué significa esto realmente? ¿Las máquinas están plagiando, memorizando o simplemente «aprendiendo»?

Continúa leyendo «¿Memoria o plagio? El debate sobre el uso de contenido con derechos en los modelos de IA»

Meta bajo fuego: Acusada de usar libros pirateados para entrenar su IA

El entrenamiento de modelos de inteligencia artificial ha sido un tema candente en los últimos años, especialmente cuando se trata de los datos utilizados para alimentar estos sistemas. Ahora, Meta está en el centro de una nueva controversia, ya que una demanda reciente sugiere que la compañía utilizó libros pirateados para entrenar sus modelos de IA.

Continúa leyendo «Meta bajo fuego: Acusada de usar libros pirateados para entrenar su IA»

DisTrO: la nueva tecnología que promete revolucionar el entrenamiento de modelos de IA

Nous Research, una pequeña pero innovadora empresa dedicada a desarrollar modelos de inteligencia artificial personalizados y abiertos, ha sorprendido al mundo con su último avance: DisTrO (Distributed Training Over-the-Internet). Esta herramienta promete cambiar las reglas del juego en el entrenamiento de modelos de IA, haciéndolo hasta 10,000 veces más eficiente y accesible para investigadores y desarrolladores de todo el mundo. En este artículo de WWWhatsnew.com te contamos por qué esta tecnología puede cambiarlo todo.

Continúa leyendo «DisTrO: la nueva tecnología que promete revolucionar el entrenamiento de modelos de IA»