Modelos de aprendizaje automático no están listos para uso clínico en diagnósticos de COVID-19, según estudio

El aprendizaje automático, dentro del espectro de la inteligencia artificial, se perfila como una herramienta clave para el desarrollo de la tecnología asociada a la medicina. El manejo de grandes volúmenes de datos podría favorecer la emisión de diagnósticos más precisos, en base a los antecedentes recabados desde el historial de otros casos archivados.

Durante la pandemia de COVID-19, muchas iniciativas tecnológicas que se valen de este mecanismo han surgido con el propósito de colaborar en su combate. No obstante, de acuerdo a un estudio realizado recientemente, estas tecnologías no han estado a la altura de los requerimientos clínicos bajo los que se deben atender casos de esta envergadura.

Aprendizaje automático para combatir el COVID-19, bajo la lupa

Centenares de modelos de aprendizaje automático COVID-19 presentados en artículos científicos durante 2020, fueron sometidos a un estudio dirigido por investigadores de la Universidad de Cambridge. De acuerdo a sus conclusiones, ninguno de ellos cumplió con los los requerimientos para detectar o diagnosticar eficientemente casos de contagio, influyendo en esto la presencia de errores en la metodología, muestras de datos mal elaboradas, sesgos y falta de reproducibilidad.

Todos estos modelos de aprendizaje automático, originalmente presentados como soluciones para el diagnóstico de casos de contagio o para la elaboración de pronósticos, fueron sujetos a una revisión minuciosa a través de sus respectivos manuscritos científicos, publicados entre el 1 de enero y el 3 de octubre de 2020. Algunos de los modelos que componen esta muestra aseguraban poder trabajar a partir de radiografías torácicas e imágenes de tomografía computarizada. En lo formal, muy pocos documentos habían sido sometidos a un proceso de revisión por otros profesionales, de acuerdo a lo reportado por el estudio.

Concretamente, sólo 62 estudios fueron validados a través de algún sistema de revisión, pero ninguno alcanzó potencial de uso clínico. Esta muestra se obtuvo después de la aplicación de filtros de calidad sobre 415 estudios preseleccionados, entre 2.212 identificados inicialmente.

Una tecnología con futuro en la medicina

Los investigadores concluyeron que el aprendizaje automático tiene el potencial para convertirse en una herramienta poderosa para combatir la pandemia. A la fecha hay avances, pero a causa de los problemas detectados, precisan que aún falta recorrer camino para obtener una herramienta confiable bajo un criterio clínico.

Entre las principales debilidades que se pueden atacar hoy, el equipo de Cambridge encendió sus alarmas contra el uso ingenuo de conjuntos de datos públicos, que puede derivar en un riesgo significativo de sesgo en los análisis. Bajo ese mismo punto, enfatizan también que la muestra de datos debe ser diversa y lo suficientemente amplia , contemplando conjuntos de datos externos independientes, con el fin de que el modelo sea útil para diferentes grupos demográficos.

La emergencia inherente a esta pandemia motivó el surgimiento de “soluciones rápidas”. No obstante, en aspectos tan delicados como el trabajo científico y clínico, no pueden quedar al azar aspectos como la meticulosidad empleada al momento de recabar información y la imparcialidad bajo la que se deben plantear iniciativas que tienen la vocación de ser de carácter universal.

Y aunque las muestras de datos de calidad forman parte de los pilares de una fórmula exitosa, los informes que testifiquen estos eventuales progresos deben contener la documentación suficiente para ser reproducibles y contar con validación externa. Sólo de esta forma, de acuerdo a lo planteado por el grupo de investigación, se podrán llevar adelante ensayos clínicos con modelos que garanticen rentabilidad, factibilidad técnica y por supuesto, la necesaria validez clínica.