Parece que el ser humano no es extremadamente original cuando usa un buscador. Solo el 15% de las búsquedas realizadas a diario en Google son únicas, el resto ya se han realizado alguna vez en la historia, y aún así este porcentaje genera un buen problema para los bots que quieren «hablar» con los usuarios como si fueran personas reales.
El problema es que ese 15% no significa que se busquen asuntos nuevos y sí que cada uno utiliza unas palabras diferentes para buscar lo mismo, y eso es un dolor de cabeza para los sistemas que intentan entender lo que escribe un ser humano, según leemos en este artículo escrito en venturebeat.com.
Muchos programas usan NPL (natural language processing) para poder comunicarse de forma más natural con los usuarios, y los especialistas en el tema saben que a menudo, cuando hay un bot escuchando, se envían las solicitaciones realizadas a un equipo de personas debido a que el bot en cuestión no ha sabido interpretarla. El ser humano no es muy estructurado, y las faltas de ortografía y errores gramaticales abundan en todos los países, por lo que es difícil, para un software, entender algo que no ha sido escrito «correctamente».
Este desafío es uno de los grandes enemigos del NPL, y así lo comenta el creador de Talla, un asistente de tareas integrado en slack que ha estado analizando las peticiones de los humanos desde hace tiempo: enseñar a un robot es sencillo, pero con un 15% de novedades cada día, parece que el tiempo de aprendizaje no acabará nunca.