Wikilinks Corpus – conjunto de datos para facilitar el entendimiento del lenguaje humano por parte de sistemas informáticos

Wikilinks Corpus

Los seres humanos atribuimos los significados correspondientes a las palabras según el contexto donde las encontremos. Y es que una misma palabra puede tener distintos significados, ya que por ejemplo, mañana puede ser una fase del día o referirse al día siguiente. Las atribuciones las aprendemos a través de años de aprendizaje mediante las interacciones sociales, lo que no nos supondrá dificultad alguna. Pero la “desambigüedación” no es un elemento fuerte de los sistemas informáticos, para lo cual requerirán ayuda.

Es por ello por lo que desde el blog de investigación de Google anuncian el lanzamiento de Wikilinks Corpus, que básicamente es un conjunto de datos conformado por 40 millones de enlaces individuales de sitios web referidos por artículos de wikipedia bajo el nombre de menciones. La idea está en el análisis del contexto de cada mención junto con los contenidos del artículo correspondiente para que los ingenieros puedan determinar con mayor precisión el significado de las palabras ambiguas, con el objeto de facilitar a los sistemas informáticos entender en lenguaje de las personas.

Wikilinks Corpus ha contado con la colaboración de Sameer Singh y Andrew McCallum, pertenecientes a la Universidad de Massachusetts, y ofrece un directorio de enlaces a sitios web, en lugar de los contenidos por temas de copyright, así como las herramientas para la creación de conjunto de datos.

Más información: Blog de investigación de Google | Vía: The Verge

Fco. José Hidalgo

Conocido como Cyberfrancis, con titulación de F.P. 2 de Imagen y Sonido por el I.P.F.P. Jesús Marín de Málaga, es entusiasta de los medios audiovisuales, de la creación gráfica y de internet en general.Desempeñó labores de moderación de la comunidad Distrito Internautas durante 3 años, escribió para WSL durante 4 años y actualmente colabora en Wwwhat´s New. Además, compagina su colaboración con la inclusión de los temas de social media. Podéis leer aquí sus artículos en wwwhatsnew.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos necesarios están marcados *

Puedes usar las siguientes etiquetas y atributos HTML: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>