Google mejora las búsquedas de definiciones de las palabras

Búsquedas

Google sigue simplificando la forma en la que accedemos a la información, y en este sentido anuncia el lanzamiento de «una nueva y totalmente rediseñada función de las Búsquedas de Google» para obtener más que unas simples definiciones de palabras. Teniendo en cuenta, según su comunicado, que en el español existen más de 150.000 palabras, lo que hace inviable conocerlas todas, sobre todo, sus significados o los distintos sinónimos a los que se les puede aplicar, gracias a los diccionarios ví­a web, podemos realizar consultas acerca de esas palabras que conocemos poco o deseamos obtener más información.

Para ello tenemos dos ví­as, bien introduciendo los textos de las palabras previamente indicando «definición de», «definir» o «define» o bien usando comandos de voz, donde tan sólo tenemos que presionar el icono del micrófono y pedirle a Google que nos defina una palabra, obteniendo la respuesta tanto de forma escrita como a través de una voz. En este caso, esta ví­a es útil, sobre todo, si la palabra es larga o compleja de escribir.

El comunicado finaliza que esta función está disponible sólo si tenemos configurado el idioma en español en nuestra cuenta de Google, siendo el español la opción predeterminada para los dominios de Google en español, como google.com.ar, google.com.mx, google.com.co, google.es, etc.

Así­ que si tenemos dudas con alguna palabra, ahora podemos conocer mucho más de ella de forma sencilla y fácil, una ayuda que nos brinda Google para mejorar el acceso a la información que necesitamos.

Wikilinks Corpus – conjunto de datos para facilitar el entendimiento del lenguaje humano por parte de sistemas informáticos

Wikilinks Corpus

Los seres humanos atribuimos los significados correspondientes a las palabras según el contexto donde las encontremos. Y es que una misma palabra puede tener distintos significados, ya que por ejemplo, mañana puede ser una fase del dí­a o referirse al dí­a siguiente. Las atribuciones las aprendemos a través de años de aprendizaje mediante las interacciones sociales, lo que no nos supondrá dificultad alguna. Pero la «desambiguedación» no es un elemento fuerte de los sistemas informáticos, para lo cual requerirán ayuda.

Es por ello por lo que desde el blog de investigación de Google anuncian el lanzamiento de Wikilinks Corpus, que básicamente es un conjunto de datos conformado por 40 millones de enlaces individuales de sitios web referidos por artí­culos de wikipedia bajo el nombre de menciones. La idea está en el análisis del contexto de cada mención junto con los contenidos del artí­culo correspondiente para que los ingenieros puedan determinar con mayor precisión el significado de las palabras ambiguas, con el objeto de facilitar a los sistemas informáticos entender en lenguaje de las personas.

Wikilinks Corpus ha contado con la colaboración de Sameer Singh y Andrew McCallum, pertenecientes a la Universidad de Massachusetts, y ofrece un directorio de enlaces a sitios web, en lugar de los contenidos por temas de copyright, así­ como las herramientas para la creación de conjunto de datos.

Más información: Blog de investigación de Google | Ví­a: The Verge