Sobre lo que Google Bard puede hacer y sobre lo que no

Google lanzó ayer su chatbot, Bard, para ofrecer una experiencia novedosa a los usuarios en Estados Unidos y Reino Unido, quienes ya pueden probarlo apuntándose a la lista de espera.

Esta tecnología experimental compite con otras similares, como ChatGPT pero se distingue por ser un servicio independiente del motor de búsqueda de Google y otros productos de la empresa.

Bard se basa en un modelo de lenguaje amplio, LLM por sus siglas en inglés, que aprende a través del análisis de grandes cantidades de datos de Internet. Al igual que ChatGPT, esta tecnología a menudo comete errores y puede inventar información.

A continuación, se detallan algunos aspectos importantes de este nuevo chatbot de Google:

Limitaciones y retroalimentación

Bard reconoce sus limitaciones desde el principio, y lo hace saber a los usuarios:

Soy Bard, tu colaborador creativo y útil. Tengo limitaciones y no siempre acierto, pero tu retroalimentación me ayudará a mejorar

Esta sinceridad es una forma de crear confianza con los usuarios.

El chatbot sugiere algunas promociones para comenzar, incluyendo «Explica por qué los modelos de lenguaje amplio a veces cometen errores«. Esta función demuestra la intención de Google de no ocultar las fallas de su tecnología.

Uso casual y generación de contenido

Bard no se concibió como un motor de búsqueda, sino como una herramienta experimental que muestra a los usuarios la variedad de usos que se le puede dar a un chatbot de este tipo. Por eso, puede generar ideas, escribir publicaciones en blogs y responder preguntas con hechos u opiniones.

Cuando se le preguntó: «¿Cuál es el momento más importante en la historia de Estados Unidos?«, Bard respondió que esto era una cuestión de opinión, pero mencionó la Revolución Americana, la Guerra Civil y la Gran Depresión, entre otros eventos importantes. Esta capacidad para proporcionar múltiples respuestas distintas cada vez es una función interesante que podría hacer que los usuarios se sientan más comprometidos con el chatbot.

Anotación y fuentes

Al igual que Bing chatbot y otras tecnologías similares, Bard a veces anota sus respuestas para que los usuarios puedan revisar sus fuentes. Además, se integra con el vasto índice de sitios web de Google para que sus respuestas puedan incluir la información más reciente publicada en Internet. Sin embargo, esta función no siempre conduce a fuentes confiables. Por ejemplo, cuando Bard escribió que el momento más importante de la historia de Estados Unidos fue la Revolución Americana, citó un blog en inglés y chino con gatos animados.

Cuando se le preguntó por qué había citado esa fuente en particular, el chatbot insistió en que había citado Wikipedia. Bard es más cauteloso que ChatGPT en algunos aspectos. Por ejemplo, cuando se le preguntó acerca de la relación entre dos personas, Bard a veces se negaba a responder por falta de información suficiente. Google quiere evitar el fenómeno de «alucinación» de la inteligencia artificial, en el que el chatbot genera información incorrecta sobre personas específicas.

Comparación entre Bard, ChatGPT y Claude

Este artículo de TechCrunch se centra en una comparación de tres modelos de lenguaje: Bard (creado por Google), GPT-4 y Claude. Se realizó una evaluación comparativa de las capacidades de los tres modelos en la comprensión y respuesta a preguntas específicas y se encontró que Bard estaba por detrás de los otros dos modelos en términos de precisión y velocidad de respuesta.

El artículo también señala que aunque los tres modelos tienen sus fortalezas y debilidades, GPT-4 demostró ser el modelo más avanzado y preciso en general. Claude también tuvo buenos resultados en la comparación y se consideró una opción viable para aquellos que buscan un modelo de lenguaje más sencillo.

Se señala que Bard tiene algunas ventajas, como su capacidad para procesar grandes cantidades de información y su capacidad para trabajar con múltiples idiomas. Sin embargo, también se destacan sus debilidades, como su falta de precisión en la comprensión de preguntas complejas y su tendencia a ofrecer respuestas vagas.

Ejemplos que se compararon: Se les pidió que resumieran la trama de la novela «Cumbres Borrascosas» y cómo se hace cumplir el GDPR en Europa. Bard cometió un error al hablar del papel de la Comisión Europea en la aplicación del GDPR. Claude y GPT-4 dieron respuestas más precisas. Claude también dio una respuesta precisa sobre la trama de «Cumbres Borrascosas», mientras que Bard y GPT-4 dieron respuestas más generales. En general, GPT-4 tuvo las respuestas más precisas y completas de los tres modelos.

Como veis, son primeras pinceladas, pero está claro que no hay intención de sustituir a Google como buscador, nunca ha sido esa la idea.