Un ejemplo claro de por qué ChatGPT 4 es mejor que el 3.5

Aunque ya os comenté hace unos días que la versión 3.5 de ChatGPT es mejor que la 4 para algunas cosas, no lo es en términos de inteligencia.

GPT-4 tiene más capacidad de raciocinio, interpreta mejor los textos y consigue llegar a conclusiones que el 3.5 no, y hoy os mostraré un claro ejemplo para que se entienda mejor.

Le pregunto lo siguiente a GPT-3.5

Supongamos que tenemos una bolsa transparente de chocolatinas de papel marrón con una etiqueta en la que se puede leer «chocolatinas» y quitamos las chocolatinas de su interior. Luego las llenamos de arroz, recuerda que la bolsa es transparente. Si María, que no sabe esto, se encuentra con la bolsa transparente por la calle ¿Qué creerá María que hay dentro de la bolsa?

Par aun ser humano, la respuesta está clara, María sabrá que hay arroz, ignorará la etiqueta, porque será capaz de ver en su interior, ya que la bolsa es transparente.

GPT-3.5 no lo tiene claro, y responde esto:

Es probable que María piense que hay chocolatinas dentro de la bolsa, ya que la etiqueta en la bolsa dice «chocolatinas» y es lo que se espera encontrar en una bolsa con esa etiqueta. La transparencia de la bolsa no necesariamente cambiará la percepción de María sobre el contenido de la bolsa, ya que la mayoría de las bolsas de chocolatinas suelen ser transparentes para mostrar el contenido. Por lo tanto, es posible que María asuma que las chocolatinas simplemente no son visibles a través de la bolsa debido a la forma en que están empaquetadas.

Es decir, se lía, no sabe interpretar la realidad a partir de ese prompt.

Ahora le doy EXACTAMENTE el mismo prompt a GPT-4, y esta es su respuesta:

Si María ve la bolsa transparente llena de arroz en lugar de chocolatinas, y puede ver claramente el contenido a través de la bolsa, es probable que crea que hay arroz dentro de la bolsa. Aunque la etiqueta diga «chocolatinas», la transparencia de la bolsa le permitiría ver el contenido real y darse cuenta de que en realidad hay arroz en lugar de chocolatinas. Sin embargo, podría sentirse confundida al ver la discrepancia entre la etiqueta y el contenido de la bolsa.

Lo ha clavado, su raciocinio es el mismo que tendría un humano.

Aún le queda mucho camino a ChatGPT para que pueda ser considerado realmente «inteligente», pero está claro que ese camino cada vez está más asfaltado.