Como modelo de lenguaje entrenado por OpenAI, ChatGPT ha pasado por un proceso de entrenamiento que involucra una amplia gama de recursos y datos que se actualizan y cambian continuamente.
Su conocimiento se basa en una amplia variedad de fuentes, incluyendo sitios web, publicaciones de noticias, libros, artículos de revistas y muchos otros documentos. Algunas de las fuentes generales que se utilizan para el entrenamiento del modelo incluyen Wikipedia, Common Crawl, OpenWebText y BookCorpus. Continúa leyendo «¿Qué es BookCorpus? Una de las fuentes usadas por ChatGPT durante su entrenamiento»
Microsoft y OpenAI se han unido para explorar cómo el modelo de lenguaje ChatGPT puede ser utilizado para controlar robots utilizando lenguaje natural. La idea es hacer que sea más fácil para las personas interactuar con los robots sin necesidad de aprender lenguajes de programación complejos. Continúa leyendo «ChatGPT podrá controlar robots en el futuro. Así lo quiere Microsoft.»
Hace cerca de un año que se lanzó GoButler, un curioso servicio de asistencia virtual que inicialmente era atendido por personas enfocándose en las peticiones de todo tipo de los usuarios finales. A pesar de que a lo largo de todo este tiempo ha pasado a ser una aplicación de búsquedas y descubrimiento de vuelos a modo de agregador automático de datos, parece que la compañía, con sede en Nueva York, quiere tirar hacia otro camino.
En este sentido, acaban de lanzar Angel.ai, con el objetivo de ofrecer su tecnología de procesamiento de lenguaje natural a terceros, según cuentan en TechCrunch. La idea es que las plataformas de comercio interesadas en facilitar que los usuarios puedan realizar sus peticiones en lenguaje natural, puedan realizar las mismas sobre cualquier vía que puedan usar a diario, incluida la vía de los bots en las aplicaciones de mensajería. Continúa leyendo «GoButler lanza Angel.ai, para que plataformas de comercio procesen peticiones en lenguaje natural»
El interés por contar con tecnología de procesamiento de lenguaje natural aumenta cada día más, porque ello permite a las compañías tecnológicas ofrecer a los usuarios tener la posibilidad de que establezcan instrucciones de forma natural que pueden ser entendidas por sus aplicaciones y servicios. Yahoo tampoco se quiere quedar atrás en este nicho, por lo que finalmente se ha lanzado por la adquisición de SkyPhrase, una startup que según algunos medios, estaba desarrollando una tecnología que permite manejar consultas naturales en línea similar a Wolfram Alpha o Siri.
De momento, tan sólo hay un escueto comunicado en el blog de Yahoo Labs, aunque en la página oficial de SkyPhrase muestran su alegría al formar parte de Yahoo Labs al ser una compañía que comparten su visión de que la información y los servicios a través de Internet serían mucho más potente y fácil de usar si la gente pudiera indicar a los ordenadores lo que desean lograr mediante el uso del lenguaje natural, cuya tecnología permitiría a los ordenadores comprender el lenguaje natural humano más complejo y preciso que nunca.
De momento no se ha desvelado oficialmente los detalles del acuerdo, pero el equipo compuesto por cuatro personas formarán parte del equipo de Yahoo Labs en Nueva York. The Verge añade de que la revista Forbes informó el año pasado de que SkyPhrase había conseguido que su tecnología trabajase junto con GMail como con Twitter, permitiendo a los usuarios recibir resultados a medida de que las búsquedas contasen con más variables, búsquedas que para Siri serían complejas de entender. También TechCrunch indicó que había desarrollado dos aplicaciones, una para ver fácilmente estadísticas de fútbol y otra para integrarse con Google Analytics.
En cualquier caso, supone el paso de Yahoo para entrar en el mercado del lenguaje de procesamiento del lenguaje natural, lo que tarde o temprano nos beneficiaremos los propios usuarios de su servicio.
Ya hace semanas que ha comenzado un nuevo curso escolar, y como era de esperar, las nuevas herramientas tecnológicas siguen avanzando para seguir facilitando la comprensión de las materias a los propios estudiantes. La última novedad en este sentido viene de la mano de Wolfram | Alpha, que acaba de anunciar el lanzamiento de su generador de problema, Wolfram Problem Generator (www.wolframalpha.com/problem-generator). Esta nueva herramienta permite a los estudiantes practicar los temas que desean. De esta manera, en lugar de preguntar y recibir la solución de los problemas paso a paso, ahora los estudiantes deberán esforzarse un poco más para encontrar las solucionados practicando los problemas por sí mismos.
Los seis temas principales que dispone son aritmética, teoría de números, álgebra, cálculo, álgebra lineal y estadísticas. En cada uno de estos temas también hay una serie de rangos, destinados desde usuarios desde primaria hasta los estudiantes universitarios.
El generador de problema de Wolfram | Alpha está disponible para los usuarios de la versión de pago, aunque los usuarios pueden registrarse gratuitamente para obtener una versión completa de pruebas durante un periodo de siete días. Precisamente, eso es lo que han hecho los padres de Sally y Jake, ejemplos de dos estudiantes donde el generador de problemas de Wolfram | Alpha les ayuda con los estudios, incluso en el último minuto. En dichos ejemplos dan a entender que los estudiantes podrán tener hasta tres oportunidades para aportar los resultados correctos a los problemas que están practicando, y en caso de fallar, ya Wolfram | Alpha se encargará de ofrecerles las soluciones paso a paso, mejorando así la comprensión. También ofrece cuestionarios con cuatro posibles respuestas, facilitando a los estudiantes poder acertar con las soluciones.
A tener en cuenta que los estudiantes ya no deben preocuparse el modo en el que escriben las sintaxis de los resultados, gracias al sistema de compresión del lenguaje natural de Wolfram | Alpha que analiza las entradas de los propios estudiantes.
Sin duda, una interesante herramienta a tener en cuenta en el ámbito escolar.
Desde Datumbox (datumbox.com) nos presentan este proyecto que puede ayudar a muchos programadores a incluir funcionalidades «inteligentes» en sus aplicaciones, con una API capaz de procesar lenguaje natural, algo que puede ser utilizado en una amplia gama de aplicaciones, incluyendo: Análisis de Sentimiento, clasificación automática de temas, detección de idioma, análisis de subjetividad, detección de spam, evaluación de lectura, extracción de palabras clave, etc.
La API permite, de forma gratuita, acceder a 14 funciones diferentes, con una breve documentación y varios ejemplos de código para ayudar al desarrollo de nuestras aplicaciones.
Nos comentan que puede ser usada para crear aplicaciones que monitoricen contenido en las redes sociales, evaluando de forma automática opiniones de personas, así como en el mundo SEO, identificando y optimizando los términos importantes dentro de los documentos.
Otra función muy común es la que permite evaluar la calidad del contenido generado por usuarios, vital para eliminar el spam, aunque seguramente la eficiencia dependerá mucho del idioma que está siendo utilizado.
Hace poco, en su blog, escribieron un artículo donde muestran el paso a paso para construir una herramienta que analice el sentimiento de textos en Twitter, algo relativamente sencillo en inglés (no tanto en español, un idioma mucho más complejo de analizar de forma automática).
Ramsey Nasser, un científico computacional y miembro del Eyebeam Art + Technology Center de Nueva York, ha creado un lenguaje de programación basado en Scheme (dialecto de Lisp) llamado alb (traducción de «corazón») cuyo código se ingresa y ejecuta en el lenguaje de escritura árabe. La idea de Nasser es comprender las relaciones entre lenguajes naturales y artificiales junto al impacto de la cultura e imaginación del usuario en las ciencias computacionales, por lo que considera que su realización, además de un lenguaje de programación, es también “una pieza de arte conceptual.”
Por supuesto, también busca satisfacer la necesidad de un lenguaje nativo en caracteres no latinos pues si para muchos acá en Occidente es algo frustrante aprender a programar por las palabras en inglés que componen a C++, JavaScript, Python y otros lenguajes populares, más aún puede serlo en países de Oriente donde «en términos prácticos, es más sensato aprender inglés antes de aprender a programar, lo que escandaliza.” Eso afirma Nasser quien como muchos, cree que la computación debe estar al alcance de todos sin limitaciones geográficas o similares. Continúa leyendo «Nace «corazón», un artístico lenguaje de programación árabe»
Hemos visto mejorada la tecnología de búsqueda por voz de Google y hemos visto cómo la ha ido utilizando más gente, y parece que ahora le toca el turno a las mejoras de los resultados de búsquedas con lenguaje natural, que a menudo suelen ser más específicas y detalladas.
Ahora en el buscador veremos cómo Google nos ofrece respuestas inmediatas a preguntas y fórmulas como «cuántos euros son 300 dólares», «120 euros en moneda húngara» (podemos poner este texto sin ni siquiera especificar o conocer el nombre de la moneda a la cual queremos convertir la cantidad), «convertir dólares en Ucrania», etc.