Cómo entrenar tu primer modelo de Inteligencia Artificial con Vertex AI y AutoML de Google

Publicado el

aprender IA

Hoy en día es fundamental tener conocimientos básicos de inteligencia artificial y aprendizaje automático, ya que la capacidad de crear modelos predictivos avanzados está al alcance de más organizaciones que nunca.

Durante los próximos meses hablaré bastante sobre cómo crear modelos y cómo usar cada herramienta, pero hoy me centraré en AutoML de Google, una plataforma intuitiva diseñada para automatizar el proceso de desarrollo de modelos de machine learning.

En este artículo, nos adentraremos en cómo entrenar un modelo de clasificación binaria utilizando AutoML de Google, específicamente aplicado al sector bancario para predecir la probabilidad de que un cliente adquiera un depósito a largo plazo. Desde la configuración inicial del proyecto en Google Cloud hasta la obtención y preparación de datos, análisis, entrenamiento y evaluación del modelo, exploraremos cada paso detallado de este proceso.

Usando IA desde Google Cloud

Será necesario crear una cuenta en Google Cloud y crear un proyecto nuevo, algo que podéis hacer directamente desde cloud.google.com

1. Configuración del Proyecto en Google Cloud

  • Crear un Proyecto Nuevo: Es fundamental tener un proyecto en Google Cloud para organizar y manejar todos los recursos. Puedes optar por crear un proyecto nuevo o seleccionar uno existente.
  • Actualizar tu Prueba Gratuita: Si has agotado los créditos de tu prueba gratuita en Google Cloud, debes activar una cuenta completa para continuar utilizando los servicios.

2. Configuración de Vertex AI

  • Activación de Vertex AI API: Antes de comenzar con AutoML, es necesario habilitar la API de Vertex AI en tu proyecto de Google Cloud. A medida que avancemos en los tutoriales, veréis que será necesario ir activando las diferentes APIs. Esta activación se hace directamente desde nuestro panel de control.

3. Creación de un Conjunto de Datos

Entrenando un modelo de IA

En el menú lateral hay una infinidad de cosas que podemos hacer. En este caso nos centraremos en Vertex AI

  • Tipo de Datos y Objetivo: En Vertex AI, debes seleccionar el tipo de datos y el objetivo. En este caso, serán datos tabulares con el objetivo de Regresión/Clasificación.
  • Paso a Paso para Crear el Conjunto de Datos: Selecciona el botón «Crear». Ingresa un nombre para tu conjunto de datos. Elige la pestaña «Tabular». Selecciona «Regresión/Clasificación» como objetivo. Mantén la región por defecto y crea el conjunto.

Entrenando un modelo de IA

Crear el conjunto de datos es la tarea más importante, pero usaremos uno ya creado por Google para pruebas

 

Entrenando un modelo de IA

Podemos elegir dos objetivos diferentes, uno de regresión y otro de Previsión

 

 

 

4. Obtención de Datos

 

Entrenando un modelo de IA

Aquí podemos subir nuestros propios datos o seleccionar el ejemplo de Google con datos bancarios

  • Uso de Datos Bancarios Públicos: Utilizarás un conjunto de datos bancarios de dominio público alojado en Cloud Storage, aunque también podéis crear un archivo vosotros mismos, o importar vuestra popria colección en un csv.
  • Importación de Datos: Selecciona archivos CSV desde Cloud Storage. Ingresa la ruta del archivo: cloud-ml-tables-data/bank-marketing.csv.

5. Análisis del Conjunto de Datos

Entrenando un modelo de IA

Antes de entrenar el modelo, podemos analizar nuestros datos y hacer generar estadísticas con ellos

  • Revisión y Limpieza: Aunque el conjunto de datos ya está preparado para AutoML, es esencial revisar si hay valores faltantes o NULL.
  • Generación de Estadísticas: Opcionalmente, puedes generar estadísticas para comprender mejor el conjunto de datos.

Entrenando un modelo de IA

Es posible ver los valores distintos de cada campo

 

Entrenando un modelo de IA

Al pulsar en cada columna, veremos los valores existentes

 

 

6. Entrenamiento de un Nuevo Modelo

 

Entrenando un modelo de IA

Ahora toca entrenar, por lo que seleccionamos el objetivo de clasificación

 

Entrenando un modelo de IA

Este paso es importante, ya que tendremos que definir la columna objetivo

 

  • Configuración del Modelo: En Objetivo, selecciona «Clasificación». Elige AutoML como método de entrenamiento. Ingresa un nombre para el modelo. En la columna objetivo, selecciona «Deposit» para predecir si un cliente comprará un depósito a plazo fijo.
  • Proceso de Entrenamiento: Configura las opciones de entrenamiento y procesamiento según tus necesidades. Establece un presupuesto para el entrenamiento. Inicia el entrenamiento del modelo.

Entrenando un modelo de IA

 

Aquí nos indica cuál es la columna objetivo

7. Próximos Pasos

  • Evaluación y Despliegue del Modelo: Una vez finalizado el entrenamiento, que podría tardar una hora o más, se te notificará por correo electrónico. Luego, podrás evaluar y desplegar el modelo.

Entrenando un modelo de IA

Google nos da créditos para que «juguemos» durante tres meses. Ponemos un presupuesto de 1 hora

 

Entrenando un modelo de IA

Y ahora a esperar

Consideraciones Adicionales

Recordad que es crucial asegurarse de que los tipos de datos se hayan interpretado correctamente en Vertex AI y, si es necesario, realizar las transformaciones adecuadas. Los modelos de AutoML dependen del tipo de datos y los objetivos específicos. Es importante elegir el tipo correcto para tus necesidades.

Este proceso proporciona un marco detallado y un punto de partida para compilar un modelo de clasificación binaria utilizando AutoML de Google, específicamente para predecir el comportamiento de compra de clientes bancarios. La precisión y eficacia del modelo dependerán significativamente de la calidad y preparación de los datos utilizados.

En el próximo artículo hablaré sobre qué podremos hacer una vez esté creado el modelo.

Otras formas de hacer esto sin la plataforma de Google.

Para realizar tareas similares a las que se llevan a cabo con Vertex AI y AutoML de Google, hay varias alternativas disponibles en el mercado. Cada una de estas plataformas ofrece sus propias capacidades y ventajas en el ámbito del aprendizaje automático y la inteligencia artificial. Aquí algunas de las más destacadas:

  • Amazon SageMaker (AWS):  SageMaker es una plataforma completa de AWS que proporciona a los usuarios la capacidad de construir, entrenar y desplegar modelos de aprendizaje automático rápidamente. Ofrece una amplia gama de herramientas y una integración profunda con el ecosistema de AWS. También permite a los usuarios escribir su propio código y algoritmos personalizados.
  • Azure Machine Learning (Microsoft) Esta es una plataforma en la nube de Microsoft para el entrenamiento, despliegue, automatización, gestión y seguimiento de modelos de ML. Azure ML es conocido por su interfaz de usuario amigable, integración con otros servicios de Microsoft y soporte para diversos marcos y lenguajes de programación.
  • IBM Watson Studio:  Watson Studio es una solución de IBM que ofrece un conjunto de herramientas para el desarrollo de modelos de IA y ML. Proporciona una variedad de herramientas para el análisis de datos, modelado visual, y es fuerte en la integración de IA con aplicaciones empresariales.

Cada una de estas plataformas tiene sus propias fortalezas y se adapta a diferentes necesidades y escenarios. La elección de la herramienta adecuada dependerá de factores como el nivel de habilidad del usuario, la escala del proyecto, los requisitos específicos del modelo y la infraestructura existente.

Comparte en: