in

Experimente las tablas autoML de Google de forma gratuita

1qCkJU6tMzhljY3DhlUg 0A

Experimente las tablas autoML de Google de forma gratuita

Parte II de una serie de reseñas sobre la experiencia del usuario de la herramienta autoML

Dawn Moyer

8 de septiembre de 2020·5 min de lectura

Imagen de Pavlofox en Pixabay

Bienvenido al segundo artículo de mi serie de reseñas sobre la experiencia del usuario de la herramienta autoML. Mi objetivo es comparar el uso y el acceso a la información clave en varias herramientas de autoML. Hoy, me centraré en una de las herramientas autoML de Google llamada Tablas. autoML Tables está diseñado para procesar datos tabulares semiestructurados (su archivo .csv típico). Google anunció una versión beta de autoML Tables el 10 de abril de 2019. Aún marcado en la fase Beta con funciones que aún se están implementando, quería revisar la oferta de Google.

¿Por qué Google autoML Tables?

He leído soMe alegro de la experiencia con el aprendizaje automático de Google. He usado Google Cloud antes para algunos trabajos de consultoría y encontré que la experiencia es bastante sencilla. Tenía muchas ganas de ver sus servicios de aprendizaje automático. Elegí Tablas porque coincide con el tipo de archivo Kaggle que he estado usando en esta serie.

Como mencioné antes, Tables está en modo beta. Como tal, revisé las páginas de lanzamientos y problemas para asegurarme de que no hubiera obstáculos. No hubo bloqueadores, aunque este aviso en la página de problemas me hizo reír:

«La experiencia del usuario con los navegadores Microsoft Edge y Microsoft Internet Explorer puede no ser óptima».

La puesta en marcha

La configuración para prepararse para autoML Tables fue más manual que para AWS AutoPilot. La documentación antes de comenzar fue excelente, pero parecía ser necesaria antes de cada proyecto que desea comenzar.

  • Crea un nuevo proyecto
  • Asegúrese de que su facturación esté habilitada
  • Registre su aplicación para Cloud Storage, Cloud AutoML API, Google Cloud Storage JSON API, BigQuery API en Google Cloud Platform
  • Instala la herramienta de línea de comandos de gcloud.
  • Instalar el SDK de Google Cloud
  • Crea una cuenta de servicio
  • Establecer variables ambientales
  • Actualizar las funciones de IAM

No se preocupe, una vez que haya completado los requisitos previos, la experiencia mejora enormemente.

Los datos

En cuanto a AWS SageMaker AutoPilot, utilicé conjuntos de datos de competencia de Kaggle.

Contradictorio, mi querido Watson. Detectar contradicciones e implicaciones en textos multilingües mediante TPU. En este concurso de introducción, clasificamos pares de oraciones (que constan de una premisa y una hipótesis) en tres categorías: vinculación, contradicción o neutral.

6 columnas x 13k + filas – documentación de Stanford NLP

  • identificación
  • premisa
  • hipótesis
  • lang_abv
  • idioma
  • etiqueta

Costos de formación del modelo

La formación de modelos cuesta $ 19,32 por hora. Dado que no necesita ninguna licencia y solo se le cobran los recursos informáticos para la capacitación, esto es bastante razonable. Y para sus primeros modelos, hay una prueba gratuita. Obtiene seis horas de nodo gratuitas para entrenamiento y predicción por lotes. Esta prueba gratuita NO incluye la implementación de modelos y luego llamarlos en línea. Seis horas es tiempo suficiente para intentarlo. Mi ejemplo usó 1.2 horas.

Comenzando el entrenamiento

Navega a Google AI. Allí encontrará un elemento de menú «Entrenar con autoML».

captura de pantalla del menú por el autor

Haga clic en el menú desplegable Probar autoML en Tablas.

captura de pantalla desplegable del autor

Cargando los datos

Importar el conjunto de datos de entrenamiento es simple. La creación de un depósito para los conjuntos de datos de salida también se puede realizar directamente en esta pantalla.

captura de pantalla de importación de datos por el autor

Una vez que se importan los datos, obtiene acceso a algunos análisis de datos básicos.

captura de pantalla del autor

Los detalles son un poco toscos. Las tartas y las rosquillas son para comer, no para vislumbrar.

las donas son para comer captura de pantalla del autor

Entrenando tu modelo

Para el presupuesto de capacitación, dedico mis seis horas gratuitas. No hay muchos otros parámetros a los que pueda acceder y sintonizar en esta pantalla.

captura de pantalla de entrenamiento por el autor

Esperando la magia

Si bien la interfaz de usuario proporciona algunas actualizaciones sobre el estado de la infraestructura en marcha y avería, no hay muchas indicaciones de qué tan avanzado está. Esperé aproximadamente media hora y luego decidí confiar en la configuración de mi presupuesto. Hice otras cosas hasta que me notificaron de la finalización. El correo electrónico es una característica interesante.

Infraestructura girando captura de pantalla del autor.
esperando … captura de pantalla del autor

Evaluar los resultados de la formación

Una vez que llega el correo electrónico, la pestaña Evaluar ahora se completa. Hay un gráfico de algunas de las métricas estándar, como AUC, Precision, Recall y Log Loss. Me gusta que haya disponible una matriz de confusión.

captura de pantalla de los resultados del entrenamiento por el autor

No puedo encontrar ningún detalle sobre el modelo en sí, aparte de que es un clasificador de clases múltiples. Para obtener más información, exporté el modelo. ¿Cuáles son los detalles del modelo? ¿Qué son los hiperparámetros? No hay suficiente información para mi gusto.

Puntuación

Cuando se ejecuta por lotes, la salida debe ir a BigQuery.

puntuación de captura de pantalla del autor

Es en este punto donde termina la experiencia del usuario. El archivo de salida se carga en BigQuery. Me gusta que los datos estén disponibles para consultas o uso directo en visualizaciones de Data Studio. Preferiría algunos análisis disponibles directamente en la consola de autoML.

Conclusiones

Soy un gran admirador de la documentación y los consejos proporcionados. Son fáciles de seguir. Las actualizaciones por correo electrónico también son excelentes.

Donde la experiencia se queda corta es en la facilidad para identificar detalles sobre el modelo final en sí. Lo mejor que puede hacer es descargar un paquete de modelo de Tensorflow para evaluarlo fuera de Google Cloud.

Las visualizaciones fueron decepcionantes. Es casi mejor no tener ningún gráfico de distribución que algunos gráficos circulares inutilizables. Como todavía están en versión beta, espero que estén recopilando comentarios de los usuarios sobre las funciones que necesitan.

En general, la falta de transparencia podría impedirme poder utilizar esta herramienta de forma regular. Sin embargo, ES beta… ¡vuelve pronto!

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

LJTvB7qt3yjPdqHYTfcxNP 1200 80

Próximos teléfonos 2021: los 10 mejores teléfonos nuevos que estamos más emocionados de ver a continuación

Fecha y hora de Java SE 8