Acercando los modelos y los datos


Nos complace anunciar una nueva capacidad de AutoML para usar rápida y fácilmente los datos de Characteristic Retailer para mejorar los resultados del modelo. Los usuarios de AutoML ahora pueden simplemente unir tablas de Characteristic Retailer a conjuntos de datos de AutoML para mejorar la calidad del modelo. A medida que Machine Studying (ML) se vuelve más rápido y fácil, los clientes pueden aplicar esta tecnología de transformación a una variedad cada vez mayor de casos de uso. Esto permite a los clientes encontrar más formas de aumentar sus ingresos o reducir sus costos usando ML. Ya hemos visto a muchos clientes que usan AutoML para resolver desafíos comerciales críticos. Algunos clientes usan AutoML para ampliar su experiencia en ML, mientras que otros lo usan para ayudar a acelerar sus resultados. Con el anuncio de hoy, AutoML ahora está completamente integrado con Databricks Characteristic Retailer.

¿Qué es una tienda de características?

Un almacén de funciones es un depósito de datos centralizado que permite a los científicos de datos almacenar, buscar y compartir funciones. El almacén de funciones garantiza que el mismo código utilizado para calcular los valores de las funciones se utilice para el entrenamiento y la inferencia del modelo. Esto crea un conjunto de datos seleccionados a los que los modeladores pueden acceder sabiendo que pueden usar estos datos tanto para entrenar como para implementar sus modelos. Muchas empresas informan aceleraciones significativas en la experimentación y la implementación cuando utilizan Characteristic Retailer. Por ejemplo, el director de ingeniería de datos de Anheuser-Busch InBev dijo: “(The Characteristic Retailer) ha sido basic para ayudarnos a escalar rápidamente nuestras capacidades de ciencia de datos, así como para unir a los ingenieros y analistas de datos con una fuente común de ingeniería de características y transformaciones de datos”.

Comenzar con una tienda de funciones es fácil, cualquier tabla Delta con una clave principal y una marca de tiempo se puede usar fácilmente en la tienda de funciones. Puede obtener más información sobre Databricks Characteristic Retailer aquí: AWS, Azur, PCG.

¿Cómo acelerará esta integración los resultados de ML?

Ladrillos de datos AutoML (AWS, Azur, PCG) fue diseñado para ayudar a los clientes en todos los niveles de experiencia técnica a construir y entrenar modelos ML. AutoML no solo proporciona un modelo candidato de alta calidad, sino que también proporciona al cliente todo el código del modelo en una computadora portátil en caso de que el cliente desee ajustar aún más el rendimiento del modelo.

En el pasado, AutoML podía entrenar un modelo utilizando una tabla como conjunto de entrenamiento. Ahora, los clientes pueden mejorar la calidad de su modelo aumentando sus datos de entrenamiento de AutoML con datos en su tienda de funciones. Esto facilita el entrenamiento de un modelo aún más preciso. Los modelos de AutoML que usan la integración de Characteristic Retailer capturarán automáticamente el linaje de características y agregarán el nuevo modelo al seguimiento de linaje de extremo a extremo. Este linaje acelera la implementación y proporciona las herramientas para ayudar a satisfacer sus MLOps y sus necesidades de cumplimiento.

¿Cómo empiezo?

En la página del experimento de AutoML, seleccione un clúster con Databricks Runtime 11.3 LTS ML o superior. Después de seleccionar el tipo de problema, el conjunto de datos y el objetivo de predicción, verá un botón en la parte inferior izquierda de la pantalla.

Tiempo de ejecución de los ladrillos de datos

Al seleccionar este botón, aparecerá la posibilidad de seleccionar tablas de características para unirlas a su conjunto de datos, así como las teclas de búsqueda que se utilizarán para realizar las uniones.

AutoML

Una vez que hayamos identificado las tablas que queremos unir, así como las claves de búsqueda, simplemente podemos presionar el botón “Iniciar AutoML” y el servicio comenzará a crear modelos con los datos ingresados ​​y los datos agregados de las tablas de la tienda de características. En este ejemplo, aumentar los datos de tarifas de NYC Yellow Taxi con tablas de características trae una mejora del 21 % en el ajuste del modelo (es decir, una disminución de 3,991 a 3,142 en RMSE).

Esta integración no solo está en la interfaz de usuario de AutoML, sino que la API de AutoML ahora admite el aumento programático de sus datos de entrenamiento con tablas de almacenamiento de funciones. Puede obtener más información sobre las capacidades de la API aquí (AWS, Azur, PCG)

A medida que continuamos invirtiendo en formas de hacer que ML sea más rápido y easy, estamos entusiasmados de ver cómo los clientes mejoran sus flujos de trabajo y esperamos encontrar más formas en que podamos ayudar a los equipos a lograr sus objetivos de ML.

Related Articles

Acercando los modelos y los datos

Nos complace anunciar una nueva capacidad de AutoML para usar...

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Same Category

Acercando los modelos y los datos

Nos complace anunciar una nueva capacidad de AutoML...

Notebooks colaborativos para DevOps y SRE con Micha Hernandez

La complejidad de la infraestructura de software program...

¡50 datos interesantes sobre los EE. UU.!

Los Estados Unidos de América es un país...
spot_img

Stay in touch!

Follow our Instagram