En la economía precise, la frase clave es “hacer más con menos”. Hacer más con menos no se trata solo de reducir el costo de la infraestructura, sino también de reducir el tiempo dedicado a administrar y mantener múltiples sistemas. Con Azure Databricks, puede reducir los costos y la complejidad al mismo tiempo que brinda información más impactante a partir de sus datos, justo a tiempo para su negocio. Hemos ayudado a muchos clientes; echa un vistazo a cómo hemos ayudado salud optum ahorre millones en posibles pérdidas de ingresos mientras puede procesar 1 millón de reclamos de seguros por minuto. No hagamos menos con menos; hagamos más con menos.
Si está frustrado con la complejidad de los análisis en tiempo actual, el rendimiento lento de las consultas o el esfuerzo handbook requerido para tareas como el ajuste, el mantenimiento y la gestión de la carga de trabajo en su plataforma de datos precise, este weblog es para usted.
Más toma de decisiones en tiempo actual con menos complejidad
La tasa de transmisión de datos ha aumentado exponencialmente en los últimos años. Desde datos de pedidos en línea hasta telemetría de aplicaciones y datos de IoT, hay más formas que nunca de comprender a sus clientes y su negocio. ¿No sería genial combinar estas nuevas fuentes de datos con años de datos históricos para tomar decisiones comerciales en tiempo actual?
Llevar a cabo esto generalmente ha implicado configurar y administrar múltiples herramientas para ingerir y procesar datos de transmisión, unirlos con datos históricos y entregarlos a aplicaciones de BI.
Con Azure Databricks Lakehouse Platform, obtiene una herramienta única para ingerir, procesar, unir y entregar datos históricos y de transmisión, todo en ANSI SQL acquainted. Con Mesas en vivo Delta, puede crear canalizaciones sólidas y pasar del procesamiento por lotes al flujo continuo con el mismo código para que sus tablas estén actualizadas en segundos. Entonces con Azure Databricks SQLsus equipos comerciales pueden hacer preguntas sobre estos datos en vivo para tomar decisiones en tiempo actual o conectarse directamente a herramientas de BI como BI de energía para tableros en tiempo actual. Más información sobre cómo ropa deportiva columbia está aprovechando Azure Databricks para tomar decisiones en tiempo actual sobre sus operaciones al reducir el tiempo de procesamiento de datos de 4 horas a 5 minutos con transmisión.
Más rendimiento con menos costo
Si bien la mayoría de los almacenes de datos pueden ampliarse para cumplir con las cargas de trabajo más exigentes, no todos están diseñados para escalar sin tener un gran costo para su negocio. Un almacén de datos que no es escalable puede significar que los analistas de datos esperen horas para que finalicen las consultas y que los informes de BI queden inutilizables.
Azure Databricks SQL se creó primero para el rendimiento, lo que significa que sus consultas se completan más rápido, sus informes de BI se ejecutan sin problemas y puede manejar incluso las cargas de trabajo más exigentes sin recibir una llamada de su CFO. Como resultado de nuestro alto rendimiento Motor de fotones y características como almacenamiento en caché y salto de datosDatabricks SQL rompió el Récord mundial TPC-DS 100 TB, un punto de referencia estándar de la industria. Azure Databricks SQL está diseñado para manejar cargas de trabajo de BI de alta simultaneidad y baja latencia, superando a las principales plataformas de almacenamiento de datos en la nube, como se vio anteriormente.
Hacer múltiples copias de sus datos puede resultar costoso. En las plataformas de almacenamiento de datos heredadas, el cómputo y el almacenamiento están estrechamente acoplados y sus datos están bloqueados en un formato de almacenamiento patentado y usted incurre en un costo adicional para cargar datos desde su lago de datos a su almacenamiento de datos. Con Azure Databricks, puede mantener todos sus datos en su lago de datos utilizando el código abierto lago delta formato de almacenamiento para obtener un rendimiento a nivel de almacén sin bloquear sus datos ni gastar dinero para hacer copias de sus datos.
También obtiene una arquitectura de varios clústeres con una verdadera separación de computación y almacenamiento. Esto significa que puede aislar sus cargas de trabajo de ETL y BI para eliminar la contención de recursos, un cuello de botella común, por lo que solo paga por el cómputo que necesita, no más almacenes sobreaprovisionados que funcionan las 24 horas del día, los 7 días de la semana.
Más velocidad de comercialización con menos gastos generales
Una buena plataforma de datos debería permitir que su equipo se concentre en crear nuevos productos de datos en lugar de dedicar demasiado tiempo a la administración y DevOps.
Sin embargo, la mayoría de las plataformas de datos requieren que desconecte el sistema para iniciarlo, apagarlo y escalarlo, e incluso bloquear tablas para cosas simples como cambiar el nombre de la tabla. A menudo requieren planificación de la capacidad, supervisión y ajuste constantes del rendimiento y gestión handbook de la carga de trabajo.
Con Azure Databricks SQL, obtiene un almacén completamente sin servidor sin comprometer el rendimiento, lo que significa acceso instantáneo a la computación en lugar de esperar entre 10 y 15 minutos para que se energetic un clúster. También obtiene escalado automático instantáneo para escalar horizontalmente para satisfacer las necesidades ilimitadas de simultaneidad de su negocio y parada automática para cerrar el almacén cuando no está en uso.
Azure Databricks SQL Serverless es ahora disponible en versión preliminar pública y viene con Gestión inteligente de cargas de trabajo, que usa IA para aprender del historial de sus cargas de trabajo. Usamos este historial para consultas nuevas para determinar si debemos priorizarlo para que se ejecute de inmediato o ampliarlo para ejecutarlo sin interrumpir las consultas en ejecución, lo que resulta en un promedio de 3 veces menos de latencia para cargas de trabajo de consultas mixtas. El acceso instantáneo a la computación, el escalado automático y la gestión de la carga de trabajo, y el rendimiento rápido significan que sus analistas de datos pueden ser más ágiles y brindar información más rápidamente. En Corporación Canadiense de Radiodifusiónmigrar a Databricks SQL ha resultado en una reducción del 50 % en el tiempo de obtención de información.
Hacer más con menos no tiene por qué significar apagar sistemas o cerrar proyectos. Por el contrario, con Azure Databricks, puede brindar información en tiempo actual sobre sus datos, a un costo menor, y permitir que sus equipos de datos se concentren en brindar resultados más rápidos a sus clientes.
Echa un vistazo a este tutorial para comenzar a crear canalizaciones de transmisión de alto rendimiento y paneles en tiempo actual con Azure Databricks.