Una lista seleccionada de los mejores artículos del año del mundo de los datos
Así de easy, ¡estamos a finales de 2022! Y qué montaña rusa ha sido con grandes cambios e incertidumbre en todas las industrias. (Especialmente para los usuarios de la aplicación de aves…)
Sucedieron muchas cosas en el mundo de la pila de datos moderna este año. Nosotros hablamos acerca de títulos de trabajopensó en decir adiós a la ciencia de datosdebatido equipos de datos centralizados vs integrados y agrupación frente a desagregacióninició discusiones importantes como la brecha salarial técnicay mucho más.
Ya sea que esté en lo más profundo de esta comunidad o recién haya comenzado con los datos, puede ser difícil mantenerse al día con todo. Entonces, continuando con nuestra tradición del año pasado, compartimos los mejores blogs de 2022 junto con algunas lecturas de seguimiento para mantenerlo pensando. ¡Feliz lectura!
PD: ¡Un saludo especial a todos los que compartieron sus experiencias de datos, aprendizajes, puntos de vista y observaciones este año! Ahora es el momento de tener conversaciones más abiertas sobre lo que queremos para el futuro de los datos, y estamos muy agradecidos con todos los profesionales de datos que brindan su tiempo para compartir concepts, generar debates y hacer que nuestra industria avance.
Sobre los datos como producto
Producto de datos en entornos cambiantes: repensar y actualizar las inversiones por Eric Weber
Los últimos años han estado llenos de ‘esto es lo que tenemos que hacer a continuación’ o ‘una vez que tengamos este equipo, podemos hacer esto’. Planificamos cómo apoyaríamos a más personas y áreas del negocio con más inversión, pero no pensamos en lo que haríamos si tuviéramos que recortar el apoyo. Lo entiendo. Eso no se siente muy cómodo. Pero al igual que la planificación de la sucesión de las personas, necesitamos tener un plan de lo que haríamos en situaciones difíciles. En algunos casos, es posible que deje de admitir personas específicas en un producto. En otros, es posible que deje de recibir soporte para un producto por completo. No es fácil decir cuál es la ‘respuesta correcta’. Pero dedicar tiempo a pensar en su respuesta es importante.
Más lecturas de seguimiento:
Sobre el trabajo con datos
¿Deberíamos estar agradecidos por la pila de datos moderna? por Ben Stancil
Eso es la paradoja que necesitamos resolver. ¿Por qué la tecnología de datos ha avanzado mucho más allá del valor que proporciona un equipo de datos? ¿Todas estas nuevas herramientas realmente duelen, al hacer que perdamos el enfoque en los problemas más importantes (p. ej., los datos en Salesforce) a favor de las cosas nuevas y brillantes que en realidad no importan (p. ej., los datos en nuestros veinte años)? quinta aplicación SaaS)? ¿El talento de la industria no se ha puesto al día con la capacidad de sus herramientas, y solo necesitamos ser pacientes? ¿El problema es más elementary? No estoy seguro. Pero si nuestro yo de 2032 quiere estar tan agradecido por la década de 2020 como deberíamos estarlo por la década de 2010, esas son las siguientes preguntas que debemos responder.
Más lecturas de seguimiento:
Sobre los contratos de datos
El auge de los contratos de datos por Chad Sanderson
Los contratos de datos son acuerdos similares a API entre ingenieros de software program que poseen servicios y consumidores de datos que entienden cómo funciona el negocio para generar datos bien modelados, de alta calidad, confiables y en tiempo actual.
En lugar de que los equipos de datos acepten pasivamente volcados de datos de sistemas de producción que nunca se diseñaron con fines analíticos o de aprendizaje automático, los consumidores de datos pueden diseñar contratos que reflejen la naturaleza semántica del mundo compuesto por entidades, eventos, atributos y las relaciones entre cada objeto
Esta abstracción permite a los ingenieros de software program desvincular sus bases de datos/servicios de los requisitos analíticos y basados en ML. Los ingenieros ya no tienen que preocuparse por causar incidentes que interrumpan la producción al modificar sus bases de datos, y los equipos de datos pueden concentrarse en describir los datos que necesitan en lugar de intentar unir el mundo retroactivamente a través de SQL.
Más lecturas de seguimiento:
Sobre la creación y el liderazgo de un equipo de datos
Hacer crecer los equipos de datos de reactivos a influyentes por Emily Thompson
Los equipos de datos tienden a ser un grupo bastante rudimentario y, a menudo, se arremangan y construyen lo que necesitan para desbloquearse. Pero aquí hay una oportunidad para comenzar a influir en las hojas de ruta en otro equipos En lugar de llenar los vacíos tecnológicos con soluciones complicadas, el estatuto de mi equipo también prescribía que hicieran recomendaciones técnicas a los equipos de los que dependíamos.
Debido a que ahora se requería que el equipo de datos impulsara la conversación de manera proactiva, se tomaron el tiempo para trabajar con socios y proponer soluciones multifuncionales. El trabajo fundacional se consideró parte de la acumulación de trabajo de “impulso de impacto”, lo que condujo a objetivos trimestrales específicos, y se realizó un seguimiento del progreso como cualquier otra iniciativa propiedad del equipo de datos.
Más lecturas de seguimiento:
PRIMA: Hablamos con cuatro increíbles líderes de datos: Esteban Bailey (Ingeniero de datos en Whatnot), erica luie (Jefe de Datos en dbt labs) y taylor murphy (Responsable de Datos en Meltano), y gordon wong (Fundador de Wong Resolution Intelligence; ex líder sénior de Enterprise Intelligence en Hubspot): sobre lo que se necesita para tener éxito en sus primeros 365 días como líder de datos. Descargue el libro electrónico Los secretos de un líder de datos moderno aquí.
Sobre métricas, catálogos de datos, metadatos activos y más
Pilas de datos que priorizan a las personas por Ilan Man
El problema es que sus partes interesadas, aunque le dan el visto bueno todo el tiempo y afirman que les encantaría una forma más fácil de descubrir datos, ya no utilizan las herramientas que ha investigado e implementado minuciosamente. Caen en sus viejos hábitos e inevitablemente ves una métrica definida incorrectamente en una diapositiva de Powerpoint en alguna parte.
Necesitamos asegurarnos de que las partes interesadas adopten las herramientas de datos de la forma en que deberían hacerlo. Leer la documentación y realizar una formación no es suficiente. Necesitamos reforzar la buena higiene de las herramientas de datos. He visto muchos casos de personas que comienzan con una herramienta de BI y, unos meses más tarde, regresan a Excel, giran un CSV y lo pegan en una presentación. Siempre debe haber espacio para soluciones creativas y casualidad, pero el equipo de datos debe estar atento a cómo las partes interesadas usan las herramientas que implementan. Los modelos de datos y las herramientas de BI deben adaptarse a los cambios comerciales.
Más lecturas de seguimiento:
selecciones de bonificación
¿Todavía quieres más? Aquí hay algunos artículos más para seguir leyendo y pensando durante el nuevo año:
Este artículo también fue publicado en Medio.
Imagen de cabecera: carga de aaron en Unsplash