Los equipos de ingeniería de software program deben colaborar con los ingenieros de confiabilidad del sitio


Los líderes de ingeniería de software program deben fomentar la colaboración con los ingenieros de confiabilidad del sitio (SRE) para escalar el trabajo no planificado y mejorar la experiencia del cliente. Equipos de ingeniería de software program Tienden a centrarse en lanzar nuevas funciones de productos rápidamente, lo que hace que no siempre prioricen la confiabilidad de las nuevas funciones.

Gartner predice que para 2027, el 75 % de las empresas utilizarán prácticas de SRE en toda la organización para optimizar el diseño, el costo y las operaciones del producto para cumplir con las expectativas de los clientes, frente al 10 % en 2022. Hoy, más que nunca, los clientes esperan que las aplicaciones sean confiables. , rápido y disponible bajo demanda. Cuando las organizaciones presentan productos que no cumplen con estas expectativas, los clientes buscan rápidamente otras alternativas.

Para mejorar la confiabilidad del producto, las organizaciones de TI están comenzando a adoptar principios y prácticas de SRE al diseñar y operar sistemas. Sin embargo, SRE rara vez se integra en el ciclo de vida de desarrollo de cada producto. Si bien los líderes de ingeniería de software program están involucrando a los ingenieros de confiabilidad del sitio, solo realizan ejercicios de confiabilidad ocasionales.

Fomentar la colaboración con los ingenieros de confiabilidad del sitio

Ahora es el momento para que los líderes de ingeniería de software program construyan asociaciones duraderas con ingenieros de confiabilidad del sitio como parte de su estrategia de calidad continua mediante la adopción de prácticas y herramientas de SRE. Los líderes de ingeniería de software program solo podrán entregar el valor comercial de sus productos a los clientes si están tratando la confiabilidad como una característica diferenciadora.

Los equipos de ingeniería de software program deben abordar los problemas de confiabilidad desde el principio del ciclo de vida de su producto y colaborar con los ingenieros de confiabilidad del sitio durante la totalidad de las actividades de diseño y entrega de un producto. Hacerlo es más eficiente y económico que tener que resolver el problema de un producto después de su lanzamiento.

La colaboración con los ingenieros de confiabilidad del sitio se puede fomentar definiendo indicadores de nivel de servicio (SLI) y objetivos de nivel de servicio (SLO) que capturan las expectativas del cliente en cuanto a la confiabilidad y el rendimiento del producto. Los SLI y los SLO permitirán a los equipos evaluar claramente qué tan bien un producto satisface las necesidades del cliente.

Hacer cumplir un plan de acción de SLO

El fracaso es un aspecto inevitable de la prestación de servicios, por lo que es importante que líderes en ingeniería de software program Tener un plan de acción para gestionar eficazmente el riesgo. Diseñe un plan de acción para cada SLO con ingenieros de confiabilidad del sitio. Este plan debe brindar orientación sobre lo que se debe hacer si se infringe un SLO, si hay una tendencia hacia el incumplimiento y/o si el incumplimiento es inminente.

Optimice el desarrollo y el diseño con prácticas SRE

Para promover una cultura de confiabilidad dentro de sus equipos, los líderes de ingeniería de software program deben incorporar prácticas y herramientas de SRE que impulsen una mejora duradera. Hay varias actividades que los ingenieros de software program deben realizar con los ingenieros de confiabilidad del sitio para optimizar el desarrollo y el diseño para cumplir con los SLO y los SLI: autopsias sin culpa, ingeniería del caos, gestión del trabajo y monitoreo y observabilidad.

Las autopsias sin culpa se pueden usar para identificar qué está causando eventos desencadenantes, como fallas o incumplimiento de SLO. Esta práctica permite a las organizaciones aprender y evitar repetir los mismos errores, y prevenir futuros. La ingeniería del caos utiliza pruebas de fallas experimentales para descubrir vulnerabilidades. Esto proporciona información sobre el comportamiento del sistema durante las fallas y mejora la capacidad de los equipos de ingeniería de software program para mejorar el diseño del producto. La gestión del trabajo duro elimina el trabajo de bajo valor y las tareas repetitivas. Reducir el esfuerzo permite que los equipos se concentren más en cumplir con los SLO. El monitoreo y la observabilidad identifican los mejores métodos necesarios para medir SLI y SLO.

Estas tecnologías permitirán que los equipos de ingeniería de software program y los equipos de confiabilidad del sitio trabajen en colaboración para mejorar su capacidad y resolver problemas de confiabilidad. Los equipos de ingeniería de software program deben trabajar en estrecha colaboración con los ingenieros de confiabilidad del sitio para ayudar a definir los SLO, compartir la responsabilidad de cumplir con los SLO y adoptar prácticas y herramientas de SRE.

Related Articles

Comments

LEAVE A REPLY

Please enter your comment!
Please enter your name here

Same Category

spot_img

Stay in touch!

Follow our Instagram