Hace unos meses, escribimos sobre cómo el primer paso para implementar ingeniería de confiabilidad de sitios (SRE) en una organización consiste en la adopción del liderazgo. Supongamos que ya avanzaste y completaste el primer paso. ¿Qué sigue? ¿Cuáles son los pasos concretos que puedes realizar para progresar con la SRE? En esta entrada de blog, analizaremos lo que puedes hacer como líder de TI para acelerar la implementación de la SRE dentro de tu equipo.
Paso 1: Comienza de a poco y de manera iterativa
Como dice el refrán: "Roma no se construyó en un día", pero tienes que comenzar en algún lugar. Cuando se trata de implementar los principios de la SRE, el enfoque que resultó efectivo para mí (y mi equipo) es comenzar con una prueba de concepto, aprender de nuestros errores e iterar.
Comienza por identificar una aplicación o un equipo relevantes
Se deben tener en cuenta muchos factores cuando se elige una aplicación o un equipo específicos para la prueba de concepto de la SRE. Sin embargo, la mayor parte del tiempo se trata de una decisión estratégica para la organización, lo que no se evaluará en este artículo. Como posibles escenarios, se puede mencionar un equipo que cambia de operaciones tradicionales o DevOps a SRE, o la necesidad de aumentar la confiabilidad de un producto esencial para la empresa. No importa el motivo, es esencial elegir una aplicación con las siguientes características:
Es fundamental para la empresa. A tus clientes les debe importar mucho el tiempo de actividad y la confiabilidad.
Está actualmente en desarrollo. Elige una aplicación en la que la empresa invierta recursos de manera activa.
En un mundo ideal, la aplicación brinda datos y métricas sobre su comportamiento.
Por el contrario, deberías evitar el software patentado. Si no fuiste tú quien compiló la aplicación, esta no es una buena candidata para la SRE. Es importante que puedas tomar decisiones estratégicas sobre la aplicación y realizar cambios de ingeniería en ella, según sea necesario.
Sugerencia de un profesional: En general, si tienes cargas de trabajo locales y en la nube, trata de comenzar con la app basada en la nube. Si tus ingenieros provienen de un entorno de operaciones tradicionales, cambiar y alejar su manera de pensar de las métricas de infraestructura y los "equipos físicos" será más sencillo para una app basada en la nube, ya que la infraestructura administrada convierte a los profesionales en usuarios y los obliga a consumirla como desarrolladores (API, infraestructura como código, etc.).
Recuerda: Establece metas realistas. Si desalientas a tu equipo con expectativas difíciles de cumplir desde el principio, se producirá un efecto negativo en la iniciativa.
Paso 2: Bríndales poder a tus equipos
Para implementar los principios de la SRE, es necesario fomentar una cultura de aprendizaje y, en ese sentido, la habilitación del equipo implica capacitarlo (en cuanto al conocimiento), así como otorgarle poder.
Crear un programa de capacitación es un tema en sí mismo, pero es importante pensar en una estrategia de habilitación en una etapa inicial. Particularmente, en organizaciones de gran tamaño, debes abordar temas como el perfeccionamiento de las habilidades internas, la contratación y el escalamiento del equipo, así como la incorporación y la creación de una comunidad de aprendizaje.
Tu estrategia de habilitación también debe adaptarse a los empleados de diferentes niveles y con diferentes funciones. Por ejemplo, la capacitación de los líderes de mayor jerarquía será muy diferente a la capacitación de los profesionales. La capacitación de los empleados en posiciones de liderazgo debería ser suficiente para que estos obtengan aceptación y puedan tomar decisiones organizativas. Con el fin de impulsar el cambio en toda la organización, es posible que se requiera capacitación adicional para los líderes sobre conceptos y prácticas culturales.