Métricas de TI para garantir velocidade e qualidade para o seu negócio

Publicados: 2021-05-04

Neste artigo

Para qualquer coisa, os indicadores são essenciais para monitorar a eficácia de um processo, identificar problemas potenciais e compreender as possíveis intervenções. Usar as métricas certas significa melhor desempenho para Tecnologia da Informação, assim como para marketing. Vamos descobrir o porquê.

“Poder não é nada sem controle” era o slogan de uma conhecida empresa com a qual trabalhei há quase 20 anos. Eu via em todo lugar, gostava e não conseguia tirar da minha cabeça. Talvez por isso aceitei de bom grado o desafio de organizar a implementação do MailUp de um conjunto de métricas de TI conhecidas entre os especialistas e baseadas no equilíbrio entre velocidade e qualidade .

O que são métricas de TI e para que servem?

Quais são as métricas de TI? Eles ajudam a controlar e melhorar os processos medindo variáveis ​​significativas no mundo da tecnologia da informação. Como todos os processos complexos, a habilidade está em classificar um número limitado de quantidades mensuráveis. Isso não apenas constitui um bom indicador para os processos e desempenho de nosso produto, mas também nos permite melhorar ambos os aspectos por meio de intervenções direcionadas que variam seus valores.

Complicado? Um pouco - já que não é tão fácil identificar as melhores métricas para esse tipo de controle ativo . Depois de experimentar algumas métricas definidas internamente, decidimos usar aquelas que estão muito bem descritas em “Acelerar - Acelerar: A Ciência do Software Enxuto e DevOps”. Esses também estão entre os principais tópicos dos Relatórios Anuais do Estado do DevOps desde 2012.

Medir para melhorar: como as métricas de TI aceleram o desempenho dos negócios

Após uma extensa pesquisa de anos envolvendo milhares de empresas, os autores das publicações citadas afirmam que existe uma correlação direta entre excelente desempenho de TI e igualmente bons resultados de negócios para empresas do setor digital. Esses estudos identificaram 5 métricas principais nas quais todos os melhores profissionais de TI (as empresas maiores e mais vanguardistas) alcançaram resultados excelentes. Essas empresas adotaram esses mesmos indicadores e conseguiram corresponder aos valores dos “profissionais de elite” em todas as 5 métricas. Na verdade, eles tiveram uma taxa de crescimento muito melhor do que os outros, e isso confirma o quão extremamente eficaz e importante é implementar um conjunto de KPIs de TI. A excelência em resultados de tecnologia torna-se , em suma, um fator capacitante para acelerar o desempenho no nível de negócios.

Métricas de TI para garantir velocidade e qualidade para o seu negócio

As 5 métricas de TI sobre as quais falamos até agora são baseadas em conceitos muito simples: velocidade e qualidade . A mensagem é a seguinte: entregue valor aos clientes de forma rápida, contínua e frequente . Quanto mais rápido você vai, mais corre o risco de cometer erros. Você também precisa ficar atento à frequência de erros e ao tempo de restauração necessário após um mau funcionamento.

Ao traduzir este conceito em números, obtemos as 5 quantidades mensuráveis ​​como métricas:

  • Lead Time For Changes (LTFC): tempo médio desde o início de um processo até sua disponibilização ao cliente (“em produção”);
  • Frequência de implantação : com que frequência as notícias ou atualizações são lançadas na produção;
  • Taxa de falha de alteração (CFR): número de atualizações de produção para recuperar de um problema causado por uma atualização recente;
  • Tempo Médio de Recuperação (MTTR): tempo médio de recuperação após um problema sério de produção afetar os clientes; e
  • Disponibilidade : porcentagem de tempo em que os serviços da plataforma estiveram totalmente disponíveis (obtida subtraindo-se a soma de todos os tempos de recuperação).

Métricas de TI da MailUp

Na MailUp , temos adotado essas métricas desde setembro de 2020. Fizemos isso por meio de ferramentas de medição automática e pela criação de um processo contínuo onde:

  • monitoramos o progresso;
  • estabelecemos metas ; e
  • identificamos ações para chegar lá.

Isso requer atenção, pois um aumento repentino na velocidade pode estar relacionado a uma qualidade inferior.

É comum esquecer que métricas são indicadores indiretos para melhorar um processo. A chave é que a medição não é um fim em si mesma. Em vez disso, o que importa é o nosso impacto no processo e no produto quando conseguimos fazer essa mudança de medida.

Com relação aos números, vamos ver com mais detalhes como calculamos essas métricas no MailUp:

como medir suas métricas

Calculamos o Lead Time For Changes como o intervalo médio de tempo dos últimos três meses que uma história (ou tarefa), correspondente a um problema de Jira , leva para ir do início do processamento até a publicação. Aqui, a suíte Atlassian Jira nos ajuda. Permite medir o “tempo no status” de uma história, ou seja, há quanto tempo um assunto está em determinado status a cada transição de seu fluxo de trabalho. Os dados importados e agregados podem ser visualizados por meio de um gráfico de controle Jira ou painéis ad hoc, como o que fizemos com o Tibco Spotfire.

Os problemas constituem os blocos de construção de qualquer projeto. Eles podem representar um problema a ser resolvido (por exemplo, um bug) ou uma tarefa geral para a equipe ou alguns de seus membros. Na verdade, o software Jira foi criado para monitorar não apenas problemas, mas também controlar todo o fluxo de trabalho. No MailUp, usamos quatro tipos de problemas padrão em Jira: história (algo que interessa ao usuário), bug (um problema a ser resolvido), tarefa (algo a ser concluído) e épico (uma grande história que pode ser composta em um menor número de histórias).

No MailUp também medimos o Lead Time To Deploy, ou seja, o tempo desde a última alteração da produção até o código-fonte.

Para frequência de implantação e CFR, integramos nossos processos de liberação de produção automática (pipeline de implantação) com um fluxo que registra informações relevantes para as métricas do banco de dados . Um técnico que intervém no ambiente de produção só precisa especificar se é uma versão normal, um hotfix (correção rápida) ou uma reversão (restauração da versão anterior).

O MTTR e a Disponibilidade baseiam-se na definição de “incidente” . Internamente, definimos isso como uma interrupção da produção com impacto e gravidade acima de um determinado limite. Para cada incidente, é obrigatório preencher um “formulário de incidente” no Atlassian Jira . Isso indica vários elementos como duração, causa, efeitos, impactos e tipo de resolução. Os dados dos cartões de incidentes são então extraídos por um processo automático para representá-los graficamente.

As tendências estão relacionadas ao seu desempenho ao longo do tempo para cada uma dessas métricas. Achamos muito útil usar a média móvel dos últimos três ou quatro meses como referência para contextualizar e compensar elementos enganosos, como um pico isolado ou a inércia de uma janela de avaliação muito grande.

Essas métricas são suficientes para nós? Eles certamente são um excelente ponto de partida para entender o estado tecnológico da saúde, mesmo que nosso horizonte de futuro já tenha mais duas etapas :

  • integração dessas métricas com outras medidas importantes, como velocidade de acesso às páginas da plataforma; e
  • introduzindo um nível de especificidade maior nos indicadores existentes, detalhando-os por meio de submétricas que “detalham” (análise em profundidade).

Conclusão

Esta breve visão geral identifica o significado e os benefícios por trás do uso de um conjunto de métricas de TI para impulsionar o desempenho geral dos negócios. Para saber mais sobre as métricas e como elas são calculadas, clique neste link!