確保業務速度和質量的 IT 指標

已發表: 2021-05-04

在本文中

對於任何事情,指標對於監控流程的有效性、識別潛在問題和了解可能的干預措施都是必不可少的。 使用正確的指標意味著信息技術的更好表現,就像營銷一樣。 讓我們找出原因。

“沒有控制就沒有權力”是我工作了將近 20 年前的一家知名公司的口號。 我到處都看到它,喜歡它,而且我無法忘記它。 也許正是出於這個原因,我很高興接受了組織 MailUp 實施的挑戰,這些 IT 指標在專家中廣為人知,並且基於速度和質量平衡

什麼是 IT 指標,它們的用途是什麼?

什麼是 IT 指標? 它們通過測量信息技術世界中的重要變量來幫助控制和改進流程。 像所有復雜的過程一樣,技巧在於對有限數量的可測量數量進行分類。 這些不僅構成了我們產品流程和性能的良好指標,而且讓我們通過改變其價值的有針對性的干預措施來改進這兩個方面

複雜的? 有點——因為要為這種類型的主動控制確定最佳指標並不容易。 在嘗試了一些內部定義的指標後,我們決定採用“加速 – 加速:精益軟件和 DevOps 的科學”中概述的那些指標。 自 2012 年以來,這些也是 DevOps 年度報告中的主要主題之一。

改進措施:IT 指標如何加速業務績效

在對數千家公司進行了長達數年的廣泛研究之後,上述出版物的作者確認,出色的 IT 性能與數字領域公司同樣出色的業務成果之間存在直接關聯。 這些研究確定了5 個主要指標,在這些指標中,所有頂級 IT 執行者(最大、最前衛的公司)都取得了優異的成績。 這些公司採用了這些相同的指標,並設法在所有 5 個指標上與“精英績效者”的價值觀相匹配。 事實上,他們的增長率遠高於其他人,這證實了實施 IT 關鍵績效指標集是非常有效和重要的。 簡而言之,卓越的技術成果成為加速業務層面績效的一個促成因素。

確保業務速度和質量的 IT 指標

到目前為止,我們討論的 5 個 IT 指標基於非常簡單的概念:速度和質量。 信息如下:快速、持續、頻繁地為客戶提供價值。 你走得越快,犯錯的風險就越大。 您還需要注意錯誤的頻率和故障後所需的恢復時間。

通過將這個概念轉化為數字,我們得到了 5 個可測量的數量作為指標:

  • 變更提前期(LTFC):從流程開始到客戶可用(“生產中”)的平均時間;
  • 部署頻率:生產中發布新聞或更新的頻率
  • 更改失敗率(CFR):從最近更新引起的問題中恢復的生產更新數量;
  • 平均恢復時間(MTTR):嚴重生產問題影響客戶後的平均恢復時間; 和
  • 可用性:平台服務完全可用的時間百分比(通過減去所有恢復時間的總和獲得)。

MailUp 的 IT 指標

在 MailUp ,自 2020 年 9 月以來,我們一直在採用這些指標。我們通過自動測量工具和建立一個連續的流程來做到這一點,其中:

  • 我們監控進度;
  • 我們設定目標; 和
  • 我們確定實現目標的行動。

這需要注意,因為速度的突然提升可能與質量下降有關。

通常會忘記指標是改進流程的間接指標。 關鍵是測量本身並不是目的。 相反,重要的是當我們設法改變衡量標準時我們對流程和產品的影響。

關於數字,讓我們更詳細地了解如何在 MailUp 中計算這些指標:

如何衡量它的指標

我們將變更提前期計算最近三個月的平均時間跨度,對應於 Jira 問題的故事(或任務)從處理開始到發布所花費的時間。 在這裡,Atlassian Jira 套件可以幫助我們。 它讓我們可以衡量一個故事的“狀態時間”,即一個問題在其工作流程的每次轉換中處於特定狀態的時間。 然後可以通過 Jira 控製圖或臨時儀表板查看導入和匯總的數據,就像我們使用 Tibco Spotfire 製作的那樣。

問題構成了任何項目的基石。 這些可以代表要解決的問題(例如錯誤)或團隊或其某些成員的一般任務。 事實上,創建 Jira 軟件不僅可以監控問題,還可以跟踪整個工作流程。 在 MailUp 中,我們在 Jira 中使用四種標準問題類型:故事(用戶感興趣的東西)、錯誤(要解決的問題)、任務(要完成的東西)和史詩(可以在故事數量較少)。

在MailUp 中,我們還測量了Lead Time To Deploy,即從產品最後一次更改到源代碼的時間。

對於部署頻率和 CFR,我們已將我們的自動生產發布流程(部署管道)與記錄與數據庫指標相關的信息的流程集成在一起 介入生產環境的技術人員只需要指定是普通版本、hotfix(快速修復)還是回滾(恢復之前的版本)。

MTTR 和可用性基於“事件”的定義。 在內部,我們將其定義為影響和嚴重程度高於特定閾值的生產中斷。 對於每個事件,必須在 Atlassian Jira 上填寫“事件表” 。 這表明了各種元素,如持續時間、原因、影響、影響和解決類型。 然後通過一個自動過程從事件卡中提取數據,以圖形方式表示它們。

這些趨勢與每個指標隨時間推移的表現相關。 我們發現使用過去三四個月的移動平均線作為參考非常有用,可以將誤導性元素(例如孤立的峰值或過大的評估窗口的慣性)進行背景化和補償。

這些指標對我們來說足夠了嗎? 它們當然是了解技術健康狀況的絕佳起點,即使我們的未來視野已經有兩個進一步的步驟

  • 將這些指標與平台頁面的訪問速度等其他關鍵指標相結合;
  • 通過“向下鑽取”(深入分析)的子指標對現有指標進行詳細說明,從而在現有指標上引入更高的特異性

結論

這個簡短的概述指出了使用一組 IT 指標來提高整體業務績效背後的意義和好處。 要了解有關指標及其計算方式的更多信息,請單擊此鏈接!