電話口から怒号が聞こえてくる荒んだ運用現場
今回もX社の情報システム部で見かけたワンシーンを紹介します。
おい!情シス部!どうして1ヶ月前に頼んだ帳票プログラムのミスが未対応なんだよ!
へっ?何のことですか?そんな変更依頼は知りませんけど、本当に依頼したんですか?
ごまかすな、自分が頼んだことくらい覚えてるぞ!その機能、今日中に使うんだから何とかしてくれ!
今日中ですか!?そんな対応をいきなり言われても困りますよ。
もともとそっちでサボってたのが悪いんだ。何でもいいから対応宜しく!
ガチャッ。
そ、そんな……
障害対応依頼を1ヶ月も塩漬けにしてしまった
前回同様、相変わらず切羽詰ったシステム運用をしているX社の運用現場です。
電話口でユーザーが怒りを爆発させていましたが、それもそのはず、1ヶ月前に頼んだバグ修正依頼が対応されていなかったのです。IT担当が電話後に調べてみると、確かに別の担当者が1ヶ月前に障害対応依頼として受けつけていました。
ですが、対応作業は途中で止まっています。別の担当者に話を聞くと「新しいシステム開発案件に引っ張られてすっかり忘れていた」とのこと。担当者がしっかり引継ぎを行っていれば、先ほどのユーザーの怒号はなかったでしょうね。
こういった初歩的なミスが発生するのは運用組織がうまく動いていない証拠です。システム運用の現場で働く人たちが障害対応の引継ぎを忘れてしまうほどの状況を想像してください。
- 作業依頼や障害対応が日に数十件発生する
- 依頼はユーザーから個別担当者へのメールもしくは電話で連絡される
- このため担当者が各種対応作業を抱え込んでしまっている
このような条件化であれば、冒頭のやりとりが発生しても仕方がないかもしれません。しかし、「仕方がない」で諦めてしまうのは気が早すぎます。この運用現場に欠けているのは、インシデント問い合わせを関係者全員がシェアできる仕組みです。
今回はインシデント管理でX社の運用現場を立て直していきます。
インシデントという用語の定義は後述します