事前に防げるトラブルは何%?ITOAとAPMの役割
パフォーマンスモニタリング
2016.01.13

企業のIT運用者の皆さん(あるいは社長・役員の方々)。IT部門こそが企業の業績を左右する立場にあることにお気づきでしょうか。
ショッキングな調査結果:ビジネスインパクトを防ぐことができているのは、全体の57%だけ
ここに驚くべきデータがあります。
様々な業界のITプロフェッショナル200名以上からの回答に基づく、“2015 IT Operations Analytics Survey”(Continuity Software社)の抜粋です。
- 致命的なITトラブルのうち、事前に発見できたのは57%にすぎない。発見できなかったものが大きなビジネスインパクトを発生させている。
- ITOAツールを導入している企業は、そうでない企業と比較してビジネスKPIの達成率が高い
- 70%以上の組織がネットワーク、データベース、アプリケーション、ストレージにまたがって監視を行っていた一方で、クラウドの運用状況を監視している組織は20%しかいない
- ITOAツールを導入した企業の75%が「有用」「非常に有用」と答えているが、導入済み・導入すべきと考えている企業が全体の28%しかいない
つまり、防止できているITトラブルは57%に過ぎず、40%以上のITトラブルが事前に検知されずにビジネスインパクトを与えています。そしてITトラブルによるビジネスインパクトを回避できる可能性があるのは、ITOAツールを導入した企業を中心に少数に留まるということです。
ITOA(IT Operation Analytics)とAPM(Application performance Management)について
ここで簡単に、調査レポートに出てくるITOA(IT Operation Analytics)について触れておきます。
ITOAとは、IT運用のためにデータの検索(Retrieve)、分析(Analyze)、報告(Report)のアプリケーションやソフトウェアに適用される手法やアプローチのことを指します。
大量で雑多なデータの中から、ITシステムの可用性とパフォーマンスを示す複雑なパターンを見つけ出すことが主な役割とされています。
APM(Application performance Management)と似た用途で用いられたり、比較されることもありますが、その違いはアプローチの差にあります。
ITOA | APM | |
---|---|---|
アプローチ | 既に構築済みのインフラ監視環境を情報ソースとして、可能な限りの監視情報を集約し、既存監視環境だけでは足りない部分を補完する。 | 一つのソリューションで全ての監視対象を統括することでアプリケーションのパフォーマンス情報を一元化し、効果的なパフォーマンス管理を行う |
主なツール | Splunk | CloudTriage, AppDynamics, New Relic, Dynatrace |
こうしたアプローチの違いは用途の違いにも表れています。
IT運用において、純粋にインフラストラクチャとアプリケーションのパフォーマンスを継続的に維持することを重要視する場合は、APMソリューションは選択肢として理想的です。
一方ITOAは収集した情報を任意の種類のデータ・セットを扱うことができるようになるため、ITだけでなくビジネスデータの収集ソリューションとして用いる場合にも適しています。
APMとITOAは、それぞれ異なるアプローチをとっていますが、競合するものではありません。万全を期すためなら一緒に使うことも選択できます。
それぞれのアプローチに関して、さらに細かい詳細や差異については今回の本題ではないので、特に触れません。
ここでの問題は、APMにしろITOAにしろ、なぜこれらのIT運用ツールの有無が企業の業績を左右するのかという点にあります。
ITトラブルによるビジネスインパクトの発生原因と対処方法
前回の記事で、ある業種ではアプリケーションのパフォーマンスそのものが他社に勝つための差別化要因であるとご紹介しました。
ITのパフォーマンスが遅いと顧客を逃してしまうということで重要度が増す一方、ITインフラの複雑化と要求パフォーマンスの上昇が同時に起きたことで、IT運用部門は大きな負担を強いられています。
よくある問題の一例として、IT運用部門で様々な役割を担うスペシャリスト達が、「サポート&メンテナンス」の名目でトラブル対応の火消しとして長時間駆り出され、パフォーマンスの改善(ボトルネックの特定、解消など)に時間を割けないことが挙げられます。
最もトラブルの起きやすいタイミングはシステムの変更時です。それをよく知るIT運用部門は綿密な計画を立て、アプリケーションのデプロイやインフラの更新を慎重に進めています。しかし緊急の修正プログラムのリリース、その他計画外の不正な変更や作業者の設定ミスなどがIT部門の努力を台無しにしています。
こうして起こる、予期しないITのトラブルやスローダウンがもたらす損失は、IT運用部門だけに留まりません。
ITに依存するビジネス・サービスに影響が出るのはもちろん、IT部門のメンバーが市場や企業戦略の要求に応える新しい技術を習得し、イノベーションを生み出すために使われるべき時間も奪われており、企業が成長する機会も逸していると言えます。
最善の解決策は、早急にこの受け身のサイクルを破壊することです。
予防的な活動によってトラブルやパフォーマンスボトルネックを引き起こす可能性のある状態を早期に検知し、早期に解決する体制を整えることが重要になります。
こうした問題を解決するために活用されているのがAPMやITOAです。
APMやITOAを目的とした監視ツールは、管理者に代わって全ての監視対象からアプリケーションパフォーマンスに関するメトリクスやボトルネックの発生している個所を網羅的に把握することができ、トラブルの予兆が見られる箇所はさらに詳しく、多面的な情報で調査することができます。
その結果得られる最大のメリットは、ITシステムに起因するビジネスリスクの効果的な予防と解決が可能になることです。
調査結果におけるビジネスの成否をわける要因が、監視ツールの有無=火種を早期に発見して対処できるIT部門と、火消しに掛かりきりのIT部門の差、とすればその重要性もうなずけるのではないでしょうか。
システムが複雑化したIT環境においては、これらのテクノロジを用いて、ありふれた日常のIT運用業務を自動化することが、予防的な活動の第一歩となります。
まとめ
2015 IT Operations Analytics Surveyでは、ITトラブルによるビジネスインパクトを回避することができる傾向にあるのは、ITOAツールを導入した企業に多いという結果がでていました。
APMやITOAを導入済みの企業では、受け身のサイクル改善にいち早く取組み、ビジネス機会を逸することによる損失を解消することができたのが大きな要因と思われます。APM、ITOAを用いたIT運用の自動化は、IT運用管理者が自分の環境で何が起こっているか把握するための助けとなります。
これはIT運用チームが技術的なイノベーションと新しいアプリケーションの展開に注力し、ビジネスの成功に貢献するための第一歩です。
CloudTriageは、APMとしてエンドユーザーエクスペリエンスに基づいたアプリケーションパフォーマンスの計測、そしてRoot Cause Analysis の2つを提供するクラウドサービスです。
今回の記事でこれらに興味をお持ちになりましたら、是非以下もご覧ください
システム視点ではなくユーザー視点の体感品質で確認
どんなアプリケーションでも体感品質を確認でき、ユーザーが体感している品質をフィードバックするためのクラウドサービス
パフォーマンスボトルネックを特定し、改善ポイントを提示
アプリケーションだけでなく、仮想基盤・データベース・ネットワークなどのインフラも含めたボトルネックを特定し、End to Endのパフォーマンス改善を実現するためのクラウドサービス
関連資料・おすすめのコンテンツ・人気の動画 など
-
2016.05.25
Japan IT Week に出展!~サイト表示速度レポートは大好評~
私達は5月11日~13日、東京ビッグサイトで開かれたJapan IT Week 2016に出展しました。会場の様子やトレンドを感じていただけるよう、ブースで回収したアンケート結果から一部をご紹介します。
パフォーマンスモニタリング
-
2016.02.17
ユーザーエクスペリエンス(UX)の管理で忘れてはならない3つのこと
自社のサービスの評価としてユーザーエクスペリエンス(UX)に注目が集まっていますが、UXの管理で忘れてはならない3つの要素があります。今回はこの要素にスポットを当て、ビジネスを成長させるUXについて考察します。
QoE
-
2016.02.04
実践!アプリケーションパフォーマンス管理の5ステップ
前回、アプリケーションパフォーマンスが各国企業の業績を左右する課題であること。そしてAPMの5つの分析ステップを紹介しました。 今回は実践編としてCloudTriageを使い、各ステップの要点を解説します。
パフォーマンスモニタリング