成功事例

JSM PremiumとOpsgenieは、インシデント管理を革新します。

IT運用の効率化:アラート過多から統合型指揮センターへ
challenge_icon
課題
当社のクライアントである欧州の主要なオンラインゲーム企業は、Prometheus、Splunk、Apicaなど複数の監視ツールから大量のアラートメールを管理する必要に直面し、重大な課題に直面しました。このアラートの急増は、効率的にアラートを分類し優先順位を付ける能力を妨げました。この問題は、重要な情報を効果的に処理する能力にも影響を及ぼし、インシデントの解決に要する時間を延長させました。包括的なレポートの欠如に加え、チームのリソース状況の追跡やインシデント対応の集中管理が困難だったことが、状況をさらに悪化させ、より効率的なITSMソリューションの必要性を浮き彫りにしました。
process_icon
解決策
インシデント対応の効率化を図るため、私たちはPythonベースのカスタム構築されたOEC(Opsgenie Edge Connector)を通じて、JSM DC内のインシデント管理システムであるOpsgenieに7つを超えるモニタリングツールを統合しました。この統合により、Opsgenieは複数のソースからのアラートを統合し、ワークフローを効率化するとともに、インシデント解決時間を短縮することが可能になりました。さらに、オンコールスケジュールを活用してレスポンダーの割り当てを自動化することで、24時間体制の対応を保証しました。Opsgenieのレポート機能は、インシデントメトリクスの実行可能な包括的な分析を可能にし、責任の明確化と継続的な改善を促進しました。2年後、私たちはソリューションをJSM DCからJSM Cloud Premiumに移行することで、その効率性とスケーラビリティをさらに最適化しました。
solution_icon
結果

Opsgenieのアラートとインシデント管理ソリューションの導入は、インシデント対応のアプローチを根本から変革し、より効率的で協業的な環境を実現しました。インシデント対応手順を中央集約化することで、クライアントは以下の成果を実感しました:

  • 問題への対応をより積極的なアプローチに切り替えることで、事故の発生頻度と規模に著しい減少が見られました。
  • 問題の迅速かつ効果的な解決における顕著な改善により、サービス信頼性が向上しました。
  • 効率の大幅な向上、業務プロセスの効率化、およびリソース配分の最適化。

これにより、チーム間の協業がさらに促進され、Opsgenieのエスカレーション機能を活用することで、緊急事態への対応がより連携のとれたものとなりました。