historia de éxito

JSM Premium y Opsgenie revolucionan la gestión de incidentes

Optimización de las operaciones de TI: de la sobrecarga de alertas a un centro de mando unificado
challenge_icon
el desafío
Nuestro cliente, una destacada empresa europea de juegos en línea, se enfrentó a un gran reto cuando tuvo que gestionar un gran número de correos electrónicos de alerta procedentes de múltiples herramientas de supervisión, concretamente Prometheus, Splunk, Apica y otras. Esta avalancha de alertas dificultaba su capacidad para filtrarlas y priorizarlas de manera eficiente. Este problema también afectaba a su capacidad para procesar eficazmente la información crítica, lo que provocaba una prolongación de los tiempos de resolución de incidencias. La ausencia de informes completos, junto con las dificultades para realizar un seguimiento de la disponibilidad del equipo y centralizar la respuesta a las incidencias, agravó la situación y puso de relieve la necesidad de una solución ITSM más optimizada.
process_icon
la solución
Para mejorar la eficiencia en la respuesta ante incidentes, integramos más de siete herramientas de supervisión con Opsgenie, el sistema de gestión de incidentes de JSM DC, mediante un OEC (Opsgenie Edge Connector) personalizado basado en Python. Esta integración permitió a Opsgenie consolidar las alertas procedentes de múltiples fuentes, lo que agilizó los flujos de trabajo y redujo los tiempos de resolución de incidentes. Además, se automatizó la asignación de personal de respuesta mediante turnos de guardia, lo que garantizó una cobertura las 24 horas del día. Las capacidades de generación de informes de Opsgenie facilitaron un análisis práctico y completo de las métricas de incidentes, lo que fomentó la responsabilidad y promovió la mejora continua. Dos años más tarde, optimizamos aún más nuestra solución migrándola de JSM DC a JSM Cloud Premium, lo que mejoró su eficiencia y escalabilidad.
solution_icon
el resultado

La implementación de la solución de gestión de alertas e incidentes Opsgenie revolucionó el enfoque de la gestión de incidentes, lo que dio lugar a un entorno más eficiente y colaborativo. Al centralizar los procedimientos de respuesta a incidentes, el cliente observó lo siguiente:

  • Una reducción significativa en la frecuencia y el volumen de incidentes, como resultado de un enfoque más proactivo para abordar los problemas.
  • Una mejora notable en la resolución rápida y eficaz de los problemas, lo que se traduce en una mayor fiabilidad del servicio.
  • Un aumento significativo de la eficiencia, la racionalización de los flujos de trabajo y la optimización de la asignación de recursos.

Esto también fomentó una mayor colaboración en equipo, lo que garantizó una respuesta más coordinada ante incidentes críticos gracias a los mecanismos de escalado de Opsgenie.