historia de éxito

Almacenamiento de datos a escala empresarial

Cómo un líder del sector automovilístico automatizó la ingestión, la gobernanza y la obtención de información con Databricks Lakehouse

challenge_icon
el desafío

La organización se enfrentaba a complejos procesos manuales de gestión de datos que eran difíciles de escalar y costosos de mantener. Querían eliminar los cuellos de botella y garantizar una calidad de datos constante para impulsar una toma de decisiones rápida y eficaz. Necesitaban una solución moderna que incorporara nuevos conjuntos de datos con un esfuerzo de desarrollo mínimo, al tiempo que cumpliera con las medidas de cumplimiento y gobernanza.

process_icon
la solución

Nagarro ayudó al cliente a modernizar su plataforma de datos empresarial utilizando Databricks Lakehouse. Aprovechamos un marco flexible basado en PySpark para automatizar la ingesta y validación de datos en todos los dominios. Delta Live Tables facilitó la carga de datos en Delta Lake con controles de calidad integrados y canalizaciones de datos inteligentes y con autocorrección. Los paneles intuitivos permitieron a todos los usuarios revisar los datos, mientras que Unity Catalog garantizó la gobernanza, la seguridad y el linaje. La arquitectura Medallion organizó los datos en capas sin procesar, limpias y listas para su uso empresarial. La computación sin servidor redujo los costes de infraestructura, lo que hizo que la solución fuera escalable, gobernada y rentable. 

solution_icon
el resultado

Esta implementación automatizó la ingesta, validación y curación a gran escala, lo que dio como resultado datos más rápidos, limpios y fiables. Databricks Workflows redujo el tiempo de ejecución de los procesos en un 60 %, lo que aceleró significativamente la obtención de información. Con un enfoque basado en la configuración, el cliente eliminó la necesidad de desarrollo personalizado al incorporar nuevos conjuntos de datos, lo que permitió una escalabilidad rápida y sin código, y una incorporación 10 veces más rápida. Ahora los usuarios pueden acceder a los datos por su cuenta, lo que les da más independencia. La plataforma ofrece datos de alta calidad con un seguimiento completo de los cambios en los datos y una visibilidad clara de la fuente. También redujo los costes informáticos en un 30 %.