Event Scanner: gobernanza de eventos y reducción de costos en data analytics
Sector
Servicios financieros
Desafío
La operación procesaba un enorme volumen de eventos, pero sin suficiente gobernanza sobre lo que realmente era útil para el negocio. El resultado era un aumento de costos en la nube, el empeoramiento del desempeño analítico y la falta de claridad sobre la calidad de la recopilación de datos en un entorno descentralizado.
Resultados
El proyecto identificó que el 60 % de los datos ingresados eran ruido operativo, proyectó un ahorro anual de 500 mil reales al corregir las principales fuentes de error y redujo entre un 25 % y un 30 % el tiempo de procesamiento y consulta.
Producto clave
Event Scanner
"No todos los datos amplían la inteligencia. En operaciones grandes, parte de ellos solo aumenta el costo, el ruido y la latencia. El trabajo consistió en devolver criterio sobre lo que realmente merece ser recopilado."
Head de Martech y Gobernanza de Datos
Servicios financieros
Contexto
La operación pertenece a un banco con un volumen substancial de eventos digitales y múltiples squads actuando sobre jornadas y canales. Con cientos de squads implementando eventos a lo largo del tiempo, la operación había acumulado una cantidad creciente de recopilaciones fuera de la taxonomía oficial y con baja trazabilidad. Se pagaba más caro para ver cada vez menos.
El costo del ruido a escala
Tres efectos ocurrían de forma simultánea:
(1) Financiero: el uso de GCP crecía impulsado por la ingesta de datos innecesarios;
(2) Analítico: en GA4, el exceso de cardinalidad aumentaba el sampling o muestreo, de modo que la información se agrupaba en categorías genéricas;
(3) Operativo: consultas más lentas y un mayor esfuerzo de ingeniería para navegar en una base aumentada.
Auditar, comparar y bloquear
MATH estructuró el Event Scanner para comparar de forma automatizada el mapa de recopilación planificado con los datos efectivamente ingresados. El primer frente fue la auditoría automatizada comparando lo planificado con lo real. El segundo fue la aplicación de IA para catalogar y reconocer los patrones en URLs dinámicas y nombres variables. El tercero fue preventivo, con un bloqueo en el origen de los eventos fuera de la taxonomía antes de que se convirtieran en costos recurrentes.
Qué salió de la base y qué volvió al negocio
La identificación de los cinco eventos fuera de la taxonomía con mayor volumen inmediatamente permitió proyectar un ahorro anual de R$ 500 mil. La operación redujo entre un 25% y un 30% el tiempo de procesamiento y consulta. El GA4 dejó de sufrir con el mismo nivel de sampling. Saber que el 60% de los datos ingresados funcionaban como ruido cambió la lógica de la operación, de modo que la recopilación de datos pasó a ser una opción y no una acumulación.
Casos de éxito relacionados
Lighthouse Insights: Banco con operación digital orientada al desempeño
Modernización: gobernanza de datos y mitigación de riesgo en seguros
