Saltar al contenido

Event Scanner: gobernanza de eventos y reducción de costos en data analytics

Gemini_Generated_Image_3wey8v3wey8v3wey

Sector

Servicios financieros

Desafío

La operación procesaba un enorme volumen de eventos, pero sin suficiente gobernanza sobre lo que realmente era útil para el negocio. El resultado era un aumento de costos en la nube, el empeoramiento del desempeño analítico y la falta de claridad sobre la calidad de la recopilación de datos en un entorno descentralizado.

Resultados

El proyecto identificó que el 60 % de los datos ingresados eran ruido operativo, proyectó un ahorro anual de 500 mil reales al corregir las principales fuentes de error y redujo entre un 25 % y un 30 % el tiempo de procesamiento y consulta.

Producto clave

Event Scanner

60%
de los datos identificados como ruido operativo
R$500k
Ahorro generado con la corrección de los principales ofensores
25-30%
Reducción en el tiempo de procesamiento y consulta
Identificación de los 5 principales factores responsables de costos relevantes y evitables

"No todos los datos amplían la inteligencia. En operaciones grandes, parte de ellos solo aumenta el costo, el ruido y la latencia. El trabajo consistió en devolver criterio sobre lo que realmente merece ser recopilado."

Head de Martech y Gobernanza de Datos

Servicios financieros

Gemini_Generated_Image_t51n0vt51n0vt51n

Contexto

La operación pertenece a un banco con un volumen substancial de eventos digitales y múltiples squads actuando sobre jornadas y canales. Con cientos de squads implementando eventos a lo largo del tiempo, la operación había acumulado una cantidad creciente de recopilaciones fuera de la taxonomía oficial y con baja trazabilidad. Se pagaba más caro para ver cada vez menos.

El costo del ruido a escala

Tres efectos ocurrían de forma simultánea:

(1) Financiero: el uso de GCP crecía impulsado por la ingesta de datos innecesarios;

(2) Analítico: en GA4, el exceso de cardinalidad aumentaba el sampling o muestreo, de modo que la información se agrupaba en categorías genéricas;

(3) Operativo: consultas más lentas y un mayor esfuerzo de ingeniería para navegar en una base aumentada.

Auditar, comparar y bloquear

MATH estructuró el Event Scanner para comparar de forma automatizada el mapa de recopilación planificado con los datos efectivamente ingresados. El primer frente fue la auditoría automatizada comparando lo planificado con lo real. El segundo fue la aplicación de IA para catalogar y reconocer los patrones en URLs dinámicas y nombres variables. El tercero fue preventivo, con un bloqueo en el origen de los eventos fuera de la taxonomía antes de que se convirtieran en costos recurrentes.

Qué salió de la base y qué volvió al negocio

La identificación de los cinco eventos fuera de la taxonomía con mayor volumen inmediatamente permitió proyectar un ahorro anual de R$ 500 mil. La operación redujo entre un 25% y un 30% el tiempo de procesamiento y consulta. El GA4 dejó de sufrir con el mismo nivel de sampling. Saber que el 60% de los datos ingresados funcionaban como ruido cambió la lógica de la operación, de modo que la recopilación de datos pasó a ser una opción y no una acumulación.

¿Tu empresa sabe distinguir entre datos valiosos y datos costosos?