Skip to content

Lead Scoring: inteligência preditiva para eficiência de captação

Gemini_Generated_Image_afaup8afaup8afau

Industry

Education

Challenge

A operação comercial lidava com grande volume de oportunidades sem priorização suficiente, incluindo leads de eventos e interações de baixo sinal acadêmico. Isso elevava o custo operacional, dificultava a escalabilidade do atendimento e mantinha a comunicação presa a uma lógica massiva.

Results

O projeto validou um modelo em que 95% dos leads classificados como alta propensão efetivamente converteram no estágio crítico do funil. Também aumentou a capacidade de filtrar ruído na base e direcionar recursos comerciais e de CRM para contatos com maior probabilidade de retorno.

Arquitetura de lead scoring com modelos preditivos integrados ao CRM

lead scoring, CRM

95%
Conversão dos leads no fundo de funil
94%
Precisão no deploy de inscritos para matrícula
61%
Precisão de leads que avançariam para inscrição
3 faixas
Base segmentada em alta, média e baixa propensão

“O ponto central não era aumentar a pressão comercial. Era saber onde existia probabilidade real de matrícula antes de consumir energia da operação.”

Diretora de Captação e CRM

Educação

Gemini_Generated_Image_afaup8afaup8afau

Captação em escala pede leitura mais precisa

A operação pertence a um grupo de ensino superior com alta volumetria de leads, múltiplas origens de aquisição e forte dependência de CRM para sustentar relacionamento, qualificação e matrícula. Nesse contexto, volume por si só não resolve o problema. Sem leitura de propensão, a operação comercial tende a desperdiçar esforço com contatos de baixo valor.

Em ambientes de captação complexos, eficiência não depende apenas de gerar demanda. Depende de distinguir, com rapidez e consistência, quem tem sinal real de avanço no funil e quem apenas ampliou o ruído da base.

 Quando o funil cresce mais do que a inteligência sobre ele 

O problema central não era falta de leads. Era excesso de ruído misturado a sinais de intenção muito distintos.

A operação recebia contatos de diferentes fontes, incluindo campanhas, eventos e interações de conveniência, como login de Wi-Fi. Na prática, todos esses registros entravam no funil com peso parecido, mesmo quando a intenção acadêmica era baixa ou inexistente. Isso empurrava para o time de vendas uma massa de oportunidades sem priorização suficiente.

O custo desse desenho aparecia primeiro no esforço humano. A equipe comercial precisava investir horas em contatos improdutivos, reduzindo o tempo disponível para quem realmente apresentava chance de conversão. O segundo problema estava na fragmentação dos dados. Havia informações demográficas, comportamentais e de mídia, mas a integração insuficiente entre essas camadas limitava a construção de uma visão única do lead.

O time comercial já operava com algumas lógicas de priorização, como foco em D0. Ainda assim, a presença de muitas oportunidades pouco qualificadas diminuía a precisão dessa rotina e dificultava escalar atendimento com eficiência. O gargalo, portanto, não estava em trazer mais gente para o funil, mas em encontrar o sinal comercial dentro de uma base ruidosa.

 Modelos para separar intenção de volume 

A resposta foi substituir a lógica de tratamento massivo por uma arquitetura preditiva orientada à decisão.

A MATH estruturou uma solução de lead scoring em dois estágios para atacar pontos distintos do funil. O primeiro modelo foi desenhado para qualificar a passagem de leads para inscritos, atuando sobre o topo e o meio do funil, onde o volume era maior e o ruído mais intenso. O segundo foi dedicado ao estágio crítico entre inscritos e matrícula, onde a precisão de priorização tem efeito direto sobre conversão e alocação de esforço comercial.

A construção técnica priorizou modelos estatísticos robustos para cenários com muito ruído e evento de conversão relativamente raro. Foram testados diferentes algoritmos, incluindo regressão logística e random forest, mas os melhores desempenhos vieram com modelos como XGBoost, LightGBM e CatBoost, mais adequados para capturar relações complexas entre comportamento, origem e propensão.

O projeto também avançou em feature engineering. Em vez de depender apenas de dados cadastrais, a solução incorporou variáveis comportamentais e sinais de engajamento mais próximos da intenção real. Entre eles, intensidade recente de navegação, recência de interação, tempo entre aberturas de e-mail, associação com cursos mais demandados e histórico de impacto de mídia paga. Isso permitiu diferenciar melhor curiosidade superficial de comportamento com maior potencial de avanço.

A arquitetura foi integrada ao ecossistema operacional, incluindo Salesforce Marketing Cloud e Databricks, para que o score alimentasse as réguas de comunicação em tempo real. A operação deixou de depender de campanhas homogêneas e passou a tratar a base conforme a propensão indicada pelo modelo.

Além disso, a solução foi acompanhada por dashboards de monitoramento contínuo. Se a performance do modelo caísse ou o pipeline apresentasse falha, o sistema emitia alertas e acionava rotinas de reprocessamento, reduzindo o risco de a operação perder visibilidade sobre a qualidade da predição.

 O ganho do projeto veio da mudança de lógica: o CRM deixou de reagir ao volume da base e passou a responder à probabilidade de retorno. 

 O que passou a valer mais do que volume 

O efeito mais evidente do projeto apareceu na precisão comercial. No modelo de inscritos para matrícula, 94,02% de precisão no deploy significou, na prática, que 95% dos leads classificados como alta propensão efetivamente converteram. Isso alterou a lógica de alocação de esforço da operação. O time deixou de tratar indiscriminadamente a base e passou a concentrar energia onde havia probabilidade real de retorno.

No modelo de leads para inscritos, a precisão de 61% permitiu filtrar parte relevante do ruído antes que ele se transformasse em custo de atendimento. Esse ponto é importante porque a eficiência não veio apenas do fechamento de fundo de funil. Ela começou na capacidade de reduzir desperdício ainda nas primeiras etapas da jornada.

Houve também um efeito cultural. A confiança nos modelos permitiu que a diretoria de captação saísse de uma estratégia baseada em disparos massivos e migrasse para um uso mais seletivo do CRM. A comunicação deixou de seguir uma lógica uniforme e passou a responder ao score atribuído a cada lead.

Na prática, a base passou a ser tratada em três grupos de propensão: alta, média e baixa. Isso organizou melhor o esforço do time comercial, protegeu margem operacional e tornou o CRM mais aderente ao potencial real de cada contato.

O projeto não trouxe valor por “automatizar mensagens”. Trouxe valor por reorganizar a forma como a operação entende quem merece atenção primeiro.

Sua operação ainda trata todos os leads como se tivessem o mesmo valor?