Lead Scoring: inteligência preditiva para eficiência de captação
Industry
Education
Challenge
A operação comercial lidava com grande volume de oportunidades sem priorização suficiente, incluindo leads de eventos e interações de baixo sinal acadêmico. Isso elevava o custo operacional, dificultava a escalabilidade do atendimento e mantinha a comunicação presa a uma lógica massiva.
Results
O projeto validou um modelo em que 95% dos leads classificados como alta propensão efetivamente converteram no estágio crítico do funil. Também aumentou a capacidade de filtrar ruído na base e direcionar recursos comerciais e de CRM para contatos com maior probabilidade de retorno.
Arquitetura de lead scoring com modelos preditivos integrados ao CRM
lead scoring, CRM
“O ponto central não era aumentar a pressão comercial. Era saber onde existia probabilidade real de matrícula antes de consumir energia da operação.”
Diretora de Captação e CRM
Educação
Captação em escala pede leitura mais precisa
A operação pertence a um grupo de ensino superior com alta volumetria de leads, múltiplas origens de aquisição e forte dependência de CRM para sustentar relacionamento, qualificação e matrícula. Nesse contexto, volume por si só não resolve o problema. Sem leitura de propensão, a operação comercial tende a desperdiçar esforço com contatos de baixo valor.
Em ambientes de captação complexos, eficiência não depende apenas de gerar demanda. Depende de distinguir, com rapidez e consistência, quem tem sinal real de avanço no funil e quem apenas ampliou o ruído da base.
Quando o funil cresce mais do que a inteligência sobre ele
O problema central não era falta de leads. Era excesso de ruído misturado a sinais de intenção muito distintos.
A operação recebia contatos de diferentes fontes, incluindo campanhas, eventos e interações de conveniência, como login de Wi-Fi. Na prática, todos esses registros entravam no funil com peso parecido, mesmo quando a intenção acadêmica era baixa ou inexistente. Isso empurrava para o time de vendas uma massa de oportunidades sem priorização suficiente.
O custo desse desenho aparecia primeiro no esforço humano. A equipe comercial precisava investir horas em contatos improdutivos, reduzindo o tempo disponível para quem realmente apresentava chance de conversão. O segundo problema estava na fragmentação dos dados. Havia informações demográficas, comportamentais e de mídia, mas a integração insuficiente entre essas camadas limitava a construção de uma visão única do lead.
O time comercial já operava com algumas lógicas de priorização, como foco em D0. Ainda assim, a presença de muitas oportunidades pouco qualificadas diminuía a precisão dessa rotina e dificultava escalar atendimento com eficiência. O gargalo, portanto, não estava em trazer mais gente para o funil, mas em encontrar o sinal comercial dentro de uma base ruidosa.
Modelos para separar intenção de volume
A resposta foi substituir a lógica de tratamento massivo por uma arquitetura preditiva orientada à decisão.
A MATH estruturou uma solução de lead scoring em dois estágios para atacar pontos distintos do funil. O primeiro modelo foi desenhado para qualificar a passagem de leads para inscritos, atuando sobre o topo e o meio do funil, onde o volume era maior e o ruído mais intenso. O segundo foi dedicado ao estágio crítico entre inscritos e matrícula, onde a precisão de priorização tem efeito direto sobre conversão e alocação de esforço comercial.
A construção técnica priorizou modelos estatísticos robustos para cenários com muito ruído e evento de conversão relativamente raro. Foram testados diferentes algoritmos, incluindo regressão logística e random forest, mas os melhores desempenhos vieram com modelos como XGBoost, LightGBM e CatBoost, mais adequados para capturar relações complexas entre comportamento, origem e propensão.
O projeto também avançou em feature engineering. Em vez de depender apenas de dados cadastrais, a solução incorporou variáveis comportamentais e sinais de engajamento mais próximos da intenção real. Entre eles, intensidade recente de navegação, recência de interação, tempo entre aberturas de e-mail, associação com cursos mais demandados e histórico de impacto de mídia paga. Isso permitiu diferenciar melhor curiosidade superficial de comportamento com maior potencial de avanço.
A arquitetura foi integrada ao ecossistema operacional, incluindo Salesforce Marketing Cloud e Databricks, para que o score alimentasse as réguas de comunicação em tempo real. A operação deixou de depender de campanhas homogêneas e passou a tratar a base conforme a propensão indicada pelo modelo.
Além disso, a solução foi acompanhada por dashboards de monitoramento contínuo. Se a performance do modelo caísse ou o pipeline apresentasse falha, o sistema emitia alertas e acionava rotinas de reprocessamento, reduzindo o risco de a operação perder visibilidade sobre a qualidade da predição.
O ganho do projeto veio da mudança de lógica: o CRM deixou de reagir ao volume da base e passou a responder à probabilidade de retorno.
O que passou a valer mais do que volume
O efeito mais evidente do projeto apareceu na precisão comercial. No modelo de inscritos para matrícula, 94,02% de precisão no deploy significou, na prática, que 95% dos leads classificados como alta propensão efetivamente converteram. Isso alterou a lógica de alocação de esforço da operação. O time deixou de tratar indiscriminadamente a base e passou a concentrar energia onde havia probabilidade real de retorno.
No modelo de leads para inscritos, a precisão de 61% permitiu filtrar parte relevante do ruído antes que ele se transformasse em custo de atendimento. Esse ponto é importante porque a eficiência não veio apenas do fechamento de fundo de funil. Ela começou na capacidade de reduzir desperdício ainda nas primeiras etapas da jornada.
Houve também um efeito cultural. A confiança nos modelos permitiu que a diretoria de captação saísse de uma estratégia baseada em disparos massivos e migrasse para um uso mais seletivo do CRM. A comunicação deixou de seguir uma lógica uniforme e passou a responder ao score atribuído a cada lead.
Na prática, a base passou a ser tratada em três grupos de propensão: alta, média e baixa. Isso organizou melhor o esforço do time comercial, protegeu margem operacional e tornou o CRM mais aderente ao potencial real de cada contato.
O projeto não trouxe valor por “automatizar mensagens”. Trouxe valor por reorganizar a forma como a operação entende quem merece atenção primeiro.
