Como rodar um geo lift test no Brasil: o guia prático

O geo lift virou o padrão-ouro da medição causal por um motivo simples: é o único método robusto que sobrou de pé quando o rastreamento individual desmoronou.

Não precisa de cookie, não precisa de consentimento, não pede permissão para a plataforma de mídia e mede o efeito nas vendas reais do backoffice, não na conversão que o pixel enxergou. A mídia liga ou desliga em algumas regiões, o resto do país serve de contrafactual, e a diferença conta a verdade.

O problema: o desenho que funciona nos papers americanos tropeça na realidade brasileira. Concentração absurda de vendas no Sudeste, mídia que não respeita fronteira de município, sazonalidade regional e dados de venda que nem sempre têm CEP confiável. Este guia é o desenho adaptado para cá.

O que é um geo lift test?

Geo lift é um experimento em que a unidade de teste é a região geográfica: um grupo de cidades ou estados recebe o tratamento (campanha ligada, verba aumentada ou mídia desligada) enquanto regiões comparáveis seguem na rotina, servindo de controle.

O efeito incremental é a diferença entre as vendas observadas nas regiões de teste e o contrafactual: a estimativa do que essas regiões teriam vendido sem a intervenção, construída a partir do comportamento histórico das regiões de controle, geralmente por controle sintético.

Duas direções possíveis, e a segunda é subutilizada:

•Teste de ativação: ligar mídia nova (ou verba extra) em regiões selecionadas. Responde "esse canal gera venda incremental?"
•Teste de pausa (blackout): desligar um canal existente em regiões selecionadas. Responde "o que eu perco se parar?", e é o desenho clássico para julgar branded search e remarketing.

O desenho em 7 passos

1. Defina a pergunta e a métrica de resposta

Uma pergunta por teste. "O TikTok gera venda incremental?" é uma pergunta. "Como está nossa mídia?" não é. A métrica de resposta é venda do backoffice na granularidade regional, nunca a conversão atribuída da plataforma, que é justamente o número sob suspeita.

Pré-requisito duro: a venda regionalizada precisa ser confiável. Operação com discrepância estrutural entre plataforma e analytics mede fantasma.

2. Escolha a unidade geográfica

As opções no Brasil, em ordem de praticidade:

•Regiões metropolitanas e municípios grandes: a unidade padrão. Volume suficiente, segmentação disponível nas plataformas.
•Estados: unidades demais concentradas em poucas: SP sozinho pode passar de um terço da venda. Útil para mídia que só segmenta por estado (parte do offline).
•DDD: proxy útil quando a operação organiza dados por telefone, com a vantagem de recortar estados grandes.

A restrição que manda: a unidade precisa existir tanto na segmentação da mídia quanto no seu dado de venda. Desenho lindo que a plataforma não consegue segmentar é papel.

3. Selecione teste e controle com método, não com opinião

O erro clássico é escolher "cidades parecidas" no olho. O método é estatístico: séries históricas de venda por região (idealmente 12 meses ou mais), seleção de mercados de teste cujo comportamento é bem replicável pela combinação dos demais, e construção do controle sintético.

A ferramenta aberta mais usada é o GeoLift, da Meta, que automatiza a seleção de mercados, a simulação de potência e a leitura por controle sintético. Origem na vendedora de mídia, mesma regra de sempre: metodologia pública, uso legítimo, leitura crítica.

Armadilha brasileira número um: deixar São Paulo no grupo de teste. Regiões gigantes são difíceis de replicar sinteticamente e sequestram o experimento. O desenho robusto usa mercados médios no teste e deixa os gigantes ancorando o controle.

4. Calcule a potência antes de gastar um real

A simulação responde a pergunta que define se o teste vale a pena: com esses mercados, esse volume e esse ruído histórico, qual o efeito mínimo detectável (MDE)?

Se a simulação diz que você só detecta lift acima de 15% e a expectativa realista do canal é 5%, o teste nasce morto. As saídas: mais regiões, mais tempo, mais verba de tratamento, ou a decisão honesta de não testar agora.

5. Congele a operação por escrito

O teste morre mais por indisciplina do que por estatística. Antes de ligar:

•Nenhuma alteração de campanha, lance ou verba nas regiões do experimento durante a janela.
•Nenhuma promoção regional, ação de trade ou disparo de CRM segmentado que atinja teste e controle de forma desigual.
•Um documento assinado por mídia, comercial e CRM com as datas e as regras. Parece burocracia; é o seguro do investimento inteiro.

Contaminação típica no Brasil: frete grátis regional decidido pelo comercial na segunda semana do teste. Aconteceu, invalida, recomeça.

6. Rode o tempo desenhado, não o tempo da ansiedade

Janela típica: 4 a 8 semanas de tratamento, mais o período pós-teste para capturar efeito residual (adstock). Olhar o resultado na primeira semana e "já tomar decisão" é a versão experimental de abrir o forno a cada dois minutos.

7. Leia com intervalo, decida com contexto

O resultado sério vem com intervalo de confiança e análise de robustez, não com um número seco. Lift de 8% com intervalo de 2% a 14% sustenta decisão; lift de 3% com intervalo cruzando o zero é "não detectado", o que não é o mesmo que "não existe": pode ser potência insuficiente.

E o destino final do número: além da decisão imediata do canal, o resultado calibra o MMM como prior, multiplicando o valor do experimento.

As particularidades brasileiras em resumo

•Concentração: SP e RJ dominam a venda; mantenha-os no controle e teste em mercados médios.
•Vazamento geográfico: e-commerce entrega em todo lugar, e mídia digital respeita mal as bordas. Prefira regiões afastadas entre si e monitore venda de fronteira.
•Sazonalidade regional: datas e clima batem diferente por região; o histórico longo no controle sintético é o que absorve isso.
•Qualidade do dado regional: antes de tudo, audite se o CEP/estado do pedido é confiável na sua base. Sem geografia limpa no dado de venda, não há geo teste.

Como a Métricas Boss roda geo lifts?

A Métricas Boss desenha e opera geo lifts de ponta a ponta: auditoria da venda regionalizada, seleção estatística de mercados, simulação de potência com MDE, governança do congelamento operacional, leitura por controle sintético e integração do resultado na decisão de orçamento e na calibração do MMM.

Se existe um canal na sua operação que todo mundo defende e ninguém nunca testou, conheça o que a Métricas Boss faz.

Perguntas frequentes sobre geo lift no Brasil

O que é um geo lift test? É um experimento que liga ou desliga mídia em regiões selecionadas e compara as vendas com um contrafactual construído a partir de regiões de controle, medindo o efeito causal do investimento sem depender de rastreamento individual.

Quantas regiões preciso para um geo lift? Depende do volume e do ruído das séries de venda. Como referência, desenhos robustos costumam usar de 3 a 10 mercados de teste com o restante do país compondo o controle sintético; a resposta definitiva sai da simulação de potência, nunca de regra de bolso.

Quanto tempo dura um geo lift test? Tipicamente 4 a 8 semanas de tratamento, além do período pós-teste para efeito residual. Vendas de ciclo longo ou efeitos pequenos pedem janelas maiores.

Posso usar o GeoLift da Meta sendo uma ferramenta de quem vende mídia? Pode e é prática de mercado: a metodologia é aberta e auditável. A leitura crítica é a mesma exigida de qualquer ferramenta com origem em vendedor de mídia: entender as escolhas metodológicas antes de aceitar o resultado.

Geo lift funciona para desligar branded search? É o desenho clássico para essa pergunta: pausar o branded em regiões de teste e medir o que a venda total realmente perde, separando o que o orgânico absorve do que era incremental do anúncio.

O que invalida um geo lift? Promoções regionais no meio da janela, mudanças de campanha não combinadas, escolha de mercados no olho, potência insuficiente e dado de venda sem geografia confiável. A maioria das mortes é operacional, não estatística.

Gustavo Esteves

Gustavo Esteves é fundador e CEO da Métricas Boss, já trabalhou dentro de gigantes como B2W. Autoridade na área de Digital Analytics, com mais de 15 anos de experiência e 3 mil projetos atendidos, incluindo gigantes como PUC, Rede D'Or, Globo, Stanley, Médico Sem Fronteiras, Alura, entre outras.

Publicado em 5 de julho de 2026