Índice
- •Growth, dados, CRO: três nomes para a mesma pessoa sobrecarregada
- •Por que reduzir CRO a teste A/B é prejudicial para o setor
- •O teste A/B sozinho não escala, e o mercado finge que não sabe disso
- •80% dos experimentos falham. Isso não é o problema
- •As duas métricas que provam o valor de CRO para o negócio
- •Quem deveria mandar no roadmap: produto ou experimentação?
- •IA em CRO: onde funciona e onde é só discurso de palco
- •Bate-bola: o que perguntamos e o que Marcola respondeu sem pensar
- •Como a Métricas Boss ajuda a estruturar isso
- •FAQ
1. Growth, dados, CRO: três nomes para a mesma pessoa sobrecarregada
Hoje é raro encontrar uma empresa que admita não ter growth, não ter dados, não ter CRO. O problema aparece quando você cava um pouco mais fundo: não tem nenhum dos três. Tem uma pessoa fazendo um pouco de tudo, rodando testes A/B eventuais só para justificar que "tem alguma coisa acontecendo".
Foi esse o ponto de partida da conversa no episódio 276 do Analytics Talks, gravado durante o Web Summit, com Marco Antônio Cardozo, o Marcola, líder de Growth Digital e responsável pela otimização de jornadas digitais na Claro, além de embaixador da comunidade CRO Brasil. Ele estrutura o framework de experimentação da operadora desde 2018, o que dá ao papo um raro nível de maturidade prática, construída ao longo de oito anos de tentativa e erro em escala nacional.
E o recado central do episódio pode ser resumido assim: CRO não é uma ferramenta que você instala. É uma cultura que você constrói. E a maior parte do mercado ainda está confundindo as duas coisas.
2. Por que reduzir CRO a teste A/B é prejudicial para o setor
Marcola foi direto: chamar CRO de "time de teste A/B" é a mesma redução equivocada que a área de Analytics sofreu anos atrás, quando virou sinônimo de "time que faz relatório". Teste A/B é apenas uma das formas de validar hipótese dentro de CRO. E validar hipótese, na definição que ele defende, é ouvir o cliente de forma estruturada, com dados e fatos, para embasar uma decisão.
Existe uma camada inteira de ferramentas que atua antes, durante e depois do teste A/B, e que o mercado costuma tratar como acessório:
- •Teste de usabilidade e validação de protótipo: falar direto com o cliente, inclusive presencialmente (a Claro já fez isso em loja física e até em estação de metrô).
- •Análise de funil de conversão: cruzando Analytics com gravações de sessão e mapa de calor para achar onde a jornada dispersa.
- •Pesquisa qualitativa ao longo do teste: para entender por que o cliente abandona, não só que ele abandona.
A analogia que resume o argumento: essas ferramentas funcionam como camadas de cebola. Elas entram no Discovery (antes de gerar a hipótese), na validação (durante o teste) e na interpretação (depois do resultado). Tratá-las como opcionais é o motivo pelo qual tanta operação de CRO nasce capenga, só com a ferramenta de teste, sem a camada de investigação que gera hipóteses boas o suficiente para valer o esforço de desenvolvimento.
3. O teste A/B sozinho não escala, e o mercado finge que não sabe disso
Aqui está uma causa técnica que a maioria dos decisores ignora: teste A/B depende de massa de dados para significância estatística, e isso tem prazo. Dependendo do volume de tráfego, um teste pode levar de 30 a 40 dias para produzir um resultado confiável, mesmo abrindo uma amostra generosa, de 50% da audiência.
Marcola contou um caso real de negociação comercial: um cliente reclamou que a proposta de CRO entregava "só dois testes por mês", enquanto ele "já fazia oito". A resposta foi direta: fazer oito testes por mês com volume de tráfego insuficiente é achismo com verniz de dado, disfarçado de método. Sem relevância estatística, o resultado que a ferramenta mostra não passa de opinião com dashboard.
| >Cenário de teste< | >O que geralmente acontece< | >Diagnóstico< |
|---|---|---|
| >Alto volume de tráfego, jornada madura< | >Resultado em 3 a 5 dias< | >Ideal, mas raro< |
| >Volume médio, amostra padrão< | >Resultado em 2 a 4 semanas< | >Realidade da maioria das empresas< |
| >Baixo volume, muitos testes simultâneos "para mostrar produtividade"< | >Resultado sem significância estatística< | >Achismo com verniz de dado< |
O problema não está no teste A/B em si, mas na ilusão de que rodar mais testes, mais rápido, é sinônimo de mais maturidade. Volume de teste sem rigor estatístico sai mais caro do que não testar nada, porque você paga a ferramenta, paga o time e ainda toma decisão errada.
4. 80% dos experimentos falham. Isso não é o problema
Este é o dado mais afiado do episódio: cerca de 80% dos experimentos de CRO terminam inconclusivos ou sem variante vencedora. A maioria das empresas trata esse número como fracasso de time, mas Marcola trata como o núcleo do trabalho. Isso conecta direto com um vício do mercado: só comemora e só publica case quando existe variante vencedora, e ninguém documenta o que não funcionou, o porquê, e o que aquilo ensinou sobre o comportamento do cliente. Comemorar apenas a vitória e ignorar o aprendizado é otimizar para o ego, não para o negócio.
Um detalhe pouco discutido: teste inconclusivo é diferente de "não aconteceu nada". Ele elimina uma hipótese, revela um viés que estava guiando a priorização, e evita que o time de desenvolvimento suba, no escuro, algo que nunca teria gerado resultado. Isso tem valor, só que é um valor difícil de defender em uma reunião de board, e por isso o mercado prefere não falar sobre ele.
Outro ponto que separa operação amadora de operação madura: reciclagem de teste. Um teste que não funcionou há dois anos pode voltar a funcionar hoje, porque consumidor, concorrência e produto mudam. Se uma jornada está "parada" há dois anos sem novo teste, isso já é sintoma de estagnação.
5. As duas métricas que provam o valor de CRO para o negócio
Para blindar a área contra o corte de orçamento, a Claro reporta resultado de experimentação em duas frentes:
5.1. Potencial incremental
O ganho direto de receita, cadastro, login (ou o que for a meta de negócio) gerado pelas variantes vencedoras. Aqui está um detalhe de maturidade: a Claro não exige 95% de confiança estatística como padrão universal. Em jornadas de menor risco, trabalha com 90%, porque, como coloca Marcola, um teste de e-commerce errado não é um erro médico: ninguém morre, e dá para reverter. O resultado desse tipo de teste já alimenta diretamente o backlog de produto no Jira, priorizando histórias pelo potencial incremental comprovado.
5.2. Economia gerada
A métrica que ninguém cobra, mas que sustenta os outros 80% dos testes (os inconclusivos). É o cálculo de quanto a empresa economizou em horas de desenvolvimento por não subir, às cegas, uma hipótese que o teste provou não gerar impacto, e quanto ela evitou perder caso aquela mudança tivesse ido ao ar sem validação. Somando as duas métricas, CRO deixa de ser custo e vira linha de receita e de mitigação de risco: o argumento que realmente convence um CFO, ao contrário de "a gente testa uns botões por aí".
6. Quem deveria mandar no roadmap: produto ou experimentação?
Pergunta provocada no episódio: hoje, na maioria das empresas, é o time de produto e UX que decide a melhoria e simplesmente sobe no sprint. Marcola defende a inversão: melhoria deveria passar por teste antes de subir ao ar. Exceção óbvia: correção de bug e sustentação técnica não precisam de validação prévia. Mas até decisão de infraestrutura pode virar teste. Comparar duas versões de uma API, por exemplo, para ver qual performa melhor, também é CRO, só que aplicado à camada de tecnologia em vez da de UX.
A realidade, porém, é mais dura: boa parte do mercado opera em "piloto automático", recebendo decisões top-down, sem hábito de questionar. Mudar esse mindset é trabalho político, não técnico. E cansa. O episódio traz um caso real e cru: uma analista júnior, tentando convencer o dono de um e-commerce a testar a jornada em vez de culpar mídia e preço pela queda de conversão, chegou perto de desistir da carreira porque o cliente recusava, com unhas e dentes, a possibilidade de o próprio site ter um problema.
A resistência não é técnica. É de ego. Aceitar que a jornada pode estar errada exige humildade de quem construiu ela, e é exatamente aí que a maioria das operações de CRO trava antes mesmo de rodar o primeiro teste.
Na Claro, a saída para escalar sem depender de bater na porta de cada squad foi trazer um desenvolvedor dedicado ao setup dos experimentos, o que tirou o time de CRO da posição de "pedir 5 minutos de atenção" e deu tração real ao framework.
7. IA em CRO: onde funciona e onde é só discurso de palco
Depois de discutir o tema em eventos internacionais como o London Circus, a visão de Marcola sobre IA aplicada a CRO é pragmática: dificilmente ela substitui o processo inteiro, porque o custo não compensa e a estrutura toda precisaria mudar. O ganho real está em atacar gaps específicos, como geração de hipótese, montagem de protótipo, setup técnico do experimento e documentação pós-análise, e a lente por trás disso é simples: a IA amplifica o processo que já existe, para o bem ou para o mal.
Dois pontos ficam explícitos no episódio:
- •A responsabilidade continua sendo humana. Se um teste sobe mal configurado, ou uma hipótese não tem lastro em dado, ou alguém pausa um teste antes do prazo de significância estatística, a culpa é de quem operou a IA. Tratar a ferramenta como uma "entidade" separada da decisão humana é o erro mais comum.
- •IA depende de tracking correto. Sem dado limpo entrando, a IA "vai cuspir merda". Na Claro, a ferramenta interna de teste A/B puxa dados do Google Analytics e cruza com dados proprietários e mapas de calor para gerar hipóteses baseadas nos pontos reais de maior fricção da jornada. Um processo sólido por trás faz a IA acelerar; um processo furado faz ela entregar o erro mais rápido e em maior volume.
8. Bate-bola: o que perguntamos e o que Marcola respondeu sem pensar
| >Pergunta< | >Resposta direta< |
|---|---|
| >Habilidade subvalorizada em CRO que vai virar diferencial< | >Análise de dados: "a dupla de CRO é o Analytics" e CRO não funciona sem essa base< |
| >Background ideal para entrar em CRO hoje< | >Dados, seguido de estatística básica (entender MDE, confiança estatística) e conhecimento da plataforma/produto (o que é um SDK, como a jornada funciona tecnicamente)< |
| >Maior mito do mercado sobre CRO< | >Focar só em variantes vencedoras e cases de sucesso, ignorando o aprendizado dos 80% que não venceram< |
Um adendo importante da rodada rápida: para Marcola, o profissional de UX que se apoia em dado é sempre mais forte do que o que se apoia só em intuição de design. A dupla dados + UX dentro do próprio squad de produto é, na visão dele, o que separa operação que escala de operação que fica no "voo de galinha".
9. Como a Métricas Boss ajuda a estruturar isso
O que o episódio expõe, na prática, é um problema de arquitetura de decisão: empresas testam sem tracking confiável, sem camada de Discovery, sem governança de documentação, e depois se perguntam por que o CRO "não converte". A Métricas Boss atua exatamente nesse ponto anterior ao teste: auditoria de tracking, estruturação de funil de dados e desenho de framework de experimentação com critério estatístico real, para que, quando um teste for declarado vencedor, ele tenha, de fato, significância por trás.
Se a sua operação está travada nos "8 testes por mês sem relevância estatística" ou não sabe como provar o valor dos experimentos inconclusivos, esse é exatamente o tipo de diagnóstico que fazemos todos os dias. Fale com um de nossos especialistas e conheça os serviços de auditoria de tracking e estruturação de CRO da Métricas Boss.
10. FAQ
- •CRO é a mesma coisa que teste A/B? Não. Teste A/B é uma ferramenta de validação de hipótese dentro de CRO. CRO também inclui teste de usabilidade, pesquisa qualitativa, análise de funil, gravação de sessão e mapa de calor.
- •Por que a maioria dos testes A/B não dá em variante vencedora? Porque a validação de hipótese é probabilística por natureza. No mercado, cerca de 80% dos experimentos terminam inconclusivos ou sem vencedor, e isso já é esperado dentro do método.
- •É preciso sempre esperar 95% de confiança estatística para declarar um teste vencedor? Depende do risco da jornada. Em cenários de baixo risco (ninguém "morre" com o erro, e dá para reverter), é possível trabalhar com um patamar menor, como 90%, aceitando conscientemente uma fatia maior de incerteza.
- •Quanto tempo leva para um teste A/B dar resultado confiável? Varia de poucos dias, em jornadas de altíssimo tráfego, a 30 ou 40 dias em cenários de volume médio ou baixo. É por isso que "rodar muitos testes por mês" sem volume suficiente costuma ser sinal de alerta sobre a metodologia usada.
- •Um teste que falhou no passado pode ser testado de novo? Sim, e deveria ser. Comportamento do consumidor, produto e concorrência mudam, e reciclar hipóteses antigas com o contexto atualizado é prática comum em operações maduras de CRO.
- •Quem deve validar um teste depois que ele sobe no ar? O próprio time de CRO, em um processo de "prova real": mesmo depois de vencer estatisticamente, é preciso confirmar, algumas semanas depois, se o resultado incremental esperado realmente se sustentou fora do ambiente controlado do teste.
- •IA já substitui o analista de CRO na geração de hipóteses? Não substitui. Apoia etapas específicas (geração de hipótese, prototipagem, documentação), mas depende de tracking limpo, e a responsabilidade pela decisão final continua sendo humana.
Baseado no episódio 276 do Analytics Talks, "CRO Além do Teste A/B: A Maturidade que Ninguém Conta", com Marco Antônio Cardozo (Marcola), líder de Growth Digital na Claro e embaixador da comunidade CRO Brasil.
Assista ao episódio na íntegra:

Gustavo Esteves
Gustavo Esteves é fundador e CEO da Métricas Boss, já trabalhou dentro de gigantes como B2W. Autoridade na área de Digital Analytics, com mais de 15 anos de experiência e 3 mil projetos atendidos, incluindo gigantes como PUC, Rede D'Or, Globo, Stanley, Médico Sem Fronteiras, Alura, entre outras.
Publicado em 3 de julho de 2026