Resumo: Como Mentir com Estatística por Darrell Huff

O que você irá aprender?

    Quem trabalha com análise de dados e com pesquisa quantitativa com certeza já ouviu falar ou já leu o Livro Como mentir com estatística escrito por Darrell Huff. Caso você trabalhe com marketing digital, uma vez que as marcas lançam novos produtos/serviços todos os dias no mercado, ou até variantes de produtos existentes para os usuários, entender como funcionam as amostras estatísticas traz um bom repertório em como lidar e até como identificar amostras enviesadas, gráficos dúbios e listagens incompletas.

    Continue acompanhando o nosso post e descubra mais sobre esse universo no nosso resumo de Como mentir com estatística. Você vai conseguir acompanhar item por item o autor apresentando os vilões da interpretação de dados e as variantes estatísticas.

    Quem é o autor de Como mentir com estatística?

    Esse livro veio pela primeira vez ao público em 1954, por meio de Darrell Huff, escritor e jornalista, além de pioneiro ao falar sobre estatística de uma forma simples. Segundo Huff vale ter sempre um pé atrás na hora de interpretar os dados de uma análise estatística e, com isso, ele traz vários conceitos de mau uso da estatística no nosso dia a dia ao lidar com esses dados. Se tornou um dos livros mais bem recomendados com 1,5 milhão de livros vendidos no mundo por tratar de advertências tão atemporais quanto a ciência matemática. Como mentir com estatística é uma leitura agradável e absolutamente acessível por sua linguagem simples e com ilustrações.

    Pesquisas quantitativas e a amostragem

    A pesquisa quantitativa traz uma amostra representativa de um universo populacional viável através de um determinado momento, realizada a partir de questionários pré-elaborados para descrever e medir quantitativamente. Ela acontece de maneira muito estruturada e baseada em amostra, pois visa trazer o processo da coleta de dados e sua análise descritiva.

    Essa amostragem faz parte de todo um processo entre:

    • Universo total: consumidor ou não, aqui estamos falando da população total;
    • Universo variável: que faz parte deste todo e é a população de interesse;
    • Amostra: que traz uma parte deste universo variável mas com características relevantes do mesmo, que possam agregar à pesquisa.

    No livro, o autor menciona que a confiabilidade de uma amostra pode ser “facilmente destruída por fontes de tendenciosidade invisíveis e visíveis". Com isso ele ainda traz a questão de que ao analisarmos dados estatísticos, mesmo que não encontremos uma "fonte de tendenciosidade”“ devemos sempre manter um certo grau de ceticismo ao nos confrontarmos com os dados.

    Outro ponto importante que devemos ter em mente na hora de diferenciar informação de enrolação, é entender de fato o que é chamado de “amostragem básica” que, segundo Huff, “é selecionada por puro acaso em um universo ao qual uma amostra faz parte.” Seria como se a cada dez nomes em uma sequência, um deles fosse selecionado. Isso nos leva ao desafio de muitas vezes entender se as chances deste nome selecionado (no exemplo) tem uma chance igual de estar na amostra como todos os outros nomes pertencentes a esse grupo.

    Aqui é importante diferenciar a amostra do censo, principalmente porque, como falamos acima, a amostra traz um subconjunto representativo da população, já o censo traz todos os indivíduos.

    Uma média inadequada não significa quase nada

    Quem assiste aos noticiários facilmente já se deparou com a frase “a renda média do brasileiro passou para…” nas notícias que trazem os dados sobre o rendimento médio mensal domiciliar por pessoa no Brasil. No livro, o autor traz o conceito de como identificar qual o tipo de média que foi escolhida já que a palavra “média” tem um sentido bastante flexível.

    O exemplo abaixo ilustra um trecho do livro de Darrell Huff onde ele explica como descrever o lucro anual de 45 mil dólares a ser dividido entre três sócios de uma fábrica que teve um retorno financeiro interessante no final do ano. Os 198 mil dólares foram distribuídos a noventa funcionários e os três sócios da fábrica receberam 11 mil dólares cada um. Além disso, eles verificaram que havia um lucro de 45 mil dólares. Huff mostra como ele poderiam exemplificar esse fato através das médias, na imagem abaixo:

    Ele traz esse conceito já que cada funcionário fez um trabalho semelhante e, não iria fazer muita diferença usar uma média aritmética ou uma mediana, onde o salário médio dos funcionários representa US$ 2.200 e o salário médio e lucro dos proprietários US$26.000. Isso pode soar alarmante dependendo da amplitude, certo?

    Para contextualizar melhor, vamos aos pontos:

    Média é uma média simples de uma série de dados, já a Moda é o valor mais frequente na série de dados e, a Mediana, que é o valor da série que divide os dados quando ordenados do menor para o maior.

    Esse uso da média também é muito comum quando vemos uma transmissão de jogos olímpicos por exemplo, na patinação artística, onde os juízes levantam os cartazes e nem todos os valores dos cartazes são contabilizados.

    Como aplicar os conhecimentos do livro de forma prática

    Agora que aprendemos mais sobre o livro Como mentir com estatística, vamos deixar mais um adendo de como podemos usar isso de forma prática durante as análises de dados no dia a dia.

    Digamos que você quer entender como os usuários interagiram com o seu site após uma ação de marketing realizada na Black Friday. Podemos usar nas análises uma técnica de amostragem online onde:

    • Vamos realizar a interceptação online não aleatória: onde todos os visitantes do site são abordados; • Podemos realizar a interceptação online aleatória: com o uso de janela pop-up e perguntas aceitas através de um formulário participativo dos usuários que acessaram o site; • Podemos realizar um recrutamento online de usuários interessantes dentre aquele determinado público que gostaríamos de atingir novamente e, com isso extrair mais informações relevantes para o seu propósito de marketing;

    Isso nos leva para outra questão: além de trazer dados quantitativos na sua análise de dados, some essas ações ensinadas aqui no texto às pesquisas qualitativas que também podem auxiliar a trazer informações para embasar análises exploratórias sobre um segmento do mercado, trazendo dados sobre comportamento, dados de opinião, percepções de usuários entre outras intenções de público. Hoje em tempos de internet e big data o livro continua genuinamente subversivo e ainda mais relevante sobre o controverso mau uso de estatística para maquiar dados e quem se vê bombardeado diariamente com informação, pode usar desse brilhante passo a passo como um guia de estatística.

    Gostou do conteúdo e quer saber mais sobre conteúdos assim? Confira o resumo do livro sobre Como mentir com estatísticas:

    Artigos Relacionados

    WhatsApp