Era uma vez, na terra das histórias de dados! Parte 2: Na barriga do monstro de dados
O que você irá aprender?
Este artigo aborda técnicas práticas para contar histórias com dados. Inclui dicas e truques para abordar a narrativa de dados de forma estruturada e significativa. Nem todos os bons conselhos para contar histórias são necessariamente bons conselhos para contar histórias com dados. No entanto, há muito que podemos aprender com métodos destinados à escrita criativa e técnica, especialmente se forem adaptados às necessidades específicas da narrativa de dados. As técnicas que recomendarei neste artigo foram testadas e usadas várias vezes, ao longo de mais de dez anos de experiência contando histórias de dados para empresas. Eu atravessei parte da selva com um facão, também orientada pelos que vieram antes de mim, e agora convido você a caminhar por algumas dessas trilhas. Da mesma forma que adaptei os métodos a partir do que veio antes de mim, também cabe a você avaliar como as técnicas descritas aqui melhor se adaptam às suas necessidades e ajustar de acordo.
É hora de focar na mensagem da história. Para contar histórias simples e complexas de forma simples, devemos aprender como estruturar uma história com dados. Mas apenas contar uma história não é suficiente, também devemos aprender como torná-la significativa e relevante.
PS: Clique aqui para ler a parte 1 dessa série de artigos sobre Storytelling com dados
Como estruturar uma história com dados
Essencialmente, a estrutura de uma história deve ter um começo, meio e fim. No entanto,só isso não basta para contar uma história com dados. Existem 3 truques principais que uso para garantir que minha narrativa de dados tenha uma estrutura organizada: o método 3Q+COP, identificar estruturas lineares vs. ramificadas, e uma adaptação do método narrativo da Pixar.
O MÉTODO 3Q+COP
Um método conhecido de resolução de problemas e abordagem de questionamento que é útil no kit de ferramentas do contador de histórias de dados é o método 3Q+COP (também conhecido pela sigla em inglês 5W1H). Usado no jornalismo para garantir que todos os elementos essenciais de uma notícia sejam abordados, o 3Q+COP consiste em fazer as seguintes perguntas:
Em uma história de dados, não há uma única resposta correta para cada uma dessas perguntas. Primeiro, devemos saber sobre o “que” ou “sobre quais” dados a história é, e isso geralmente se refere a uma métrica ou a um indicador-chave de desempenho (key performance indicator ou KPI). Os sujeitos da história podem ser "quem" precisa contar ou ser contado sobre a história, ou **“sobre quem” **a história é - por exemplo, a amostra de uma pesquisa ou o público-alvo de uma campanha de marketing. Então é imperativo saber "quando" a história acontece, de qual período os dados são. Muitas vezes eu vi a qualidade dos dados sendo questionada porque o público de uma história de dados estava comparando dados de diferentes períodos. Além disso, o tempo pode ser uma dimensão dos dados, e especificar a granularidade geralmente é relevante para a história: meses, dias, horas. Às vezes, também pode ser pertinente perguntar “quando” a história será contada.
"Como" as conclusões foram tiradas para chegar à história e "como" a história é contada são perguntas que não devem ser ignoradas. É sempre relevante para uma história saber "onde" ela acontece, a “onde” os dados pertencem (é sobre um país ou cidade específica?), ou se os dados têm alguma divisão de dimensão geográfica (podem ser divididos por região ou estado?). Perguntar “de onde” os dados vieram também nos lembra de indicar a fonte dos dados, o que é essencial para dar credibilidade à história. Muitas pessoas podem se sentir desencorajadas a perguntar "por quê?", como se todos tivéssemos nascido sabendo as respostas, então pode ser a pergunta mais complicada no esquema 3Q+COP. Mas para criar histórias significativas, é crucial expor "por que" uma história está sendo contada, e "por que" os dados estão se comportando de uma certa maneira.
Em português, o método é chamado de 3Q+COP (o Que, Quem, Quando, Como, Onde, Por quê), mas às vezes também é referido pela sigla em inglês 5W1H (What, Who, When, How, Where, Why).
Esse método 3Q+COP não é uma abordagem onde as mesmas perguntas se aplicarão a qualquer caso. Ele deve ser tratado como um esquema prático e um ponto de partida para ajudar os contadores de histórias de dados a criarem sua linha de raciocínio e a fazerem perguntas mais inteligentes.
NARRATIVAS LINEARES OU RAMIFICADAS
Um dos momentos em que senti o poder da narrativa de dados sendo desbloqueado no meu trabalho foi quando comecei a abordar narrativas lineares e ramificadas de forma diferente.
Histórias lineares são bem-vindas quando estamos no modo explicativo, por exemplo, apresentando um relatório. Deve parecer linear como ler um romance, onde há uma linha definida e singular que nos leva do começo ao meio e ao fim. Histórias ramificadas devem existir quando estamos no modo exploratório, por exemplo examinando um conjunto de dados ou um painel (dashboard) e as múltiplas narrativas possíveis que podem ser construídas a partir dele. É mais semelhante a uma história do tipo "escolha sua própria aventura" ou um jogo de RPG.
Para narrativas de dados lineares, geralmente há uma necessidade de nivelar a complexidade delas de acordo com a média dos membros da audiência. Os objetivos são pré definidos e podem não ser igualmente relevantes para todos que recebem a história. Com histórias ramificadas, isso fica ainda mais complicado, mas também muito mais interessante. No brilhante artigo “Storytelling in Dashboards” (disponível em inglês), Suzie Lu aponta duas maneiras de abordar narrativas ramificadas na narrativa de dados:
- Ramificando a narrativa com base no tipo de meta.
- Usuários diferentes estarão interessados em diferentes tipos de insights.
Se recursos de visualização de dados puderem ser utilizados, por exemplo, com um dashboard interativo, a visualização poderá ser otimizada para diferentes cenários de dados e diferentes tipos de histórias que podem ser contadas.
A ESTRUTURA NARRATIVA DA PIXAR
Anos atrás, quando eu estava pesquisando técnicas narrativas que pudessem ser usadas para tornar a narrativa de dados mais envolvente, fiquei tão intrigada com a estrutura da história da Pixar que decidi adaptá-la. Era particularmente importante para mim ajustar a estrutura de uma forma que pudesse ser usada para prever narrativas ramificadas para um projeto de visualização de dados onde vários profissionais diferentes teriam acesso aos dados.
Esta é a estrutura narrativa original usada pelos estúdios de animação da Pixar para criar arcos narrativos envolventes:
Era uma vez...
Todos os dias...
Até que um dia...
Por causa disso...
Por causa disso...
Até que finalmente…
Aqui está como eu reformulei a estrutura para funcionar para narrativas de dados:
Atualmente, há...
Todos os dias/mês...
Um dia...
Por causa disso...
Com a consequência de...
E a conclusão é…
Funciona igualmente bem para histórias lineares e ramificadas, como mostrado nos exemplos abaixo.
A estrutura narrativa criada pela Pixar e adaptada para a narrativa de dados incentiva a definir o contexto, identificar possíveis incidentes, bem como hipóteses e explicações para o comportamento dos dados, concluindo com pontos de ação claros. Enquanto o original pretendia enfatizar o desenvolvimento do personagem ao longo do arco narrativo, a adaptação para a narrativa de dados visa encorajar insights e decisões baseadas em dados.
Aprenda Storytelling com Dados na Prática!
Como contar uma história significativa com dados
Há um exemplo emblemático que eu uso quando falo sobre narrativa de dados para mostrar como nem toda história de dados que parece simples e direta à primeira vista é realmente significativa. Eu estava trabalhando como especialista em visualização de dados e o gerente (stakeholder) de um projeto me pediu para construir um painel (dashboard) com apenas dois elementos: um gráfico de pizza e uma tabela. Deveria ser algo assim:
O gerente tinha certeza de que o gráfico de pizza e a tabela já seriam suficientes e que aquele era um pedido simples. Admito não ser a maior fã de gráficos de pizza, e geralmente evito adicionar tabelas a painéis interativos; mas, nesse caso, eu só queria ter certeza de que as necessidades do projeto realmente seriam atendidas com aquele entregável. Depois que fiz uma série de perguntas a ele, percebemos que a pizza e a tabela não seriam suficientes.
Por exemplo: a alocação de gastos em mídia era relevante apenas por canal ou também por marca? Na verdade, eles precisavam que esse dado por canal estivesse no nível da marca, então um gráfico de pizza não seria adequado (porque havia duas categorias para dividir os dados, canal e marca, e não apenas uma, como é nos gráficos de pizza). Os dados estavam se referindo a apenas um ou vários mercados? Precisávamos incluir uma classificação de gastos de mídia por país para saber o que priorizar. Com que frequência as pessoas tomariam decisões com base nos dados? Seria semanal, então decidimos adicionar uma visão semanal dos gastos.
Com essas e muitas outras perguntas, o esboço que criamos juntos para planejar o projeto era muito diferente do “gráfico de pizza e uma tabela” solicitados no início, e estávamos muito mais certos de que o resultado ajudaria a tomar decisões de negócios mais inteligentes com base nos dados. O esboço era parecido com a imagem abaixo:
Isso não quer dizer que adicionar mais gráficos seja sempre o melhor caminho, e especialmente na visualização de dados há muitos exemplos de como “menos é mais” (a sabedoria por trás do conceito de “relação dados-tinta” de Edward Tufte - em inglês, “data-ink ratio”). A moral dessa história é que, para contar histórias significativas com dados, precisamos aprender a fazer perguntas mais eficazes.
FAZENDO PERGUNTAS MELHORES
A estrutura 3Q+COP (5W1H) já é uma ferramenta útil para os momentos em que não temos certeza sobre quais perguntas devemos fazer, mas é importante ir além disso.
Aqui estão algumas premissas que devemos ter em mente: Não basta ter dados disponíveis, os dados só têm valor quando são compreendidos. As histórias nos ajudam a entender e nos envolver com os dados. E os dados são tão valiosos quanto as perguntas que ajudam a responder e quanto às decisões que nos permitem tomar.
Portanto, devemos perguntar: Qual é o nosso objetivo com a história? Quais são as perguntas de negócio que precisam ser respondidas? Quais decisões esperamos que as pessoas tomem com base nos dados? Quais são os dados que podem dar suporte a essas respostas e decisões?
Em negócios, isso pode ser mais evidente, mas mesmo em outros contextos, os objetivos, perguntas e decisões devem ser esclarecidos ao contar uma história com dados. O público atribui relevância e extrai significado de uma história de dados quando entende não apenas a mensagem, mas as causas, os raciocínios e as implicações por trás da história.
Aprenda Storytelling com Dados na Prática!
SIMPLICIDADE É A CHAVE
O exemplo mais claro e impactante dos últimos anos de como a simplicidade pode tornar uma história mais poderosa é provavelmente o caso de “achatar a curva da COVID-19”.
O gráfico da “curva da COVID-19”, que se tornou viral em 2020, foi criado pela jornalista de visualização de dados **Rosamund Pearce **para um artigo publicado pela revista The Economist, com dados dos Centros de Controle e Prevenção de Doenças, o principal instituto nacional de saúde pública dos Estados Unidos. Embora a percepção do comportamento pandêmico em ondas que podem ser representadas em um gráfico remonte ao início do século XX, na época da gripe espanhola, Pearce se inspirou em um artigo sobre prevenção de pandemias lançado em 2007 pelos Centros de Controle e Prevenção de Doenças dos EUA [1]. O gráfico de Pearce mostrava a importância de desacelerar a contaminação, para garantir que o sistema de saúde pudesse lidar com os casos ativos, enquanto vacinas e curas eram pesquisadas. Muitas versões do gráfico de Pearce foram compartilhadas nas redes sociais e ajudaram a aumentar a conscientização para combater a pandemia do coronavírus de 2020, incluindo uma versão animada brilhante criada por Alexander Radke, que ajudou a tornar o gráfico uma imagem viral.
Um elemento-chave foi adicionado um dia depois: uma linha para representar a capacidade do sistema de saúde. Essa versão foi criada por Drew Harris, então professor assistente na Faculdade de Saúde Populacional da Universidade Thomas Jefferson, que viu a versão de Pearce na The Economist, e que já havia usado um gráfico semelhante inspirado no mesmo artigo do CDC em seu trabalho como instrutor de preparação para pandemias. Embora a posição da linha no eixo Y seja especulativa, ela deixou claro o impacto que as medidas de prevenção [2] poderiam ter. A ideia é simples: desacelerar a propagação da doença para que o sistema de saúde possa acompanhar todos os casos.
Podemos comparar a “curva da COVID-19” a outros gráficos com grande impacto em decisões de saúde pública, como o mapa da cólera de Snow ou o diagrama da rosa de Nightingale, ambos do século XIX, mas é indiscutivelmente ainda mais impressionante em alguns aspectos. A “curva da COVID-19” comunica a mensagem de “achatar a curva” com simplicidade, fácil de entender mesmo para pessoas com apenas alfabetização visual básica, especialmente para um gráfico construído com o conceito matemático de uma parábola [3]. Embora as visualizações de Snow e Nightingale visassem enfrentar desafios localmente, ambas tiveram um impacto mais amplo no longo prazo: o mapa da cólera de Snow teve um papel enorme na compreensão moderna dos germes e como eles podem espalhar doenças, e o diagrama de rosa de Nightingale influenciou práticas de saneamento melhores e duradouras em todo o mundo. No entanto, o gráfico da “curva da COVID-19” teve um claro impacto mundial de curto prazo no comportamento das pessoas durante uma pandemia global, com uso generalizado e compartilhamento de versões deste gráfico por cientistas, governos, jornais e até mesmo cidadãos comuns nas mídias sociais.
O impacto a longo prazo ainda está para ser visto. Mas, graças à sua simplicidade, esse gráfico sustentou uma narrativa de dados que encorajou comportamentos capazes de salvar vidas ao redor do mundo.
Aprenda Storytelling com Dados na Prática!
DESBLOQUEANDO AS NARRATIVAS DE DADOS
Há dias em que você encara os dados e eles não parecem dispostos a revelar suas histórias secretas. Espero que as ideias discutidas neste artigo, sobre como estruturar histórias de dados e como torná-las significativas, sirvam como inspiração para desbloquear narrativas de dados até nos dias mais complicados.
O próximo artigo desta série abordará como expandir e aprofundar a conexão com a audiência e como criar uma cultura de histórias de dados.
[1] Os autores não foram identificados individualmente nesta publicação, e a equipe entrevistada do CDC não conseguia se lembrar de quem criou o original (Wilson, 2020).
[2] Exemplos de medidas preventivas de pandemia viral são: lavar as mãos frequentemente com água e sabão ou um antisséptico à base de álcool; manter uma distância segura de outras pessoas, especialmente ao tossir ou espirrar; usar uma máscara apropriada quando o distanciamento físico não for possível; ficar em casa quando não estiver se sentindo bem e procurar atendimento médico se algum sintoma for identificado.
[3] Uma parábola é uma seção cônica, uma curva plana que é simétrica em espelho e tem aproximadamente o formato de U. Os surtos de pandemia se manifestam no formato de uma parábola, portanto, esse formato é usado para explicar e prever o comportamento de pandemias.