Os dados dizem a verdade... será mesmo?

Novidades   |   Alan Jacobson   |   25 de agosto de 2020 TEMPO DE LEITURA: 4 MINUTOS
TEMPO DE LEITURA: 4 MINUTOS

O que se espera de perguntas simples como "Quantos países existem no mundo?" é que elas tivessem respostas simples. Mas, como a figura abaixo ilustra, não é bem esse o caso. As Nações Unidas afirmam que existem apenas 195 estados soberanos, mas há entre 204 e 207 países autodeclarados, sem mencionar os 211 países da FIFA que podem participar da Copa do Mundo e as 206 nações olímpicas. Mas então qual é a resposta "certa"? Bem, tudo depende da pessoa a quem você pergunta e da definição que ela usa.

Em Busca da Verdade

À medida que mais empresas lançam mão dos dados, elas percebem que nem sempre há uma resposta "certa", ou uma "verdade" única. Isso levou os departamentos de TI a exigir mais governança e controle sobre dados a fim de que, quando os funcionários fizessem a mesma pergunta, acessassem dados e análises confiáveis e precisos para obter a mesma resposta.

A princípio, o conceito parece ótimo: gerencie seus dados em um único lugar e tenha a certeza de que a mesma pergunta terá a mesma resposta. Infelizmente, na maioria das organizações, a teoria não se sustenta e, pior ainda, os processos implementados para criar essas condições podem acabar sendo mais prejudiciais do que ter respostas diferentes para a mesma pergunta.

Anúncio integrado do blog da Alteryx

Guia do analytics moderno para usuários de planilhas

Baixe o guia

A dura verdade sobre como chegar à verdade

Primeiro, vamos entender por que tantas vezes há números diferentes nos sistemas que fornecem respostas distintas para perguntas parecidas.

Digamos que sua empresa atue no ramo da manufatura produzindo eletrodomésticos. Você quer saber o custo total de todas as peças usadas na fabricação dos eletrodomésticos no último ano e aponta dois analistas para obter a resposta. Um determina que as peças utilizadas para fabricar os aparelhos totalizaram R$ 100 milhões e considera que o último ano se refere a todas as peças encomendadas de janeiro a janeiro.

O segundo analista pega a mesma pergunta, mas usa duas definições ligeiramente diferentes. Primeiro, o número total de peças que esse analista utiliza considera não apenas as usadas para fabricar os aparelhos quando eram novos, mas também as peças utilizadas na manutenção dos aparelhos que já estavam com os consumidores. Além disso, ele define que as peças a incluir são aquelas pagas, em vez das encomendados, durante o período.

Então, quem está certo?

Qual dessas definições é a maneira correta de abordar a questão? A realidade é que podem ser ambas, apenas uma delas ou nenhuma das duas. Tudo depende de qual problema de negócio você está buscando solucionar.

Nas empresas, cada sistema mantém versões ligeiramente diferentes dos números — adequadas para o que esses sistemas trabalham para solucionar. A equipe de compras foca os pedidos e a de contas a pagar cuida dos pagamentos. Outros departamentos requerem mais nuance nas definições, a fim de atender aos requisitos dos problemas que costumam trabalhar para solucionar. No final das contas, há muitas respostas para a pergunta: "Qual é o custo total de todas as peças que usamos para fabricar eletrodomésticos no último ano?".

A verdade está nos olhos de quem vê

Quem pode determinar qual versão da verdade é a correta? Nesse exemplo, acho que você pôde perceber que a verdade provavelmente está nos olhos de quem vê. Se a pergunta for feita pelo departamento de contabilidade, provavelmente somente ele vai poder apontar qual "verdade" atende às suas necessidades. A resposta de outros grupos provavelmente será inútil para ele.

Fica claro que a verdade também depende de qual pergunta está realmente sendo feita. Quando você pergunta qual o custo total de todas as peças usadas para fabricar eletrodomésticos no último ano, os analistas podem perguntar de volta: "Que tipo de custos? Você quer incluir os impostos? E os custos de envio?".

Como alinhar todo mundo

Mesmo que algumas possam argumentar que uma única versão da verdade não existe, as empresas ainda precisam que vários aspectos dos dados e análises sejam os mesmos entre as equipes. Confira nossas três dicas para ajudar sua organização a chegar a uma única versão de verdade.

  1. Democratize os dados com responsabilidade: crie um data lake de fácil acesso para compartilhar dados em toda a companhia. Mas faça isso com responsabilidade e governança de dados. Afinal, as empresas precisam garantir que os dados sejam não apenas fáceis de acessar a todos os funcionários, mas também precisos, confiáveis, seguros e auditados. O primeiro passo para chegar a uma única versão da verdade é dar a todas as equipes acesso aos mesmos dados. Assim, elas podem encontrar exatamente o que estão procurando, conforme suas próprias necessidades.
  2. Forneça treinamento e aperfeiçoamento em dados: ajude seus funcionários a aprender as habilidades necessárias para transformar dados em decisões e crie citizen data scientists. Dê a eles o treinamento de que precisam para trabalhar com dados com confiança e tranquilidade, fazer perguntas precisas, perceber as nuances na busca por respostas e obter seus próprios insights.
  3. Habilite o compartilhamento e a reutilização: certifique-se de que as queries, modelos analíticos, documentos de referência, painéis, relatórios e insights sejam compartilhados. Isso ajuda a criar uma única versão de verdade entre os colegas. Também promove ganhos de eficiência. Por exemplo, em vez de criar uma query nova para calcular o "total de vendas", uma pesquisa simples permitiria que os usuários descobrissem queries pertinentes, com a documentação relacionada, de outras equipes. Os usuários precisam ter clareza sobre quais dados estão sendo coletados e de onde essas informações estão vindo para poder alavancar o conhecimento coletivo na empresa.

Se sua organização embarcou numa jornada de transformação digital, compartilhe conosco suas conquistas e fracassos na busca pela "verdade" e como vocês estão capacitando ou, melhor ainda, como vocês foram capacitados nas suas iniciativas de data science.

Tags