Não perca: Inspire 2024, de 13 a 16 de maio de 2024, no The Venetian em Las Vegas! Inscreva-se agora mesmo.

Glossário de data science e data analytics

Todos
  • Um
  • B
  • C
  • D
  • E
  • F
  • G
  • H
  • I
  • J
  • K
  • L
  • M
  • N
  • O
  • P
  • Q
  • R
  • S
  • T
  • U
  • V
  • W
  • X
  • Y
  • Z

O analytics avançado, ou advanced analytics, utiliza técnicas sofisticadas para revelar insights, identificar padrões, prever resultados e gerar recomendações.

...
Saiba mais

Quanto maior o nível de maturidade analítica da sua organização, mais capaz ela será de usar dados para entregar resultados de negócios.

...
Saiba mais

O machine learning automatizado, ou AutoML, ajuda profissionais sem habilidades técnicas na construção, validação, iteração e exploração de modelos por meio de uma experiência automática.

...
Saiba mais

O processamento em lote refere-se ao agendamento e processamento de grandes volumes de dados de modo simultâneo, geralmente em períodos em que os recursos computacionais estão com baixa demanda. Os trabalhos em lote normalmente são de natureza repetitiva e muitas vezes são programados (automatizados) para ocorrer em intervalos definidos, como...


Saiba mais

A análise de negócios é o processo de análise de dados que utiliza métodos estatísticos e quantitativos para tomar decisões que gerem melhores resultados de negócios.

...
Saiba mais

O Business intelligence é o resultado acumulativo dos dados, softwares, infraestrutura, processos de negócios e intuição humana de uma organização que fornece insights acionáveis.

...
Saiba mais

A análise em nuvem envolve o uso de dados armazenados na nuvem para realizar processos analíticos e o aproveitamento do poder computacional rápido da nuvem para promover análises mais rápidas.

...
Saiba mais

Um data warehouse em nuvem é um banco de dados gerenciado como um serviço e entregue por terceiros, como o Google Cloud Platform (GCP), Amazon Web Services (AWS) ou Microsoft Azure. As arquiteturas de dados em nuvem são distintas das arquiteturas de dados locais, onde as organizações gerenciam sua própria infraestrutura física...


Saiba mais

A agregação de dados é o processo de compilação de dados (geralmente de múltiplas fontes de dados) para fornecer informações resumidas de alto nível que podem ser usadas para análise estatística. Um exemplo de agregação de dados simples é encontrar a soma das vendas em uma categoria específica de produto para cada região que você opera.…


Saiba mais

A análise de dados é o processo de explorar, transformar e analisar dados para identificar insights e eficiências significativas que dão base às tomadas de decisões.

...
Saiba mais

As aplicações de dados são aplicações construídas sobre bancos de dados que resolvem um problema de dados nichado e, por meio de uma interface visual, permitem múltiplas consultas ao mesmo tempo para explorar e interagir com esses dados. As aplicações de dados não exigem conhecimento de programação para adquirir ou compreender...


Saiba mais

Data blending ou combinação de dados, é o ato de reunir informações de uma ampla variedade de fontes em um conjunto de dados útil para análises mais detalhadas e complexas.

...
Saiba mais

Um catálogo de dados é uma coleção abrangente de ativos de dados de uma organização que são compilados para facilitar aos profissionais da organização a localização dos dados de que precisam. Assim como os catálogos de livros ajudam os leitores a localizar livros rapidamente nas bibliotecas, os catálogos de dados ajudam os usuários a pesquisar rapidamente...


Saiba mais

Data cleansing, também conhecido como limpeza ou depuração de dados, identifica e corrige erros, duplicações e informações irrelevantes em um conjunto de dados brutos.

...
Saiba mais

O enriquecimento de dados é o processo de combinar dados próprios de fontes internas com dados diferentes de outros sistemas internos ou dados de terceiros de fontes externas. O processo de enriquecimento de dados os torna mais úteis e esclarecedores. Um processo de enriquecimento de dados que funcione bem é fundamental...


Saiba mais

A exploração de dados é uma das etapas iniciais no processo de análise usada para começar a explorar e determinar quais padrões e tendências são encontrados no conjunto de dados. Um analista geralmente começa a exploração de dados usando técnicas de visualização de dados e outras ferramentas para descrever as características...


Saiba mais

A governança de dados é o conjunto de políticas, processos e padrões que definem como os ativos de dados podem ser usados em uma organização e quem tem a autoridade sobre eles. A governança determina quem pode usar quais dados e de qual forma. Isso garante que os ativos de dados permaneçam seguros e cumpram os requisitos que foram acordados…


Saiba mais

A ingestão de dados é o processo de coletar os dados de suas fontes e levá-los para um ambiente de destino onde possam ser acessados, utilizados ou analisados.

...
Saiba mais

A integridade dos dados refere-se à acurácia e consistência dos dados ao longo de todo o ciclo de vida, bem como à conformidade com as restrições de permissão necessárias e outras medidas de segurança. Em poucas palavras, é a confiabilidade dos seus dados.

...
Saiba mais

Um data lakehouse é uma arquitetura de gerenciamento de dados que busca combinar os principais benefícios dos data lakes e dos data warehouse.

 

...
Saiba mais

A linhagem de dados permite monitorar a origem e o ciclo de vida de dados, mantendo as informações da empresa consistentes e precisas.

...
Saiba mais

Uma malha de dados é uma nova abordagem na construção de arquiteturas de dados. Ela leva uma abordagem descentralizada para o armazenamento e gerenciamento de dados, fazendo com que domínios de negócios individuais mantenham a propriedade sobre seus conjuntos de dados, em vez de fluir todos os dados de uma organização para um data lake cuja propriedade é centralizada. Os dados são...


Saiba mais

O pré-processamento de dados é o processo de limpeza manual de dados que antecede a análise. É um processo demorado que muitas vezes atrapalha a extração do verdadeiro valor e potencial dos dados. Em muitas organizações, 80% do tempo gasto em análise de dados é alocado no pré-processamento, onde a equipe de TI limpa manualmente...


Saiba mais

A observabilidade de dados refere-se à capacidade de uma organização de monitorar, rastrear e fazer recomendações sobre o que está acontecendo dentro de seus sistemas de dados a fim de manter a integridade do sistema e reduzir o tempo de inatividade. O objetivo é garantir que os pipelines de dados estejam produtivos e possam continuar funcionando...


Saiba mais

O onboarding de dados é o processo de preparação e upload de dados de clientes em um ambiente online. Ele permite que as organizações tragam registros de clientes que foram coletados nos meios offline para sistemas online, como CRMs. O onboarding de dados requer uma limpeza significativa de dados para corrigir erros e para...


Saiba mais

Um pipeline de dados é uma sequência de etapas que coleta, processa e move dados entre fontes para auxiliar no armazenamento, na análise, no machine learning ou em outros usos. Por exemplo, os pipelines de dados costumam ser usados para enviar dados de aplicações para dispositivos de armazenamento, como data warehouse ou data lakes. Os pipelines de dados são...


Saiba mais

A preparação de dados, às vezes também chamada de “pré-processamento”, é o ato de limpar e consolidar dados brutos antes de usá-los para a análise de negócios e machine learning.

...
Saiba mais

Data profiling é o processo de criação de perfis de dados para ajudar a descobrir, entender e classificar os dados, ao identificar suas características e avaliar a qualidade.

...
Saiba mais

A data science é uma forma de estatística aplicada que incorpora elementos de ciências da computação e matemática para extrair insights de dados quantitativos e qualitativos.

...
Saiba mais

Data science e machine learning são tópicos recorrentes no universo tecnológico. Ambos potencializam operações de IA em toda a escala corporativa e industrial. Mas qual é mais eficaz?

...
Saiba mais

Uma fonte de dados é o local, digital ou físico, de onde os dados se originam ou são armazenados, influenciando na forma como são armazenados de acordo com o seu local (por exemplo, tabela ou objeto de dados) e suas propriedades de conectividade.

...
Saiba mais

A padronização de dados elimina a semântica da complexidade que envolve a coleta, harmonização e integração de dados para ajudar empresas a executar análises com mais rapidez e precisão.

...
Saiba mais

A transformação de dados é o processo de conversão de dados em um formato diferente que seja mais útil para uma organização. É utilizado para padronizar dados entre os conjuntos de dados ou para torná-los mais úteis para análise e o machine learning. As transformações de dados mais comuns envolvem a conversão de dados brutos em...


Saiba mais

A validação de dados é o processo que busca garantir que seus dados sejam precisos e limpos. A validação de dados é um processo crítico em todas as etapas de um projeto de dados — desde o desenvolvimento de aplicações até a transferência de arquivos e a manipulação de dados — para garantir a exatidão de informação. Sem a aplicação da validação de dados desde o início até o iter...


Saiba mais

A visualização de dados é a representação visual de dados por meio de vários modelos e tipos de gráficos.

...
Saiba mais

Data wrangling, ou manipulação de dados, é o processo de transformar, limpar e enriquecer os dados para torná-los mais adequados, úteis e consumíveis para impulsionar a tomada de decisões assertivas.

...
Saiba mais

Inteligência de decisão é o processo de aplicação de análise de dados, IA e automação a decisões de Impacto
Saiba mais

Previsões de demanda, ou demand forecasts, ajudam empresas a calcular a necessidade de futuros produtos e serviços, além de contribuir para fundamentar decisões comerciais. Elas incluem dados granulares, históricos de vendas, questionários e muito mais.

...
Saiba mais

Com a análise descritiva dos dados, as pessoas extraem conclusões de grandes conjuntos de dados brutos para responderem à pergunta "o que aconteceu?". Os resultados aparecem em gráficos de linhas e tabelas, gráficos de pizza e barras, além das narrativas geradas.

...
Saiba mais
ETL

ETL é o processo usado para extrair e transformar dados de múltiplas fontes, e carregá-los em vários destinos, como um data warehouse ou data lake.

...
Saiba mais

Um desenvolvedor ETL é um especialista em TI que projeta, desenvolve, automatiza e oferece suporte a aplicações complexas para extrair, transformar e carregar dados. Um desenvolvedor ETL desempenha um papel importante na determinação das necessidades de armazenamento de dados de uma organização.

...
Saiba mais

Com a engenharia de recursos, organizações conseguem dar sentido aos dados e transformá-los em ativos valiosos.

...
Saiba mais

O machine learning é o processo repetitivo que um computador usa para identificar padrões em um conjunto de dados de acordo com restrições específicas.

...
Saiba mais

Os modelos machine learning (MLOps) fornecem insight valiosos para os negócios, mas apenas quando esses modelos podem acessar e analisar continuamente os dados da organização. MLOps é o processo crítico que torna isso possível.

...
Saiba mais

A análise preditiva é um tipo de análise de dados que utiliza estatística, data science, machine learning e outras técnicas para prever o que acontecerá no futuro.

...
Saiba mais

A análise prescritiva, ou prescriptive analytics, responde à pergunta "o que deve/pode ser feito?", utilizando métodos de machine learning, gráficos, simulações, heurísticas, entre outras técnicas.

...
Saiba mais

Uma RegEx (abreviação de expressão regular) é uma sequência de caracteres usada para especificar um padrão de pesquisa. Ela permite que os usuários realizem de forma fácil pesquisas que correspondam a critérios muito específicos, economizando muito tempo para quem trabalha regularmente com textos ou analisa grandes volumes de dados. Um exemplo de ex...


Saiba mais

A análise de vendas é a prática de gerar insights a partir de dados e usá-los para definir metas, métricas e uma estratégia mais ampla.

...
Saiba mais

O mapeamento de origem para destino é um conjunto de instruções de transformação de dados que determina como converter a estrutura e o conteúdo dos dados no sistema de origem para a estrutura e o conteúdo necessários no sistema de destino.

...
Saiba mais

A análise espacial, ou spatial analysis, permite que empresas identifiquem locais, relações, atributos e pontos de conexão em dados geoespaciais para responder perguntas, assim como extrair insights.

...
Saiba mais

O aprendizado supervisionado e o não supervisionado têm uma diferença crucial: a aprendizado supervisionado utiliza conjuntos de dados rotulados, enquanto o não supervisionado emprega conjuntos de dados não rotulados.

...
Saiba mais

Sistemas de inteligência ajudam as organizações a extrair valor de sua pilha de tecnologia
Saiba mais

Uma função definida pelo usuário (UDF) é uma função de programação personalizada que permite aos usuários reutilizar processos sem ter que reescrever os códigos. Por exemplo, um cálculo complexo pode ser programado usando SQL e armazenado como uma UDF. Quando esse cálculo precisar ser usado no futuro em um conjunto de dados diferente,...


Saiba mais