Astera apresenta a mais nova adição à plataforma, Astera Data Services - uma solução completa de gerenciamento do ciclo de vida da API. Saiba Mais

X

O que é um Data Mart? Design, exemplos e implementação explicados

By |2022-11-14T07:13:57+00:00Outubro 21st, 2019|

Ao contrário de um data warehouse que armazena dados de toda a empresa, um data mart inclui informações relacionadas a um determinado departamento ou área de assunto. Por exemplo, um data mart de vendas pode conter dados relacionados a produtos, clientes e vendas apenas. Leia este blog para desenvolver uma melhor compreensão desses repositórios de dados departamentais.

O que são Data Marts?

Os data marts são um subconjunto do data warehouse que lida com um único assunto. Eles geralmente são construídos e gerenciados por um único departamento de negócios. Como eles são orientados por assunto, eles normalmente obtêm dados de apenas um pequeno número de fontes, que podem ser sistemas operacionais internos, data lake, um repositório de dados centralizado ou fontes externas. Eles geralmente são condensados ​​e menos complexos do que os data warehouses, o que os torna mais fáceis de construir e manter.

Agora que entendemos o que são, veremos os três tipos diferentes de exemplos de data mart, seus usos e como eles simplificam o gerenciamento de dados. Também ilustraremos um guia passo a passo sobre como implementar um repositório de dados específico do departamento para sua empresa específica.

Tipos de data marts

Fonte: Study.com

Como os Data Marts beneficiam o gerenciamento de banco de dados?

Antes de discutirmos seus vários tipos, vamos examinar brevemente os benefícios dos data marts e por que eles são necessários para um negócio orientado a dados:

  • Habilite o acesso mais rápido aos dados recuperando um conjunto específico de dados para BI e relatórios. Como resultado, ajuda a acelerar a inteligência de negócios.
  • Eles são mais fáceis de implementar e mais econômicos do que construir uma empresa data warehouse.
  • Projetado de acordo com os requisitos de um determinado grupo de usuários que trabalham em um departamento específico.
  • Eles são comparativamente mais adaptáveis ​​do que um data warehouse. Qualquer alteração no modelo de dados pode ser facilmente e rapidamente incorporada ao data mart devido ao seu tamanho menor.
  • Permitir direitos de controle de acesso granular devido ao amplo particionamento e segmentação.

Resumindo, eles são muito mais rápidos, adaptáveis ​​e econômicos de manter do que um data warehouse. Por outro lado, os data warehouses são criados para consolidar dados de uma miríade de fontes (geralmente não em um formato estruturado).

Tipos de data marts

Os data marts podem ser classificados em três tipos principais:

1. Dependente

Um data mart dependente permite combinar todos os dados da sua empresa em um único data warehouse, oferecendo os benefícios típicos da centralização.

Neste exemplo, são necessários armazenamentos de dados departamentais e você terá que criá-los como entidades dependentes para garantir consistência e integração em todos os sistemas de armazenamento de dados.

Data marts dependentes podem ser construídos usando duas abordagens diferentes. Na primeira abordagem, data warehouses e data marts corporativos são construídos para que o operador possa acessar ambos sempre que necessário. Na segunda abordagem, também conhecida como abordagem federada, os resultados do processo ETL são armazenados em uma área de armazenamento temporário, como um barramento de dados comum em vez de um físico banco de dados para que a operadora só possa acessar os dados departamentais.

A última metodologia não é ideal, pois ocasionalmente gera um ferro-velho de dados no qual todos os dados se originam de uma fonte compartilhada, mas são descartados principalmente.

2. Independente

Um data mart independente pode ser criado sem usar o data warehouse central. É principalmente recomendado para unidades ou grupos menores dentro de uma organização. Como o nome sugere, esse tipo de repositório não está relacionado ao data warehouse empresarial nem a qualquer outra entidade. Ele insere dados separadamente e as análises também são executadas de forma independente.

À medida que mais e mais data marts independentes são construídos, a redundância de dados também aumenta em toda a organização. Isso ocorre porque cada armazenamento de dados independente precisa do seu próprio, geralmente uma cópia duplicada das informações abrangentes de negócios. Como esses armazenamentos independentes de dados acessam diretamente arquivos e / ou tabelas do sistema operacional, eles consideravelmente limitar a escalabilidade dos sistemas de suporte à decisão (DSS).

3. Híbrido

Usando um data mart híbrido, você pode combinar dados de vários sistemas de origem operacional, além de um data warehouse. Eles são particularmente úteis quando você precisa de integração ad hoc, como adicionar um novo grupo ou produtos ao negócio.

Como o nome indica, um data mart híbrido é uma mistura dos tipos dependente e independente. É adequado para empresas que possuem vários bancos de dados e precisam de um retorno rápido. Exemplos de data mart desse tipo precisam de uma leve limpeza de dados, suportam grandes estruturas de armazenamento e são flexíveis, pois combinam os benefícios de sistemas dependentes e independentes.

Projetando Data Marts para Data Warehousing

Veja como você pode projetar um data mart para as necessidades da sua empresa:

1. Projeto

O primeiro passo é criar um design robusto. Alguns processos críticos envolvidos nesta fase são:

  • Levantamento dos requisitos corporativos e técnicos.
  • Identificando fontes de dados.
  • Escolhendo um subconjunto de dados adequado.
  • Projetar o layout lógico (esquema do banco de dados) e a estrutura física.

2. Construir / Construir

O próximo passo no processo é construir o data mart. Isso inclui a criação do banco de dados físico e das estruturas lógicas. Nesta fase, você construirá as tabelas de fatos, tabelas de dimensões, campos, índices e controles de acesso.

3. Preencher / Transferência de dados

O próximo passo é preencher o mart, o que significa transferir dados para ele. Nesta fase, você também pode definir a frequência de transferência de dados, como diária ou semanal. Essa etapa geralmente envolve:

  • Extraindo informações de origem.
  • Limpando e transformando os dados.
  • Carregando os dados no repositório departamental.
  • Construindo os metadados e armazenando-os.

4. Acesso a dados

Nesta etapa, os dados carregados no data mart são usados ​​na consulta, geração de relatórios, gráficos e publicação. As principais tarefas envolvidas nesta fase são:

  • Configurando uma metacamada e traduzindo estruturas de banco de dados e nomes de itens em expressões corporativas para que operadores não técnicos possam usar facilmente o data mart.
  • Configuração e manutenção de estruturas de banco de dados.
  • Se necessário, você também pode configurar API e interfaces para simplificar o acesso aos dados.

5. Gerenciar

A última etapa envolve gerenciamento e observação, que inclui:

  • Controlando o acesso contínuo do usuário.
  • Otimização e refinamento do sistema de destino para melhor desempenho.
  • Adição e gerenciamento de novos dados no repositório.
  • Definir as configurações de recuperação e garantir a disponibilidade do sistema em caso de falha.

Olhando para o futuro – Data Marts e a nuvem

Os data marts oferecem uma abordagem eficiente, flexível e escalável para armazenar dados. No entanto, as soluções no local estão rapidamente se tornando obsoletas devido à crescente quantidade de dados recebidos. Como resultado, muitas empresas estão migrando suas soluções de armazenamento de dados para a nuvem.

Uma arquitetura baseada em nuvem permite que as empresas criem e armazenem seus dados online. A velocidade e a flexibilidade dessa abordagem criam uma oportunidade para análises na nuvem. A execução de análises na nuvem permite maior escalabilidade e economia em comparação com as opções locais. Isso não é tudo. Os data marts baseados em nuvem também oferecem outros inúmeros benefícios:

  • Análise de dados em tempo real.
  • Acesso sob demanda aos dados.
  • Uma visão unificada de todos os data marts.
  • Acesso a origens e destinos nativos da nuvem.

Concluindo!

Um data mart inclui uma subseção de dados de toda a empresa, o que é valioso para um determinado grupo de usuários na organização. Ao contrário de um data warehouse caro e complexo de criar, ele oferece uma alternativa econômica. Também permite um acesso mais rápido aos dados e é simples de usar, pois é precisamente projetado de acordo com os requisitos dos operadores e se concentra em um único departamento / área temática.

Um data mart pode ajudar a acelerar seus processos corporativos, pois leva menos tempo para implementar do que um data warehouse. Ele também inclui dados anteriores para que seus analistas de dados possam determinar facilmente as tendências de dados.