Os dados de negócios são inerentemente suscetíveis a mudanças com o passar do tempo e impactam os negócios de diferentes maneiras. Em data warehouses, o efeito do tempo em nossos registros e fatos de dimensão exige um estudo cuidadoso para que o repositório atenda ao objetivo de inteligência de negócios de entregar informações atualizadas aos tomadores de decisão.
A pergunta é: qual a melhor forma de lidar com essas alterações?
Desenvolver uma tabela de dimensão ou modelo que capture os diferentes estados de seus dados em relação ao tempo é um objetivo chave de um Enterprise Data Warehouse. Para medidas em nossas tabelas de fatos, podemos usar dimensões de data e vinculá-las usando chaves estrangeiras. Para dimensões, a complexidade do manuseio das alterações aumenta muito. Cada etapa do fluxo Slowly Changing Dimension (SCD) deve ser codificada manualmente usando várias instruções SQL complexas. A implementação é demorada e complexa e afeta a capacidade da empresa de manter seus dados de forma rápida e confiável – o que é sempre uma consideração crítica.
Alteração lenta das dimensões em Astera Centerprise
Em comparação com a abordagem tradicional codificada manualmente para o fluxo de dimensão que muda lentamente, Astera oferece uma implementação automatizada usando uma interface completamente de arrastar e soltar. Os dados do sistema de origem são mapeados para um objeto SCD em Centerprise, que envia instruções SQL geradas pelo sistema diretamente para o data warehouse de destino (Leia: Modo de otimização de empilhamento em Centerprise) com base nos layouts de campo definidos pelo usuário. Cada coluna na tabela do usuário pode ser designada como Chave Substituta, Chave Comercial, SCD1, SCD2 etc. (veja abaixo) nas propriedades do componente em Centerprise. A plataforma lida com a estratégia de atualização, considerações de desempenho, roteamento e junções complexas automaticamente no backend, desde que os Tipos de Campo SCD sejam definidos corretamente.
Automatizando a Implementação de Dimensão de Alteração Lenta Tipo 1 e 2
Centerprise suporta Dimensão de Alteração Lenta Tipo 1 e Tipo 2 para atualizar registros com e sem manutenção de histórico.
SCD Tipo 1
Esse tipo lida com atualizações na tabela dimensional, para casos em que preservar o histórico não é uma consideração e você precisa substituir os valores antigos em sua tabela pelos recentes.
Para usar o Tipo de Dimensão de Alteração Lenta 1 em Centerprise, você pode marcar sua coluna como 'SCD1 - Atualizar' no menu Campos do layout do objeto SCD em Centerprise.
SCD Tipo 2
Esse tipo lida com alterações em sua dimensão que precisam ser rastreadas. Um novo registro é inserido a cada alteração e o registro existente é marcado como expirado, por data, versão ou status.
Para usar o Tipo de Dimensão de Alteração Lenta 2 em Centerprise, marque a coluna escolhida como 'SCD2 – Atualizar e Inserir.'
Otimização push-down
Depois que o layout é definido e o fluxo executado, o Astera A transformação SCD gera o código SQL necessário para comparar, unir, rotear e inserir dados em sua dimensão de destino e envia a lógica de transformação para um banco de dados, como o SQL Server, para processamento.
Usando essa abordagem, a manutenção de atributos de grande dimensão é significativamente mais rápida porque todo o processamento é feito pelo banco de dados e não pelo banco de dados. Centerprise servidor executando as operações e indo e voltando entre o banco de dados para ler, comparar e gravar os dados.
Para saber mais sobre o componente Dimensões de mudança lenta automatizada em Centerprise e como usá-lo para gerenciar suas dimensões, faça o download do white paper: Como gerenciar dimensões que mudam lentamente usando Centerprise.
autores:
- Iqbal Ahmed