Se você conversou com um engenheiro ou arquiteto de dados sobre a construção de um design ágil de data warehouse ou a manutenção de um arquitetura de armazém de dados, você provavelmente os ouviria dizer que é um processo contínuo e que não tem um fim definido. E isso, em essência, é basicamente a verdade.
Um design de data warehouse bem-sucedido geralmente usa uma abordagem ágil e métodos de desenvolvimento iterativos que garantem o fornecimento de insights de qualidade aos usuários finais com base nos dados de negócios atuais.
Felizmente, armazém de dados na nuvem provedores, como Microsoft Azure e Amazon Redshift, oferecem flexibilidade rápida e opções de escalabilidade que tornam a adoção dessa abordagem relativamente mais fácil do que as estruturas tradicionais rígidas. E, consequentemente, ter uma arquitetura em constante evolução significa que você terá acesso a dados precisos e atualizados para alimentar suas análises, permitindo que equipes e departamentos atinjam seus respectivos objetivos.
Como Geoffrey Moore disse com razão:
“Sem análises de big data, as empresas ficam cegas e surdas, vagando pela web como cervos em uma rodovia.”
Então, como você pode construir seu próprio design ágil de data warehouse, como esse processo iterativo armazenamento de dados solução funciona, e quais resultados uma equipe de engenheiros e analistas de negócios de data warehouse pode esperar dela?
Criando uma infraestrutura de data warehouse mais adaptável e responsiva
Em um modelo de desenvolvimento iterativo, o data warehouse está em um estado constante de melhoria e evolução. Em vez de criar uma arquitetura que responda a todas as perguntas no primeiro dia, sua equipe se concentra nas informações que mais importam para seus usuários de negócios. Você precisa priorizar o que é importante, colocá-los em pequenos segmentos gerenciáveis e, em seguida, realizar várias rodadas para modificar a arquitetura do data warehouse com base nos requisitos do seu negócio.
Para conseguir isso, as equipes de dados trabalham em vários sprints e ciclos, fazendo alterações no ETL fluxos, modelos dimensionaise outros processos de dados após receber feedback de analistas de negócios e outras partes interessadas. Após cada ciclo, o feedback contínuo garante que essas implementações forneçam uma imagem real do desempenho dos negócios e resolvam efetivamente os pontos problemáticos e as lacunas.
O que você precisa para construir um data warehouse ágil?
Além de uma equipe dedicada de arquitetos e analistas de dados, você precisará essencialmente de um ferramenta de armazenamento de dados que oferece um ambiente de desenvolvimento sem código para facilitar mudanças rápidas, permitindo eliminar a rigidez da arquitetura.
Principais componentes de AsteraConstrutor de Data Warehouse
Dito isto, quase qualquer organização pode implantar uma solução ágil de data warehousing, desde que tenha a pilha de tecnologia certa para alimentar a iniciativa. Em essência, uma ferramenta de armazenamento de dados deve fornecer:
- Recursos de modelagem de dados de origem que pode facilmente mapear e construir relacionamentos entre suas fontes de dados
- Funcionalidade de modelagem dimensional que pode ajudar a determinar fatos e dimensões com base nos dados de origem e gerar o esquema e as tabelas que caberiam em seu armazém de destino
- A motor ETL de alto desempenho para simplificar e acelerar a agregação de dados e oferecer uma variedade de opções de transformação, como normalização, desnormalização, mesclagem, junção e muito mais
- A opção de mudar para ELT ou modo pushdown para reduzir o tempo para transformar e acessar dados de negócios rapidamente
- Módulos de qualidade de dados para garantir que cada byte de dados atenda aos padrões de qualidade de sua organização
- Uma ampla variedade de aplicativos da web, bancos de dados e nuvem de Saúde para conectar e trazer seus dados de negócios para seu data warehouse
- Alterar lentamente as dimensões (Tipos 1-6) para controlar como os diferentes campos de dados são preenchidos nas tabelas do banco de dados
- Suporte para Serviço OData para fornecer maneiras seguras para os usuários finais acessarem dados para relatórios e análises
Esta não é uma lista exaustiva, mas apenas uma visão geral dos principais recursos e funcionalidades necessários. Agora, você pode encontrar muitos provedores de soluções que unem várias ferramentas e criam um pacote personalizado para fechar as lacunas de funcionalidade. No entanto, a maneira recomendada é optar por um plataforma unificada que marca todas essas caixas para atender às suas necessidades de armazenamento de dados.
Ok, parece ótimo. Mas por que devo considerar essa abordagem?
Bem, aqui está o porquê:
O principal objetivo de qualquer implementação ágil de design de data warehouse é fornecer respostas apoiadas por dados confiáveis com base no cenário de negócios atual.
Mas o problema é que as empresas em crescimento adquirem novas fontes de dados e fazem alterações no fluxo de informações em aplicativos e bancos de dados para corresponder ao ritmo de suas necessidades de negócios crescentes. Todas essas novas fontes e atualizações estruturais precisam ser levadas em consideração nos modelos de dados existentes e refletidas no repositório centralizado para fornecer dados precisos e confiáveis aos usuários finais.
Como tal, a abordagem iterativa segue a metodologia ágil que permite projetar, desenvolver e implantar a arquitetura mais flexível e orientada a resultados para construir seu data warehouse corporativo. Você pode incluir facilmente novos fluxos de dados sem precisar revisitar ou reescrever scripts ETL, e isso também em questão de algumas horas, se não minutos. Isso ocorre principalmente porque as ferramentas modernas de data warehousing fornecem um ambiente de desenvolvimento sem código e automação de processos de ponta a ponta, permitindo que você faça alterações rápidas em seus fluxos e crie melhores processos de ETL.
Além disso, você também pode aproveitar os benefícios em vários cenários. Seja planejando e estrategicamente o processo de armazenamento de dados, implantando protótipos para testar sua viabilidade ou realizando testes de ETL para garantir resultados consistentes, essa metodologia ágil facilita o processo de desenvolvimento em todas as fases.
Talvez, o valor real dessa abordagem seja visto nos benefícios de negócios que as organizações podem gerar com sua implementação. Estes incluem, mas não se limitam a:
- Resultados mais rápidos para atender aos requisitos de análise e inteligência de negócios do Data Warehouse (DW BI) do usuário final
- Melhor alinhamento com as necessidades de negócios em evolução
- Capacidade de acelerar a prototipagem e análise de viabilidade
- TCO mais baixo devido a processos de desenvolvimento simplificados
- Insights de alta qualidade e atualizados sobre tomadas de decisão robustas
- Complexidade do projeto reduzida devido a ciclos menores e mais gerenciáveis
- A capacidade de identificar deficiências mais rapidamente, levando a uma melhor gestão de risco
- Maior transparência no progresso, desempenho e desafios em cada iteração
Uma solução que se encaixa na conta
“A arquitetura tradicional é muito lenta. Não temos mais o luxo de dois ou três meses. Precisamos ser capazes de dizer aos usuários: 'Podemos ter isso para você - em dois a três dias.' ” - Rick van der Lans
Da fonte aos insights – 7 passos
E é aqui que as soluções de armazenamento de dados modernas, como Astera Construtor de DW, chegam que são conhecidos por reduzir significativamente o tempo de desenvolvimento por meio da automação de ponta a ponta. Ele fornece uma estrutura de armazenamento de dados unificada que permite a uma empresa ir desde a coleta de requisitos até a análise por meio da integração direta com o software de visualização de dados.
Interessado em criar seu próprio data warehouse com base em um método de desenvolvimento ágil e iterativo? Dê o primeiro passo e obtenha um demonstração ao vivo personalizada de Astera Construtor de DW.
autores:
- Junaid Baig