O Amazon Redshift é uma solução baseada em nuvem sob o guarda-chuva da Amazon Web Services. Os baixos requisitos de manutenção, escalabilidade, velocidade e recursos de compactação eficientes o tornam uma opção de armazenamento de dados popular para empresas que lidam com grandes quantidades de dados. Fazer integração de dados com o banco de dados Redshift (DB) mais fácil, Astera Centerprise lançou um conector pré-construído. O conector interno pode ser usado como objeto de origem e destino para acessar e armazenar dados. Os usuários também podem se conectar ao banco de dados Redshift e usá-lo para pesquisa de banco de dados e pesquisa de instrução SQL.
Como conectar-se ao banco de dados Redshift com Astera Centerprise
Astera Centerprise apresenta um ambiente de arrastar e soltar, permitindo que os usuários de negócios se conectem ao Redshift DB sem digitar longos trechos de código ou especificar strings de conexão. Configure facilmente a conectividade Redshift para processar dados ou realizar pesquisas de banco de dados selecionando Amazon Redshift na lista suspensa de bancos de dados suportados.
Figura 1: Percorra a lista de provedores de dados suportados por Astera Centerprise e conecte-se ao Redshift
Banco de dados Redshift como fonte
Arraste o origem da tabela de banco de dados objeto da caixa de ferramentas e solte-o na janela do designer para conectar-se ao banco de dados do Redshift e usá-lo como um objeto de origem. Em seguida, você pode configurá-lo selecionando Redshift como o provedor de dados na lista suspensa.
Na próxima etapa, precisamos selecionar a tabela da qual os dados serão obtidos. Neste caso, estamos selecionando uma tabela com detalhes do funcionário chamado pedidos.públicos. Podemos clicar na opção Partition Table para a opção Reading para quebrar a tabela em segmentos menores que serão lidos individualmente. Essa opção pode ser selecionada para reduzir a carga no banco de dados e melhorar o desempenho. Aqui, também podemos selecionar o campo chave para dividir a tabela em partições.
Outra opção na tabela de propriedades do banco de dados é especificar a Estratégia de Leitura. Aqui, podemos decidir se queremos ler os dados completos (carga completa) ou apenas os registros atualizados (carga incremental baseada em campos de auditoria).
Figura 2: Selecionando a tabela e estratégia de leitura para nossa fonte de banco de dados
A próxima tela mostra o Layout Builder para a Tabela de Origem do Banco de Dados. Aqui, podemos ver os tipos de dados e comprimentos de cada campo, juntamente com alguns outros detalhes.
Figura 3: O Layout Builder da tabela de banco de dados Redshift com detalhes sobre o tipo de dados e o comprimento de cada campo.
Os dados desta tabela Redshift podem ser processados de várias maneiras, usando várias transformações internas disponíveis em Centerprise e carregado em um arquivo, banco de dados ou qualquer outro destino disponível.
Figura 4: um fluxo de dados mostrando um filtro sendo aplicado a dados originados de uma tabela Redshift e mapeados em um objeto de destino do Excel
A captura de tela acima mostra um fluxo de dados que filtra os dados da tabela Pedidos usando uma transformação de Filtro e mapeados em um arquivo de destino do Excel denominado FilteredRedshiftData.
Banco de dados Redshift como destino
Os usuários também podem se conectar ao banco de dados Amazon Redshift e configurá-lo como um objeto de destino. Para isso, o destino da tabela de banco de dados O objeto precisa ser arrastado da caixa de ferramentas e solto no designer. Em seguida, precisamos apontar o objeto de destino para o banco de dados Redshift da seguinte maneira:
Figura 5: Configurando um objeto de destino da tabela de banco de dados com Redshift como provedor de dados.
A imagem também mostra uma opção onde os usuários podem adicionar suas credenciais do Amazon Simple Storage Service (S3) para carregar dados em massa para o banco de dados Redshift.
Uma vez que Redshift foi selecionado como o provedor de dados, o usuário precisa decidir se deseja escolher uma tabela existente, criar uma nova ou substituir os dados presentes em uma existente. Nesse caso, criamos uma nova tabela no banco de dados e a nomeamos WebAggregate.
Figura 6: Uma nova tabela de banco de dados chamada WebAggregate é criada para carregar dados em massa.
Neste exemplo, os dados de um Objeto de origem do banco de dados denominado WebConnectionRegistration é agregado e passado para a tabela de banco de dados WebAggregate. O fluxo de dados completo é o seguinte:
Figura 7: Dados de uma tabela de banco de dados são agregados e mapeados para uma tabela de destino Redshift.
Aproveite ao máximo a conectividade bidirecional com o Redshift com Astera Centerprise
Os dados no banco de dados Redshift podem ser compactados com muito mais eficiência do que nos bancos de dados baseados em linhas, reduzindo o tempo de processamento e o tempo de percepção. Devido aos benefícios do Redshift em relação aos bancos de dados locais, as empresas que precisam armazenar e processar grandes quantidades de dados estão procurando maneiras de criar um ecossistema corporativo bem conectado, conectando-se ao Redshift. Ao contrário dos conectores que exigem muita configuração manual, Astera CenterpriseO conector Redshift do simplifica e facilita o acesso e o armazenamento de dados no banco de dados.
Aqui estão alguns benefícios do uso Astera Centerpriseconector nativo do Redshift:
Conectividade ininterrupta
Os usuários não precisam passar por um processo de configuração longo e complicado para se conectar ao Redshift. Estabelecer uma conexão é tão simples quanto selecionar o provedor de dados correto em uma lista suspensa e apontar o objeto de banco de dados para a tabela correta.
Facilidade de Acesso
Conectando ao Redshift usando Astera CenterpriseO conector embutido permite que os usuários recuperem, transformem e carreguem dados no sistema de destino necessário com o mínimo de intervenção de TI.
Automação de fluxo de trabalho
Com a ajuda de Astera Centerprise, os usuários podem automatizar seus fluxos de trabalho de integração Redshift para reduzir o tempo necessário para análise e aumentar a eficiência do processo.
O armazenamento eficiente de dados, o processamento paralelo e os recursos simples de consulta do Amazon Redshift fazem dele uma escolha popular para empresas interessadas em análise de dados. Com Astera Centerprise, as empresas podem otimizar a conectividade do banco de dados Redshift e gastar mais tempo tomando decisões baseadas em dados.