¿Cómo Astera Centerprise Agiliza la conectividad a la base de datos Amazon Redshift

By |2021-08-09T08:28:06+00:0028 julio,2020|

Amazon Redshift es una solución basada en la nube que cae bajo el paraguas de Amazon Web Services. Los bajos requisitos de mantenimiento, la escalabilidad, la velocidad y las funciones de compresión eficientes lo convierten en una opción popular de almacenamiento de datos para empresas que manejan grandes cantidades de datos.

Para hacer integración de datos con esta base de datos (DB) más fácil, Astera Centerprise ha lanzado un conector preconstruido que permite una conectividad sin código a Redshift. Este conector se puede utilizar como objeto de origen y de destino para acceder y almacenar datos. Además, los usuarios también pueden conectarse a la base de datos Redshift y usarla para la búsqueda de bases de datos y la búsqueda de instrucciones SQL.

Cómo conectarse a la base de datos Redshift con Astera Centerprise

Astera Centerprise cuenta con un entorno de arrastrar y soltar, lo que permite a los usuarios comerciales conectarse a Redshift DB sin escribir largos fragmentos de código o especificar cadenas de conexión. Configure fácilmente la conectividad de Redshift para procesar datos o realizar búsquedas de bases de datos seleccionando Amazon Redshift en la lista desplegable de bases de datos compatibles.

Conector Redshift en la lista de proveedores de datos

Figura 1: Desplácese por la lista de proveedores de datos admitidos por Astera Centerprise y conectarse a Redshift

Base de datos Redshift como fuente

Arrastre el fuente de tabla de base de datos objeto de la caja de herramientas y suéltelo en la ventana del diseñador para conectarse a la base de datos de Redshift y usarlo como un objeto de origen. A continuación, puede configurarlo seleccionando Redshift como proveedor de datos en la lista desplegable.

En el siguiente paso, debemos seleccionar la tabla de la que se obtendrán los datos. En este caso, estamos seleccionando una tabla con los detalles del empleado denominada pedidos.públicos. Podemos hacer clic en la opción Tabla de particiones para lectura para dividir la tabla en segmentos más pequeños que se leerán individualmente. Esta opción se puede seleccionar para reducir la carga en la base de datos y mejorar el rendimiento. Aquí, también tenemos la opción de seleccionar el campo clave para dividir la tabla en particiones.

Otra opción en la tabla de propiedades de la base de datos es para especificar la Estrategia de lectura. Aquí, podemos decidir si queremos leer los datos completos (carga completa) o solo los registros actualizados (carga incremental basada en campos de auditoría).

Seleccionar tabla y estrategia de lectura para la tabla Redshift

Figura 2: Selección de la tabla y estrategia de lectura para nuestra fuente de base de datos

La siguiente pantalla muestra Layout Builder para la tabla de origen de la base de datos. Aquí, podemos ver los tipos de datos y las longitudes de cada campo junto con algunos otros detalles.

Generador de diseño de tabla de base de datos Redshift

Figura 3: El generador de diseño de la tabla de base de datos de Redshift con detalles sobre el tipo de datos y la longitud de cada campo.

Los datos de esta tabla de Redshift se pueden procesar de múltiples maneras usando varias transformaciones incorporadas disponibles en Centerprise y cargado en un archivo, base de datos o cualquier otro destino disponible.

Transformación de filtro que se aplica a la tabla Redshift

Figura 4: Un flujo de datos que muestra un filtro que se aplica a los datos procedentes de una tabla Redshift y se asigna a un objeto de destino de Excel

La captura de pantalla anterior muestra un flujo de datos que filtra los datos de la tabla Pedidos mediante una transformación de filtro y se asigna a un archivo de destino de Excel llamado FilteredRedshiftData.

Base de datos Redshift como destino

Los usuarios también pueden conectarse a la base de datos de Amazon Redshift y configurarla como un objeto de destino. Para esto, el destino de la tabla de base de datos el objeto debe arrastrarse desde la caja de herramientas y soltarse en el diseñador. A continuación, debemos apuntar el objeto de destino a la base de datos Redshift de la siguiente manera:

Configurar una tabla de destino de Redshift

Figura 5: Configuración de un objeto de destino de tabla de base de datos con Redshift como proveedor de datos.

La imagen también muestra una opción en la que los usuarios pueden agregar sus credenciales de Amazon Simple Storage Service (S3) para cargar datos de forma masiva a Redshift DB.

Una vez que Redshift ha sido seleccionado como proveedor de datos, el usuario debe decidir si desea elegir una tabla existente, crear una nueva o sobrescribir los datos presentes en una existente. En este caso, hemos creado una nueva tabla en la base de datos y la hemos denominado WebAggregate.

 

Crear una nueva tabla Redshift

Figura 6: Se crea una nueva tabla de base de datos llamada WebAggregate para cargar datos de forma masiva.

En este ejemplo, los datos de un Objeto de origen de base de datos denominado WebConnectionRegistration se agrega y pasa a la tabla de la base de datos WebAggregate. El flujo de datos completo es el siguiente:

Asignación de datos agregados a una tabla de destino de Redshift

Figura 7: Los datos de una tabla de base de datos se agregan y se asignan a una tabla de destino de Redshift.

Aproveche al máximo la conectividad bidireccional con Redshift con Astera Centerprise

Los datos en la base de datos Redshift se pueden comprimir de manera mucho más eficiente que en las bases de datos basadas en filas, lo que reduce el tiempo de procesamiento y el tiempo para obtener información. Debido a los beneficios de Redshift sobre las bases de datos locales, las empresas que necesitan almacenar y procesar grandes cantidades de datos están buscando formas de crear un ecosistema empresarial bien conectado mediante la conexión a Redshift. A diferencia de los conectores que requieren mucha configuración manual, Astera CenterpriseEl conector Redshift hace que acceder y almacenar datos en la base de datos sea muy simple y conveniente.

Aquí hay algunos beneficios de usar Astera CenterpriseEl conector nativo de Redshift:

Conectividad ininterrumpida

Los usuarios no tienen que pasar por un proceso de configuración largo y complicado para conectarse a Redshift. Establecer una conexión es tan simple como seleccionar el proveedor de datos correcto de una lista desplegable y señalar el objeto de la base de datos a la tabla correcta.

Facilidad de acceso

Conexión a Redshift usando Astera CenterpriseEl conector incorporado permite a los usuarios recuperar, transformar y cargar datos en el sistema de destino requerido con una mínima intervención de TI.

Automatización del flujo de trabajo

Con la ayuda de los Astera Centerprise, los usuarios pueden automatizar sus flujos de trabajo de integración de Redshift para reducir el tiempo requerido para el análisis y aumentar la eficiencia del proceso.

El eficiente almacenamiento de datos de Amazon Redshift, el procesamiento paralelo y las capacidades de consulta simple lo convierten en una opción popular para las empresas interesadas en el análisis de datos. Con Astera CenterpriseComo conector nativo, las empresas pueden usar fácilmente los datos de Redshift para obtener información y tomar decisiones basadas en datos.

Descargar la prueba versión de Astera Centerprise y aproveche al máximo la conectividad de Redshift.

Centerprise Banner de extractor de datos