Blog

Inicio / Blog / Configuración e implementación de modelos dimensionales listos para SCD para un almacenamiento de datos óptimo

Tabla de Contenido
El automatizado, Sin código Pila de datos

Aprende cómo Astera Data Stack puede simplificar y agilizar la gestión de datos de su empresa.

Configuración e implementación de modelos dimensionales listos para SCD para almacenamiento de datos óptimo

24 de agosto, 2023

El modelado dimensional sigue siendo el enfoque de modelado más confiable para diseñar un almacén de datos para informar casos de uso. Su estructura desnormalizada mejora significativamente el rendimiento de las consultas, lo que permite un consumo de datos e informes rápidos y sin problemas. Las dimensiones en un uso de almacén de datos centrado en el modelo Dimensión de cambio lento (SCD) mantener datos históricos para registrar y reportar. Los SCD identifican cualquier cambio en los registros existentes o nuevos y se mantienen en las tablas de su almacén de datos. Pero más sobre SCD en un momento.  

Más información sobre la generación de esquemas de base de datos mediante ingeniería directa automatizada

Los SCD son una característica importante de sus tablas de dimensiones, ya que determinan el mantenimiento de los registros históricos en las filas de dimensiones. Sin embargo, agregar múltiples SCD a diferentes campos necesitaría varias líneas de código SQL complicado.  

Pero como siempre decimos, donde hay un camino complicado, también hay Astera's camino. En el Astera entorno DW Builder, puede agregar SCD en minutos, sin escribir código. 

Este blog lo guiará a través de cómo agregar dimensiones de cambio lento (SCD) a su modelo dimensional y verificar e implementar ese modelo con solo unos pocos clics usando Astera Constructor de DW. 

Configurando las Dimensiones que cambian lentamente:

Este es nuestro modelo de datos dimensionales de muestra, diseñado con Astera DW Builder: basado en una base de datos ficticia de World Wide Importers.

En este modelo, una tabla de hechos (Líneas de factura) es unidos por múltiples dimensiones (artículos en stock, detalles del cliente, proveedores y ciudades). Si bien este es un modelo dimensional automatizado, siempre podemos volver a visitar entidades individuales para configurar roles de dimensión, por ejemplo, SCD.  

Paso 1: Acceda a la columna de función de dimensión en Propiedades de dimensión 

simplemente habiertos el constructor de diseño para una dimensión al dirigirse a sus propiedades. El constructor de diseño contiene una separacion columna para definición manual de roles para cada una campo de dimensión. 

seleccionando scds en DW Buildee

Dimensione los roles de SCD para cada campo en una tabla de dimensiones.

Paso 2: Elija las dimensiones de cambio lento deseadas 

Asigne el tipo de SCD deseado de las cuatro opciones disponibles (SCD 1, 2, 3 y 6) a cada campo según cómo desee mantener los datos en su almacén de datos.  

En este ejemplo, seleccionaremos SCD Tipo 2—Actualizar e Insertar—como rol de dimensión para el campo 'StockItemName'. Ahora, lógicamente hablando, cualquier cambio en StockItemName se reflejaría como una nueva fila con el nombre actualizado. Además, el campo de designación de registro actual automatizado garantizaría que el último registro, o StockItemName, sea identificable en este caso.  

elegir el SCD correcto en DW Builder

Asignación de SCD 2 a un campo de dimensión.

De ahora en adelante, cualquier cambio en StockItemName en la fuente aparecerá como un registro actualizado en la tabla de dimensiones.   

Por ejemplo, así es como se ven los datos de vista previa de StockItemName después de que cambiamos un registro dos veces en los datos de origen. El campo CurrentRecordDesignator muestra el último registro. 

Datos de vista previa después de cambios en StockItemName. El 'Lanzador de misiles USB (Verde - Nombre nuevo)' es el último cambio en el campo.

Paso 3: marca la derecha roles para la dimensión requerida campos 

Asignamos SCD específicos en la columna de rol de dimensión de cada entidad bbasado en como podemos plan al actualizar datos en el almacén de datos.

Tipos de dimensiones que cambian lentamente

Tipos de dimensiones de cambio lento (SCD)

Asignemos SCD 6 al campo 'Precio unitario' y cambiemos un valor de campo en la tabla de origen varias veces.  

Así es como aparecerán los datos de vista previa para el campo completo (Precio unitario) después de algunos cambios en la fuente: 

Los cambios en el precio unitario se reflejan en dos columnas, que representan los precios unitarios nuevos y antiguos, y una nueva fila que muestra los registros actualizados.

Después de asignar los roles de dimensión específicos según nuestras necesidades de almacenamiento de datos, el siguiente paso es verificar e implementar el modelo para el consumo.  

Verificaring y despliegue el modelo dimensional: 

We debe verificar nuestro modelo antes de su despliegue. Astera tiene una verificación de modelo de datos incorporada módulo que escanea automáticamente el modelo en busca de errores afectando el fisico despliegue. 

Verificación del modelo de datos en Astera Generador de almacenamiento de datos

Verificación del modelo de datos para la implementación de lectura y escritura

Así es un ejemplo de cómo la verificación módulo identifica común errores que afectan a la implementación 

Asignación de una clave comercial

Este error muestra que no hay una clave comercial definida en nuestro StockItem. Simplemente asigne una clave comercial a StockItemID en la dimensión StockItem para corregir el error.

Después de la verificación del modelo de datos, desplegamos el almacén de datos en nuestro servidor usando el 'Modelo de datos de implementación' botón en la barra de herramientas. Antes de la implementación, debemos especificar el nombre del modelo de datos y la ruta al archivo de configuración, que se puede usar para modificar parámetros del modelo de datos. 

Implementación del modelo de datos en Astera Generador de almacenamiento de datos

Presione el botón de implementación e identifique la ruta al archivo de configuración del modelo de datos.

Finalmente, tEl modelo se implementa como una base de datos virtual en el servidor. Este despliegue—en las forma de Astera Modelo de datos: puede servir para múltiples propósitos. Por ejemplo, podemos usarlo en canalizaciones ETL para completar el modelo dimensional o consumirlo para BI y análisis..

Configuración e implementación de modelos dimensionales con Astera Constructor DW 

Configurar modelos dimensionales con SCD e implementarlos para el consumo no puede ser más fácil que eso. No necesita realizar secuencias de comandos manuales o consultas complejas para asignar roles de dimensión o implementar modelos de almacenamiento de datos. Esto es todo lo que necesitas hacer: 

  • Asigne roles SCD a entidades en el modelo dimensional a través de una interfaz de arrastrar y soltar.
  • Verifique los modelos para descartar posibles errores.
  • Despliega los modelos con solo un clic.  

Así es exactamente como se reduce el ciclo de vida de diseño y desarrollo del almacén de datos hasta en un 80 %. 

Mas recursos

Quieres saber como Astera automatiza lo contrario complejo modelado dimensionalg? Lee nuestro How-To blog on Diseño de un modelo dimensional automatizado.

Aprenda a generar automáticamente un esquema físico de su diseño de modelo de datos esta página.  

También te puede interesar
Las 7 principales herramientas de agregación de datos en 2024
Marco de gobernanza de datos: ¿qué es? Importancia, Pilares y Mejores Prácticas
Las mejores herramientas de ingesta de datos en 2024
Considerando Astera ¿Para sus necesidades de gestión de datos?

Establezca conectividad sin códigos con sus aplicaciones empresariales, bases de datos y aplicaciones en la nube para integrar todos sus datos.

¡Conectémonos ahora!
conectemos