Blog

Inicio / Blog / ¿Realmente necesita una bóveda de datos?

Tabla de Contenido
El automatizado, Sin código Pila de datos

Aprende cómo Astera Data Stack puede simplificar y agilizar la gestión de datos de su empresa.

¿Realmente necesita una bóveda de datos?

4 de abril de 2024

La metodología de modelado de Data Vault 2.0 ha ganado una inmensa popularidad desde su lanzamiento en 2013. Es un modelo híbrido que combina los beneficios de la tercera forma normal (3NF) y las arquitecturas de esquema en estrella, lo que lo convierte en una solución de ensueño para los ingenieros de almacenamiento de datos.

Pero, ¿vale la pena implementarlo para su arquitectura de almacenamiento de datos? La respuesta no es sencilla, ya que hay muchos factores a considerar. Entonces, profundicemos y exploremos si Data Vault 2.0 es adecuado para usted.

¿Cuándo debería implementar una bóveda de datos?

La arquitectura de la bóveda de datos está destinada a ser complementaria a la esquema de estrella metodología de modelando su almacén de datos. Actúa como una capa adicional entre las capas de preparación y de informes.

3NF y el esquema en estrella son excelentes arquitecturas independientes, pero ambas tienen sus pros y sus contras. Un modelo 3NF proporciona redundancia de datos reducida y requiere menos espacio de almacenamiento, pero puede ser difícil de consultar debido a la gran cantidad de tablas. Un esquema en estrella está optimizado para un rendimiento de consultas y un mantenimiento del historial más rápidos, pero puede ser complejo y llevar mucho tiempo.

Ahí es donde entra en juego la bóveda de datos.

La mayor ventaja de contar con una bóveda de datos es su adaptabilidad al cambio. Si su arquitectura de origen es propensa a cambios, como la adición o eliminación de columnas, nuevas tablas o relaciones nuevas/alteradas, definitivamente debe implementar una bóveda de datos.

Un modelo 3NF tiene dependencias de entidad altas, dado que las entidades están correlacionadas. Cada vez que se agrega algo nuevo o se realiza un cambio en el modelo, debe modificar los vínculos de relación existentes, lo que puede causar problemas de integridad referencial. Por el contrario, un modelo de bóveda de datos contiene tablas de vínculos independientes que representan los vínculos entre tablas. Podría incorporar cambios fácilmente, como agregar nuevas fuentes a la arquitectura o modificar el esquema existente, agregando nuevas tablas de vínculos al modelo.

Un beneficio adicional de estas tablas de enlaces es su capacidad para atender relaciones de muchos a muchos. En un modelo 3FN, tendría que crear una tabla puente para mantener este tipo de relación, pero las tablas de enlace tienen la capacidad inherente de hacerlo. No se requieren cambios de esquema incluso cuando cambia una relación de uno a muchos a muchos a muchos.

Además, las bóvedas de datos brindan auditabilidad mediante el uso de tablas satelitales para mantener registros históricos de los cambios realizados en los datos de origen. En términos de modelado dimensional, SCD tipo 2 se aplica esencialmente a cada campo, asegurando que se mantenga el historial. De esta manera, puede realizar un seguimiento de todo tipo de cambios que se produzcan en los datos. Además, la tabla de satélites también contiene campos de fuente y tiempo récord, lo que facilita una auditoría integral.

Una arquitectura de bóveda de datos permite carga paralela, ya que no se requieren búsquedas, a diferencia de un modelo dimensional que requiere una búsqueda de dimensión para obtener la clave sustituta activa para un hecho. Además, no hay restricciones de clave externa; Las claves hash se pueden calcular fácilmente utilizando las claves comerciales en la capa de preparación, lo que anula la necesidad de una búsqueda y hace posible completar y mantener varias tablas en paralelo. Máxima calificación por eficiencia!

Hasta ahora, solo hemos hablado de la bóveda sin procesar, y es evidente que su implementación tiene enormes ventajas. Por otro lado, Business Vault proporciona un conjunto separado de entidades, como tablas puente y de un punto en el tiempo, que se pueden usar como un margen de maniobra hacia la capa de informes (esquema en estrella) o se puede acceder directamente para generar informes.

La combinación de la bóveda sin procesar y la bóveda comercial puede servir como instrumentos poderosos en el conjunto de herramientas de un arquitecto de almacenamiento de datos. Pero, ¿son una parte esencial del ciclo de vida de desarrollo de su almacén de datos? Mmm ¡no exactamente!

¿Cuándo es exagerado?

Tomemos un escenario en el que tiene un sistema de origen ERP que contiene diez años de datos que desea cargar en un almacén de datos y utilizar para generar informes. No se esperan cambios en la arquitectura ni en los datos en sí; su único objetivo es obtener información a partir de la información disponible.

En tal situación, la adaptabilidad no es un requisito ya que no se esperan cambios en la arquitectura; no es necesario agregar nuevas relaciones, campos o tablas. Además, no necesitaría auditar datos que no esperan actualizaciones de la(s) fuente(s).

Diseñar una bóveda sin procesar puede ser una tarea tediosa y que requiere mucho tiempo. Si su único objetivo es generar informes a partir de sus datos, ¿por qué tomarse la molestia? Puede pasar directamente de la base de datos provisional a un esquema en estrella, posiblemente la mejor opción de creación de informes.

Conclusión

Ahora que hemos discutido todos los factores a considerar, he aquí una conclusión:

La implementación de una bóveda de datos es opcional y depende completamente de su entorno de datos y sus requisitos. Si está buscando una arquitectura auditable y adaptable, tiene sentido diseñar un almacén sin procesar encima de su capa de ensayo. A continuación, podría crear una bóveda de negocios para habilitar informes significativos directamente desde la bóveda o a través de una capa de informes complementaria, como un esquema en estrella.

Sin embargo, si tiene fuentes de datos estáticas y su requisito principal es obtener información de sus datos, diseñar una bóveda de datos sería una pérdida de tiempo. En resumen, si no se requieren adaptabilidad y auditabilidad, no sirve de nada tener una bóveda de datos entre las capas de preparación e informes.

Si pertenece a la categoría de ingenieros de datos que necesitan una bóveda de datos como parte de su ecosistema, tenga en cuenta que la creación de centros, enlaces, satélites, puentes y tablas de puntos en el tiempo, por nombrar algunos de los muchos componentes del bóvedas sin procesar y comerciales: pueden volverse altamente técnicas y requerirían un conocimiento de programación extremo. Pero no temas; hay una salida fácil!

Astera DW Builder proporciona un diseñador de modelos de datos con una interfaz visual, que incluye capacidades de arrastrar y soltar y hacer clic y señalar, para que diseñe una bóveda de datos con el mínimo esfuerzo. Además, la capacidad de automatización de la herramienta le permitirá derivar un esquema de bóveda de datos a partir de un modelo de datos de origen con solo un par de clics. En pocas palabras, no hay nada más fácil que eso.

Descubra la mejor manera de implementar una bóveda de datos. Contáctenos en [email protected] ¡hoy!

También te puede interesar
Las 7 principales herramientas de agregación de datos en 2024
Marco de gobernanza de datos: ¿qué es? Importancia, Pilares y Mejores Prácticas
Las mejores herramientas de ingesta de datos en 2024
Considerando Astera ¿Para sus necesidades de gestión de datos?

Establezca conectividad sin códigos con sus aplicaciones empresariales, bases de datos y aplicaciones en la nube para integrar todos sus datos.

¡Conectémonos ahora!
conectemos