¿Qué es Data Mart? Diseño, ejemplos e implementación explicados

By |2021-03-31T11:55:20+00:00Marzo 31st, 2021|

A diferencia de un almacén de datos que almacena datos de toda la empresa, un data mart incluye información relacionada con un departamento o área temática en particular. Por ejemplo, la despensa de datos de ventas puede contener datos relacionados con productos, clientes y ventas únicamente. Obtendremos una comprensión adecuada de la despensa de datos en un almacén de datos a continuación.

Definición de Data Mart: ¿Qué son los Data Marts?

Los data marts se definen como la versión más pequeña del data warehouse que se ocupa de un solo asunto. A menudo son construidos y administrados por un solo departamento comercial. Dado que están orientados al tema, los mercados de datos generalmente toman datos de solo una pequeña cantidad de fuentes, que podrían ser sistemas operativos internos, un repositorio de datos centralizado o fuentes externas. Los data marts suelen estar condensados ​​y son menos complejos que los almacenes de datos, lo que hace que los data marts sean más fáciles de construir y mantener.

En este blog, cubriremos tres tipos diferentes de data marts y sus usos. También ilustraremos una guía paso a paso sobre cómo implementar un data mart para su negocio.

Tipos de marts de datos

Fuente: Study.com

Beneficios de Data Mart para la gestión de bases de datos

Antes de discutir los diversos tipos de data marts, veamos brevemente algunos de los beneficios de los data marts y por qué son necesarios para una empresa basada en datos.

  • Un data mart permite un acceso más rápido a los datos al recuperar un conjunto específico de datos para BI e informes. Como resultado, ayuda a acelerar los procesos comerciales.
  • Al estar centrado en el tema, es más fácil implementar un mercado de datos y más rentable en comparación con la construcción de una empresa. almacenamiento de datos.
  • Usar un data mart es fácil porque está diseñado de acuerdo con los requisitos de un grupo particular de usuarios que trabajan en un departamento específico.
  • Un data mart es comparativamente más adaptable que un data warehouse. Cualquier cambio en el modelo de datos puede incorporarse fácil y rápidamente en el mercado de datos debido a su tamaño más pequeño.
  • En una despensa de datos, los datos se dividen y segmentan, lo que permite derechos de control de acceso granular.

En resumen, los data marts son mucho más rápidos, adaptables y rentables de mantener en comparación con un data warehouse. Los almacenes de datos se crean para consolidar datos de una gran variedad de fuentes (a menudo, no en un formato estructurado).

Por otro lado, los data marts son utilizados por una sola unidad de negocio para almacenar su información. Digamos que los departamentos de ventas o de mercado tienen que almacenar sus datos comerciales. Utilizarán un data mart para almacenarlo. Cuando la información deba ser visualizada por los superiores, se cargará en un almacén de datos y luego se transformará en información mediante el software de BI.

Tipos de Data Marts

Los data marts se pueden clasificar en tres tipos principales:

1. Centro de datos dependiente

Un centro de datos dependiente le permite combinar todos sus datos comerciales en un solo almacenamiento de datos, ofreciéndole los beneficios típicos de la centralización.

En caso de que se necesiten uno o varios marts de datos físicos, deberá construirlos como marts de datos dependientes para garantizar la coherencia y la integración en todos los sistemas de almacenamiento de datos.

Los marts de datos dependientes se pueden construir utilizando dos enfoques diferentes. En el primer enfoque, el almacén de datos empresariales, así como los data marts, se crean para que el operador pueda acceder a ambos, siempre que sea necesario. En el segundo enfoque, también conocido como enfoque federado, los resultados del proceso ETL se almacenan en un área de almacenamiento temporal, como un bus de datos común, en lugar de una base de datos física, por lo que el operador solo puede acceder al data mart.

La última metodología de mercado de datos no es ideal, ya que ocasionalmente produce un depósito de chatarra de datos en el que todos los datos se originan en una fuente compartida, pero en su mayoría se descartan.

2. Centro de datos independiente

Se puede crear una despensa de datos independiente sin usar el almacén de datos central. Se recomienda principalmente para unidades o grupos más pequeños dentro de una organización. Como su nombre indica, este tipo de data mart no está relacionado con el data warehouse empresarial ni con ningún otro data mart. Introduce datos por separado y los análisis también se ejecutan de forma independiente.

A medida que se construyen más y más marts de datos independientes, la redundancia de datos también aumenta en toda la organización. Esto se debe a que cada centro de datos independiente necesita el suyo, generalmente una copia duplicada de la información comercial integral. Como estos data marts acceden directamente a los archivos y / o tablas del sistema operativo, se reducen considerablemente limitar la escalabilidad de los sistemas de soporte de decisiones (DSS).

3. Centro de datos híbrido

Al usar un centro de datos híbrido, puede combinar datos de varios sistemas fuente operativos además de un almacén de datos. Estos conjuntos de datos son particularmente útiles cuando necesita una integración ad hoc, por ejemplo, después de agregar un nuevo grupo o productos a la empresa.

Como su nombre indica, un data mart híbrido es una mezcla de data marts dependientes e independientes. Es adecuado para empresas que tienen múltiples bases de datos y necesitan un cambio rápido. Un centro de datos híbrido necesita una ligera limpieza de datos, admite enormes estructuras de almacenamiento y es flexible, ya que combina los beneficios de los mercados de datos dependientes e independientes.

Diseño de Data Marts para almacenamiento de datos

Estructuras de bases de datos y nombres de elementos en expresiones corporativas para que los operadores no técnicos puedan usar fácilmente el data mart. Si es necesario, también puede configurar API e interfaces para simplificar el acceso a los datos.

1. Diseño

El primer paso es crear un diseño robusto. Algunos procesos críticos involucrados en esta fase incluyen recopilar los requisitos corporativos y técnicos, identificar las fuentes de datos, elegir un subconjunto de datos adecuado y diseñar el diseño lógico (esquema de la base de datos) y la estructura física.

2. Construir / Construir

El siguiente paso es construir la despensa de datos. Esto incluye la creación de la base de datos física y las estructuras lógicas. En esta fase, creará las tablas, los campos, los índices y los controles de acceso.

3. Rellenar / Transferencia de datos

El siguiente paso es llenar la despensa de datos, lo que significa transferir datos a ella. En esta fase, también puede establecer la frecuencia de la transferencia de datos, como diaria o semanal. Para mantener limpia la información en la despensa de datos y el almacén, generalmente se sobrescribe cada vez que se llena la despensa de datos.

Este paso generalmente implica extraer la información de origen, limpiar y transformar los datos y cargarlos en el data mart.

4. Acceso a los datos

En este paso, los datos cargados en la despensa de datos se utilizan en forma de consultas, generación de informes, gráficos y publicación. La tarea principal involucrada en esta fase es configurar una meta-capa y traducir las estructuras de la base de datos y los nombres de los elementos en expresiones corporativas para que los operadores no técnicos puedan usar fácilmente el data mart. Si es necesario, también puede configurar API e interfaces para simplificar el acceso a los datos.

5. Gestionar

El último paso consiste en administrar el data mart que incluye:

  • Controlar el acceso continuo del usuario
  • Optimización y refinamiento del sistema de destino para mejorar el rendimiento.
  • Adición y gestión de nuevos datos en el data mart
  • Configurar ajustes de recuperación y garantizar la disponibilidad del sistema en caso de falla

Lo más importante es...

Un data mart incluye una subsección de datos de toda la empresa, que es valiosa para un grupo de usuarios en particular en la organización. A diferencia de un almacén de datos que es costoso y complejo de crear, un data mart ofrece una alternativa rentable. Permite un acceso más rápido a los datos y es fácil de usar; ya que está diseñado con precisión de acuerdo con los requisitos de los operadores y se centra en un solo departamento / área temática.

Un data mart puede ayudarlo a acelerar sus procesos corporativos; ya que lleva menos tiempo implementarlo en comparación con un almacén de datos. También incluye datos pasados ​​para que sus analistas de datos puedan determinar fácilmente las tendencias de los datos.

Centerprise Banner de extractor de datos