A diferencia de un almacén de datos que almacena datos de toda la empresa, una despensa de datos incluye información relacionada con un departamento o área temática en particular. Por ejemplo, una despensa de datos de ventas puede contener datos relacionados con productos, clientes y ventas únicamente. Lea este blog para comprender mejor estos repositorios de datos departamentales.
¿Qué son los Data Marts?
Los data marts son un subconjunto del almacén de datos que se ocupa de un solo asunto. A menudo los construye y gestiona un único departamento comercial. Dado que están orientados a temas, normalmente toman datos de sólo un pequeño número de fuentes, que podrían ser sistemas operativos internos, datos, un centralizado repositorio de datoso fuentes externas. Generalmente son condensados y menos complejos que los almacenes de datos, lo que los hace más fáciles de construir y mantener.
Ahora que hemos entendido lo que son, veremos los tres tipos diferentes de ejemplos de data mart, sus usos y cómo simplifican la gestión de datos. También ilustraremos una guía paso a paso sobre cómo implementar un repositorio de datos específico del departamento para su negocio específico.
Fuente: Study.com
¿Cómo benefician los Data Marts a la gestión de bases de datos?
Antes de discutir sus diversos tipos, veamos brevemente los beneficios de los data marts y por qué son necesarios para una empresa basada en datos:
- Permita un acceso más rápido a los datos recuperando un conjunto específico de datos para BI y generación de informes. Como resultado, ayuda a acelerar la inteligencia empresarial.
- Son más fáciles de implementar y más rentables que construir una empresa. almacenamiento de datos.
- Diseñado de acuerdo con los requisitos de un grupo particular de usuarios que trabajan en un departamento específico.
- Son comparativamente más adaptables que un almacén de datos. Cualquier cambio en el modelo de datos se puede incorporar fácil y rápidamente al data mart debido a su tamaño más pequeño.
- Permita derechos de control de acceso granulares debido a la amplia partición y segmentación.
En resumen, son mucho más rápidos, adaptables y rentables de mantener que un almacén de datos. Por el contrario, los almacenes de datos se crean para consolidar datos de una miríada de fuentes (a menudo no en un formato estructurado).
Tipos de Data Marts
Los data marts se pueden clasificar en tres tipos principales:
1. Dependiente
Un centro de datos dependiente le permite combinar todos sus datos comerciales en un solo almacenamiento de datos, ofreciéndole los beneficios típicos de la centralización.
En este ejemplo, se necesitan almacenes de datos departamentales y tendrá que crearlos como entidades dependientes para garantizar la coherencia y la integración en todos los sistemas de almacenamiento de datos.
Los mercados de datos dependientes se pueden construir utilizando dos enfoques diferentes. En el primer enfoque, los almacenes de datos empresariales y los mercados de datos se construyen para que el operador pueda acceder a ambos cuando sea necesario. En el segundo enfoque, también conocido como enfoque federado, los resultados del proceso ETL se almacenan en un área de almacenamiento temporal, como un bus de datos común en lugar de un físico. base de datos por lo que el operador solo puede acceder a los datos departamentales.
La última metodología no es ideal, ya que ocasionalmente produce un depósito de chatarra de datos en el que todos los datos se originan en una fuente compartida, pero en su mayoría se descartan.
2. Independiente
Se puede crear una despensa de datos independiente sin utilizar el almacén de datos central. Se recomienda principalmente para unidades o grupos más pequeños dentro de una organización. Como sugiere el nombre, este tipo de repositorio no está relacionado con el almacén de datos empresarial ni con ninguna otra entidad. Introduce datos por separado y los análisis también se ejecutan de forma independiente.
A medida que se construyen más y más mercados de datos independientes, la redundancia de datos también aumenta en toda la organización. Esto se debe a que cada almacén de datos independiente necesita el suyo, normalmente una copia duplicada de la información empresarial completa. Como estos almacenes independientes de datos acceden directamente a archivos y / o tablas del sistema operativo, limitar la escalabilidad de los sistemas de soporte de decisiones (DSS).
3 Híbrido
Mediante el uso de una despensa de datos híbrida, puede combinar datos de varios sistemas de origen operativo además de un almacén de datos. Estos son particularmente útiles cuando necesita una integración ad hoc, como agregar un nuevo grupo o productos a la empresa.
Como su nombre lo indica, un data mart híbrido es una mezcla de los tipos dependiente e independiente. Es adecuado para empresas que tienen múltiples bases de datos y necesitan un cambio rápido. Los ejemplos de data mart de este tipo necesitan una ligera limpieza de datos, admiten enormes estructuras de almacenamiento y son flexibles, ya que combinan los beneficios de los sistemas dependientes e independientes.
Diseño de Data Marts para almacenamiento de datos
Así es como puede diseñar un data mart para las necesidades de su empresa:
1. Diseño
El primer paso es crear un diseño robusto. Algunos procesos críticos involucrados en esta fase son:
- Recogida de los requisitos corporativos y técnicos.
- Identificación de fuentes de datos.
- Elegir un subconjunto de datos adecuado.
- Diseño de la disposición lógica (esquema de la base de datos) y estructura física.
2. Construir / Construir
El siguiente paso en el proceso es construir el data mart. Esto incluye la creación de la base de datos física y las estructuras lógicas. En esta fase, creará tablas de hechos, tablas de dimensiones, campos, índices y controles de acceso.
3. Rellenar / Transferencia de datos
El siguiente paso es llenar el mart, lo que significa transferirle datos. En esta fase, también puede establecer la frecuencia de transferencia de datos, como diaria o semanal. Este paso generalmente implica:
- Extraer información de la fuente.
- Limpieza y transformación de los datos.
- Cargar los datos en el repositorio departamental.
- Construyendo los metadatos y almacenándolos.
4. Acceso a los datos
En este paso, los datos cargados en el data mart se utilizan para realizar consultas, generar informes, gráficos y publicaciones. Las principales tareas involucradas en esta fase son:
- Configuración de una metacapa y traducción de las estructuras de la base de datos y los nombres de los elementos en expresiones corporativas para que los operadores sin conocimientos técnicos puedan utilizar fácilmente el data mart.
- Configuración y mantenimiento de estructuras de bases de datos.
- Si es necesario, también puede configurar API e interfaces para simplificar el acceso a los datos.
5. Gestionar
El último paso implica la gestión y la observación, que incluye:
- Controlar el acceso continuo de los usuarios.
- Optimización y perfeccionamiento del sistema de destino para mejorar el rendimiento.
- Adición y gestión de nuevos datos al repositorio.
- Configurar los ajustes de recuperación y garantizar la disponibilidad del sistema en caso de falla.
Mirando al futuro: Data Marts y la nube
Los data marts ofrecen un enfoque eficiente, flexible y escalable para almacenar datos. Sin embargo, las soluciones locales se están volviendo obsoletas rápidamente debido a la creciente cantidad de datos entrantes. Como resultado, muchas empresas están trasladando sus soluciones de almacenamiento de datos a la nube.
Una arquitectura basada en la nube permite a las empresas crear y almacenar sus datos en línea. La velocidad y la flexibilidad de este enfoque crean una oportunidad para el análisis en la nube. Realizar análisis en la nube permite una mayor escalabilidad y rentabilidad en comparación con las opciones locales. Eso no es todo. Los data marts basados en la nube también ofrecen otros numerosos beneficios:
- Análisis de datos en tiempo real.
- Acceso bajo demanda a los datos.
- Una vista unificada de todos los data marts.
- Acceso a orígenes y destinos nativos de la nube.
Lo más importante es...
Un data mart incluye una subsección de datos de toda la empresa, que es valiosa para un grupo de usuarios en particular en la organización. A diferencia de un almacén de datos que es costoso y complejo de crear, ofrece una alternativa rentable. También permite un acceso más rápido a los datos y es fácil de usar, ya que está diseñado con precisión de acuerdo con los requisitos de los operadores y se centra en un solo departamento / área temática.
Un data mart puede ayudar a acelerar sus procesos corporativos, ya que lleva menos tiempo implementarlo que un data warehouse. También incluye datos pasados para que sus analistas de datos puedan determinar fácilmente las tendencias de los datos.
Autores:
- Tehreem Naeem