¿Qué es un esquema de estrella?
Introducido en 1996 por Ralph Kimball, un esquema en estrella es una técnica de modelado de datos multidimensional. Es el tipo de esquema más simple que usan las empresas en almacenamiento de datos.
Según su nombre, un esquema de estrella es como una estrella cuando se visualiza. Tiene una tabla de hechos en el medio y muchas tablas de dimensiones adjuntas. Esta estructura simple y desnormalizada la hace muy eficiente para consultar datos.
Esquema en estrella con tablas de hechos y dimensiones
Estructura de esquema en estrella: tablas de hechos y dimensiones
Tablas de hechos
Las tablas de hechos, o entidades de hechos, sirven como pieza central del esquema en estrella. Una tabla de hechos típica contiene datos cuantitativos o métricas que representan eventos comerciales, transacciones o mediciones. Estos hechos suelen ser valores numéricos, como los ingresos por ventas, las ganancias o las unidades vendidas.
Podemos ver un ejemplo de una tabla de hechos a continuación. Contiene hechos medibles, como el precio de una unidad vendida y el impuesto sobre las ventas.
Fecha |
Ubicación |
Tipo de Producto |
Cantidad |
Precio unitario |
Cantidad de ventas |
Inventario |
Impuesto de venta |
8/4/2023 |
CA |
Nylon |
5 |
100 |
500 |
30 |
7.75% |
8/4/2023 |
CA |
Poliéster |
7 |
250 |
1750 |
50 |
7.75% |
8/4/2023 |
PA |
Nylon |
6 |
100 |
600 |
65 |
6.00% |
Tablas de dimensiones
Las tablas de dimensiones son tablas auxiliares que proporcionan contexto y atributos descriptivos para los datos de la tabla de hechos. Ayudan a responder preguntas como "quién", "qué", "cuándo", "dónde" y "cómo" relacionadas con eventos comerciales. Las tablas de dimensiones contienen datos categóricos, como nombres de clientes, categorías de productos, períodos de tiempo y ubicaciones geográficas.
Ejemplo: las dos tablas de dimensiones siguientes proporcionan detalles sobre la información del producto en la tabla de datos anterior.
Dimensión de fecha |
Clave de fecha |
Fecha |
Día |
10201 |
8/4/2023 |
Sábado |
10202 |
8/4/2023 |
Sábado |
Tabla de dimensiones para la fecha
Dimensión de la tienda |
Almacenar clave |
Nombre de la tienda |
Ciudad |
Provincia |
151 |
AngAngie'sparel |
Los Ángeles |
California. |
152 |
AngAngie'sparel |
Pittsburgh |
Pennsylvania |
Tabla de dimensiones para tienda
Ventajas de usar esquemas en estrella
-
Consulta simplificada: Los esquemas en estrella son fáciles de entender e implementar. Su estructura desnormalizada reduce el número de uniones necesarias para recuperar datos. Esto simplifica y conduce a una agregación de datos y generación de informes más rápidos.
- Rendimiento más rápido: La complejidad de combinación reducida y la indexación eficiente de las tablas de hechos y dimensiones mejoran la recuperación de datos. Esto es particularmente importante para los tomadores de decisiones que requieren un acceso rápido a la información.
- Análisis intuitivo: Los esquemas en estrella permiten un análisis de datos intuitivo y directo. Los usuarios pueden comprender fácilmente las relaciones y jerarquías entre las dimensiones.
- Soporte robusto: Los esquemas en estrella brindan soporte para estructuras OLAP, como cubos de datos: matrices multidimensionales que se utilizan para mejorar el análisis de datos.
Desventajas de usar esquemas en estrella
- Falta de integridad: La desnormalización puede causar redundancia de datos. Los atributos dimensionales suelen repetirse en varios registros dentro de una tabla de dimensiones, lo que puede provocar problemas de calidad de los datos. Dado que los datos se duplican en la desnormalización, los cambios frecuentes también pueden hacer que ciertas tablas muestren información desactualizada.
- Aumento de los costos: Agregar datos redundantes aumenta los costos de computación y almacenamiento. Esto puede ser especialmente problemático cuando se manejan grandes conjuntos de datos.
- Flexibilidad limitada: Los esquemas en estrella son relativamente menos robustos que las estructuras normalizadas, ya que están diseñados para casos de uso específicos. Otros enfoques podrían ser más efectivos para consultas complejas que involucran múltiples uniones.
- Dificultades de mantenimiento: A medida que los datos cambian con el tiempo, mantener un esquema en estrella puede resultar un desafío. Las actualizaciones de los atributos de dimensión pueden requerir cambios en varios lugares.
Cuándo usar el esquema de estrella
Esta técnica de modelado dimensional es la mejor opción cuando:
- Los usuarios tienen una comprensión clara de los datos requeridos. Por ejemplo: la cantidad de productos vendidos por estado.
- Los datos son estructurados y cuantitativos con algunos atributos categóricos.
- Quieren los datos de forma rápida y sencilla, sin crear múltiples uniones. El rendimiento de las consultas es la máxima prioridad.
- La redundancia de datos no será un problema.
Los analistas y usuarios comerciales que desean una mayor rigidez de los datos pueden optar por un enfoque más normalizado. El esquema de copo de nieve es una extensión del esquema de estrella: se compone de un modelo de estrella normal con tablas de subdimensiones adicionales.
Los esquemas de copos de nieve utilizan un enfoque más normalizado adecuado para menos redundancia y consultas más complejas.
Obtenga más información sobre los pros y los contras de Esquema de estrella versus esquema de copo de nieve y cuándo usarlos.
Conclusión
Los esquemas en estrella son solo un enfoque para modelado dimensional. Otros enfoques, como copo de nieve y 3NF, también se utilizan ampliamente en la construcción de data marts y data warehouses. La tarea importante para los equipos de datos es encontrar el mejor enfoque en función de su caso de uso y recursos.
Seleccionar la técnica de modelado adecuada es vital para automatizar el almacenamiento de datos y las iniciativas de BI. Consulte nuestra guía de herramientas sobre cómo crear canales y modelos de datos efectivos para la automatización del almacén de datos y mejorar sus informes y análisis.
Autores:
- yunaid baig