Blog

Inicio / Blog / ¿Qué es el esquema en estrella? Ventajas y desventajas

Tabla de Contenido
El automatizado, Sin código Pila de datos

Aprende cómo Astera Data Stack puede simplificar y agilizar la gestión de datos de su empresa.

¿Qué es el esquema de estrella? Ventajas y desventajas

yunaid baig

comercializador SEO

Marzo 25th, 2024

¿Qué es un esquema de estrella?

Introducido en 1996 por Ralph Kimball, un esquema en estrella es una técnica de modelado de datos multidimensional. Es el tipo de esquema más simple que usan las empresas en almacenamiento de datos.

Según su nombre, un esquema de estrella es como una estrella cuando se visualiza. Tiene una tabla de hechos en el medio y muchas tablas de dimensiones adjuntas. Esta estructura simple y desnormalizada la hace muy eficiente para consultar datos.

esquema de estrella simple

Esquema en estrella con tablas de hechos y dimensiones

Estructura de esquema en estrella: tablas de hechos y dimensiones

Tablas de hechos

Las tablas de hechos, o entidades de hechos, sirven como pieza central del esquema en estrella. Una tabla de hechos típica contiene datos cuantitativos o métricas que representan eventos comerciales, transacciones o mediciones. Estos hechos suelen ser valores numéricos, como los ingresos por ventas, las ganancias o las unidades vendidas.

Podemos ver un ejemplo de una tabla de hechos a continuación. Contiene hechos medibles, como el precio de una unidad vendida y el impuesto sobre las ventas.

Fecha Ubicación Tipo de Producto Cantidad Precio unitario Cantidad de ventas Inventario Impuesto de venta
8/4/2023 CA Nylon 5 100 500 30 7.75%
8/4/2023 CA Poliéster 7 250 1750 50 7.75%
8/4/2023 PA Nylon 6 100 600 65 6.00%

Tablas de dimensiones

Las tablas de dimensiones son tablas auxiliares que proporcionan contexto y atributos descriptivos para los datos de la tabla de hechos. Ayudan a responder preguntas como "quién", "qué", "cuándo", "dónde" y "cómo" relacionadas con eventos comerciales. Las tablas de dimensiones contienen datos categóricos, como nombres de clientes, categorías de productos, períodos de tiempo y ubicaciones geográficas.

Ejemplo: las dos tablas de dimensiones siguientes proporcionan detalles sobre la información del producto en la tabla de datos anterior.

Dimensión de fecha
Clave de fecha Fecha Día
10201 8/4/2023 Sábado
10202 8/4/2023 Sábado

Tabla de dimensiones para la fecha

Dimensión de la tienda
Almacenar clave Nombre de la tienda Ciudad Estado
151 AngAngie'sparel Los Ángeles California.
152 AngAngie'sparel Pittsburgh Pennsylvania

Tabla de dimensiones para tienda

Ventajas de usar esquemas en estrella

  1. Consulta simplificada: Los esquemas en estrella son fáciles de entender e implementar. Su estructura desnormalizada reduce el número de uniones necesarias para recuperar datos. Esto simplifica y conduce a una agregación de datos y generación de informes más rápidos.

  2. Rendimiento más rápido: La complejidad de combinación reducida y la indexación eficiente de las tablas de hechos y dimensiones mejoran la recuperación de datos. Esto es particularmente importante para los tomadores de decisiones que requieren un acceso rápido a la información.
  3. Análisis intuitivo: Los esquemas en estrella permiten un análisis de datos intuitivo y directo. Los usuarios pueden comprender fácilmente las relaciones y jerarquías entre las dimensiones.
  4. Soporte robusto: Los esquemas en estrella brindan soporte para estructuras OLAP, como cubos de datos: matrices multidimensionales que se utilizan para mejorar el análisis de datos.

Desventajas de usar esquemas en estrella

  1. Falta de integridad: La desnormalización puede causar redundancia de datos. Los atributos dimensionales suelen repetirse en varios registros dentro de una tabla de dimensiones, lo que puede provocar problemas de calidad de los datos. Dado que los datos se duplican en la desnormalización, los cambios frecuentes también pueden hacer que ciertas tablas muestren información desactualizada.
  2. Aumento de los costos: Agregar datos redundantes aumenta los costos de computación y almacenamiento. Esto puede ser especialmente problemático cuando se manejan grandes conjuntos de datos.
  3. Flexibilidad limitada: Los esquemas en estrella son relativamente menos robustos que las estructuras normalizadas, ya que están diseñados para casos de uso específicos. Otros enfoques podrían ser más efectivos para consultas complejas que involucran múltiples uniones.
  4. Dificultades de mantenimiento: A medida que los datos cambian con el tiempo, mantener un esquema en estrella puede resultar un desafío. Las actualizaciones de los atributos de dimensión pueden requerir cambios en varios lugares.

Cuándo usar el esquema de estrella

Esta técnica de modelado dimensional es la mejor opción cuando:

  • Los usuarios tienen una comprensión clara de los datos requeridos. Por ejemplo: la cantidad de productos vendidos por estado.
  • Los datos son estructurados y cuantitativos con algunos atributos categóricos.
  • Quieren los datos de forma rápida y sencilla, sin crear múltiples uniones. El rendimiento de las consultas es la máxima prioridad.
  • La redundancia de datos no será un problema.

Los analistas y usuarios comerciales que desean una mayor rigidez de los datos pueden optar por un enfoque más normalizado. El esquema de copo de nieve es una extensión del esquema de estrella: se compone de un modelo de estrella normal con tablas de subdimensiones adicionales.

Los esquemas de copos de nieve utilizan un enfoque más normalizado adecuado para menos redundancia y consultas más complejas.

Obtenga más información sobre los pros y los contras de Esquema de estrella versus esquema de copo de nieve y cuándo usarlos.

Conclusión

Los esquemas en estrella son solo un enfoque para modelado dimensional. Otros enfoques, como copo de nieve y 3NF, también se utilizan ampliamente en la construcción de data marts y data warehouses. La tarea importante para los equipos de datos es encontrar el mejor enfoque en función de su caso de uso y recursos.

Seleccionar la técnica de modelado adecuada es vital para automatizar el almacenamiento de datos y las iniciativas de BI. Consulte nuestra guía de herramientas sobre cómo crear canales y modelos de datos efectivos para la automatización del almacén de datos y mejorar sus informes y análisis.

También te puede interesar
Pruebas ETL: procesos, tipos y mejores prácticas
Data Vault 101: una guía completa para el almacenamiento de datos escalable
¿Qué es un lago de datos? Definición y Beneficios
Considerando Astera ¿Para sus necesidades de gestión de datos?

Establezca conectividad sin códigos con sus aplicaciones empresariales, bases de datos y aplicaciones en la nube para integrar todos sus datos.

¡Conectémonos ahora!
conectemos