Блог

Главная / Блог / Что такое звездообразная схема? Преимущества и недостатки

Содержание
Автоматизированный, Без кода Стек данных

Научиться Astera Data Stack может упростить и оптимизировать управление данными вашего предприятия.

Что такое звездная схема? Преимущества и недостатки

Джунаид Байг

SEO-маркетолог

Март 25th, 2024

Что такое звездообразная схема?

Звездная схема, представленная в 1996 году Ральфом Кимбаллом, представляет собой метод моделирования многомерных данных. Это самый простой тип схемы, который используют предприятия. хранилище данных.

Судя по названию, звездная схема при визуализации похожа на звезду. В середине имеется таблица фактов и множество прикрепленных к ней таблиц измерений. Эта простая денормализованная структура делает ее очень эффективной для запроса данных.

простая схема звезды

Схема «звезда» с таблицами фактов и измерений

Структура звездообразной схемы: таблицы фактов и измерений

Таблицы фактов

Таблицы фактов или сущности фактов служат центральным элементом звездообразной схемы. Типичная таблица фактов содержит количественные данные или показатели, которые представляют бизнес-события, транзакции или измерения. Эти факты обычно представляют собой числовые значения, такие как доход от продаж, прибыль или проданные единицы.

Ниже мы можем увидеть пример таблицы фактов. Он содержит измеримые факты, такие как цена проданной единицы товара и налог с продаж.

Время Место хранения Категория Количество Цена за ед Объем продаж Каталог Налог с продаж
8/4/2023 CA нейлон 5 100 500 30 7.75%
8/4/2023 CA Доступны в четырех великолепных цветах, чтобы дать людям больше возможностей соответствовать их спортивной одежде. 7 250 1750 50 7.75%
8/4/2023 PA нейлон 6 100 600 65 6.00%

Таблицы размеров

Таблицы измерений — это вспомогательные таблицы, которые предоставляют контекстные и описательные атрибуты для данных в таблице фактов. Они помогают ответить на такие вопросы, как «кто», «что», «когда», «где» и «как», связанные с деловыми мероприятиями. Таблицы измерений содержат категориальные данные, такие как имена клиентов, категории продуктов, периоды времени и географические местоположения.

Пример: две таблицы измерений ниже предоставляют подробную информацию о продукте в таблице фактов выше.

Дата Измерение
Ключ даты Время день
10201 8/4/2023 Сб
10202 8/4/2023 Сб

Таблица размеров для даты

Размер магазина
Ключ магазина Название магазина Город Область
151 AngAngie'sparel Лос-Анджелес Калифорния
152 AngAngie'sparel Питтсбурге Пенсильвания

Таблица размеров для магазина

Преимущества использования звездообразных схем

  1. Упрощенный запрос: Звездообразные схемы легко понять и реализовать. Их денормализованная структура уменьшает количество соединений, необходимых для получения данных. Это упрощает и приводит к более быстрому агрегированию данных и составлению отчетов.

  2. Более быстрая производительность: Уменьшенная сложность соединений и эффективная индексация таблиц фактов и измерений улучшают поиск данных. Это особенно важно для лиц, принимающих решения, которым требуется быстрый доступ к аналитической информации.
  3. Интуитивный анализ: Звездообразные схемы обеспечивают интуитивно понятный и простой анализ данных. Пользователи могут легко понять взаимосвязи и иерархию между измерениями.
  4. Надежная поддержка: Звездообразные схемы обеспечивают поддержку структур OLAP, таких как кубы данных — многомерные массивы, используемые для улучшения анализа данных.

Недостатки использования звездообразных схем

  1. Отсутствие целостности: Денормализация может привести к избыточности данных. Атрибуты измерений часто повторяются в нескольких записях в таблице измерений, что может вызвать проблемы с качеством данных. Поскольку при денормализации данные дублируются, частые изменения также могут привести к тому, что в некоторых таблицах будет отображаться устаревшая информация.
  2. Увеличение затрат: Добавление избыточных данных увеличивает затраты на вычисления и хранение. Это может быть особенно неприятно при работе с большими наборами данных.
  3. Ограниченная гибкость: Звездообразные схемы относительно менее надежны, чем нормализованные структуры, поскольку они созданы для конкретных случаев использования. Другие подходы могут быть более эффективными для сложных запросов, включающих множественные соединения.
  4. Трудности обслуживания: Поскольку данные со временем меняются, поддержание звездообразной схемы может стать сложной задачей. Обновления атрибутов измерения могут потребовать внесения изменений в нескольких местах.

Когда использовать звездообразную схему

Этот метод объемного моделирования является лучшим вариантом, когда:

  • Пользователи имеют четкое представление о необходимых данных. Например: количество реализуемой продукции по штатам.
  • Данные структурированы и количественны с некоторыми категориальными атрибутами.
  • Им нужны данные быстро и легко, без создания нескольких объединений. Производительность запросов является главным приоритетом.
  • Избыточность данных не будет проблемой.

Аналитики и бизнес-пользователи, которым нужна более высокая надежность данных, могут выбрать более нормализованный подход. Схема «снежинка» является расширением схемы «звезда» и состоит из обычной звездообразной модели с дополнительными таблицами подизмерений.

Схемы «снежинка» используют более нормализованный подход, подходящий для меньшей избыточности и более сложных запросов.

Узнайте больше о плюсах и минусах Схема «Звезда» против схемы «Снежинка» и когда их использовать.

Заключение

Звездообразные схемы — это всего лишь один из подходов к размерное моделирование. Другие подходы, такие как «снежинка» и 3NF, также широко используются при создании витрин и хранилищ данных. Важная задача групп данных — найти лучший подход, исходя из их варианта использования и ресурсов.

Выбор правильного метода моделирования имеет жизненно важное значение для автоматизации хранилищ данных и инициатив BI. Ознакомьтесь с нашим руководством по созданию эффективных моделей данных и конвейеров для автоматизации хранилищ данных и улучшения отчетности и аналитики.

Вам также может понравиться
ETL-тестирование: процессы, типы и лучшие практики
Data Vault 101: Комплексное руководство по масштабируемому хранению данных
Что такое озеро данных? Определение и преимущества
принимая во внимание Astera Для ваших потребностей в управлении данными?

Установите соединение без кода с вашими корпоративными приложениями, базами данных и облачными приложениями для интеграции всех ваших данных.

Давайте соединимся сейчас!
давайте соединимся