Блог

Главная / Блог / Автоматизированный подход к моделированию медленно меняющихся измерений

Содержание
Автоматизированный, Без кода Стек данных

Научиться Astera Data Stack может упростить и оптимизировать управление данными вашего предприятия.

Автоматизированный подход к моделированию медленно изменяющихся размеров

Март 24th, 2023

Бизнес-данные по своей природе подвержены изменениям с течением времени и по-разному влияют на бизнес. В хранилищах данных влияние времени на наши записи измерений и факты требует тщательного изучения хранилища, чтобы оно соответствовало задаче бизнес-аналитики по предоставлению актуальной информации лицам, принимающим решения.

Вопрос в том, как лучше всего справиться с этими изменениями?

Разработка таблицы измерений или модели, которая фиксирует различные состояния ваших данных во времени, является ключевой целью корпоративного хранилища данных. Для мер в наших таблицах фактов мы можем использовать измерения дат и связывать их с помощью внешних ключей. Для размеров сложность обработки изменений значительно возрастает. Каждый шаг потока медленно меняющегося измерения (SCD) должен быть закодирован вручную с использованием нескольких сложных операторов SQL. Внедрение является длительным и сложным и влияет на способность бизнеса быстро и надежно поддерживать свои данные, что всегда является критическим фактором.

Медленно меняющиеся размеры в Astera Centerprise

По сравнению с традиционным подходом с ручным кодированием к медленно меняющемуся потоку измерений, Astera предлагает автоматизированную реализацию с использованием полностью перетаскиваемого интерфейса. Данные исходной системы сопоставляются с объектом SCD в Centerprise, который передает сгенерированные системой операторы SQL непосредственно в целевое хранилище данных (Читайте: Режим оптимизации с раскрывающимся списком в Centerprise) на основе макетов полей, определенных пользователем. Каждый столбец пользовательской таблицы может быть обозначен как суррогатный ключ, бизнес-ключ, SCD1, SCD2 и т. д. (см. ниже) в свойствах компонента в Centerprise. Платформа автоматически обрабатывает стратегию обновления, вопросы производительности, маршрутизацию и сложные соединения на серверной стороне, если типы полей SCD определены правильно.

Автоматизация реализации медленно меняющихся измерений типа 1 и 2

Centerprise поддерживает медленное изменение типа измерения 1 и типа 2 для обновления записей с сохранением истории и без нее.

SCD Тип 1

Этот тип касается обновлений в таблице измерений для случаев, когда сохранение истории не является приоритетом и вам необходимо заменить старые значения в таблице недавними.

Чтобы использовать медленно изменяющийся тип измерения 1 в Centerprise, вы можете пометить свой столбец как «SCD1 – Обновление» в меню «Поля макета» объекта SCD в Centerprise.

SCD Тип 2

Этот тип касается изменений в вашем измерении, которые необходимо отслеживать. Новая запись вставляется при каждом изменении, а существующая запись помечается как просроченная по дате, версии или статусу.

Чтобы использовать медленно изменяющийся тип измерения 2 в Centerprise, отметьте выбранный столбец как «SCD2 — обновление и вставка».

Оптимизация с понижением

После определения макета и выполнения потока Astera Преобразование SCD генерирует код SQL, необходимый для сравнения, объединения, маршрутизации и вставки данных в целевое измерение, и передает логику преобразования в базу данных, например SQL Server, для обработки.

Используя этот подход, обслуживание атрибутов больших измерений происходит значительно быстрее, поскольку вся обработка выполняется базой данных, а не сервером. Centerprise сервер, выполняющий операции и перемещающийся между базой данных для чтения, сравнения и записи данных.

Чтобы узнать больше об автоматизированном компоненте «Медленно меняющиеся измерения», см. Centerprise и как использовать его для управления размерами, загрузите технический документ: Как управлять медленно меняющимися размерами с помощью Centerprise.

Сократите время разработки хранилища данных до 80 %
Новый призыв к действию
Вам также может понравиться
7 лучших инструментов агрегирования данных в 2024 году
Структура управления данными: что это такое? Важность, основные принципы и передовой опыт
Лучшие инструменты приема данных в 2024 году
принимая во внимание Astera Для ваших потребностей в управлении данными?

Установите соединение без кода с вашими корпоративными приложениями, базами данных и облачными приложениями для интеграции всех ваших данных.

Давайте соединимся сейчас!
давайте соединимся