Бизнес-данные по своей природе подвержены изменениям с течением времени и по-разному влияют на бизнес. В хранилищах данных влияние времени на наши записи измерений и факты требует тщательного изучения хранилища, чтобы оно соответствовало задаче бизнес-аналитики по предоставлению актуальной информации лицам, принимающим решения.
Вопрос в том, как лучше всего справиться с этими изменениями?
Разработка таблицы измерений или модели, которая фиксирует различные состояния ваших данных во времени, является ключевой целью корпоративного хранилища данных. Для мер в наших таблицах фактов мы можем использовать измерения дат и связывать их с помощью внешних ключей. Для размеров сложность обработки изменений значительно возрастает. Каждый шаг потока медленно меняющегося измерения (SCD) должен быть закодирован вручную с использованием нескольких сложных операторов SQL. Внедрение является длительным и сложным и влияет на способность бизнеса быстро и надежно поддерживать свои данные, что всегда является критическим фактором.
Медленно меняющиеся размеры в Astera Centerprise
По сравнению с традиционным подходом с ручным кодированием к медленно меняющемуся потоку измерений, Astera предлагает автоматизированную реализацию с использованием полностью перетаскиваемого интерфейса. Данные исходной системы сопоставляются с объектом SCD в Centerprise, который передает сгенерированные системой операторы SQL непосредственно в целевое хранилище данных (Читайте: Режим оптимизации с раскрывающимся списком в Centerprise) на основе макетов полей, определенных пользователем. Каждый столбец пользовательской таблицы может быть обозначен как суррогатный ключ, бизнес-ключ, SCD1, SCD2 и т. д. (см. ниже) в свойствах компонента в Centerprise. Платформа автоматически обрабатывает стратегию обновления, вопросы производительности, маршрутизацию и сложные соединения на серверной стороне, если типы полей SCD определены правильно.
Автоматизация реализации медленно меняющихся измерений типа 1 и 2
Centerprise поддерживает медленное изменение типа измерения 1 и типа 2 для обновления записей с сохранением истории и без нее.
SCD Тип 1
Этот тип касается обновлений в таблице измерений для случаев, когда сохранение истории не является приоритетом и вам необходимо заменить старые значения в таблице недавними.
Чтобы использовать медленно изменяющийся тип измерения 1 в Centerprise, вы можете пометить свой столбец как «SCD1 – Обновление» в меню «Поля макета» объекта SCD в Centerprise.
SCD Тип 2
Этот тип касается изменений в вашем измерении, которые необходимо отслеживать. Новая запись вставляется при каждом изменении, а существующая запись помечается как просроченная по дате, версии или статусу.
Чтобы использовать медленно изменяющийся тип измерения 2 в Centerprise, отметьте выбранный столбец как «SCD2 — обновление и вставка».
Оптимизация с понижением
После определения макета и выполнения потока Astera Преобразование SCD генерирует код SQL, необходимый для сравнения, объединения, маршрутизации и вставки данных в целевое измерение, и передает логику преобразования в базу данных, например SQL Server, для обработки.
Используя этот подход, обслуживание атрибутов больших измерений происходит значительно быстрее, поскольку вся обработка выполняется базой данных, а не сервером. Centerprise сервер, выполняющий операции и перемещающийся между базой данных для чтения, сравнения и записи данных.
Чтобы узнать больше об автоматизированном компоненте «Медленно меняющиеся измерения», см. Centerprise и как использовать его для управления размерами, загрузите технический документ: Как управлять медленно меняющимися размерами с помощью Centerprise.