Блог

Главная / Блог / Руководитель отдела анализа данных Криш Кришнан об автоматизированном моделировании данных

Содержание
Автоматизированный, Без кода Стек данных

Научиться Astera Data Stack может упростить и оптимизировать управление данными вашего предприятия.

Криш Кришнан, руководитель отдела аналитики данных об автоматизированном моделировании данных

Аммар Али

Content Manager

Январь 3rd, 2022

Недавно мы представили нашу платформу автоматизации хранилищ данных нового поколения (DWA), Astera Построитель хранилища данных, который предлагает гибкий, основанный на метаданных подход к созданию хранилищ данных. Наше решение предназначено для организаций, которые хотят ускорить жизненный цикл своих проектов и упростить процесс проектирования и разработки хранилищ данных.

At Astera, мы всегда стремимся к инновациям и совершенствованию наших технологий, чтобы предложить нашим пользователям лучший опыт. Чтобы получить более глубокое представление о моделировании данных для современных предприятий, мы связались с экспертами и лидерами отрасли, чтобы узнать их мысли по этой теме.

У нас была фантастическая возможность поговорить с Криш Кришнаном — дальновидным лидером в области данных, который входит в число лучших консультантов по хранилищам данных в мире. Он является автором трех электронных книг и многочисленных статей, технических документов, тематических исследований и других публикаций об устройствах и архитектурах хранилищ данных.

В ходе нашей дискуссии он поделился своими мыслями о решающей роли моделирования данных в построении BI-архитектур и преобразующем потенциале автоматизированного моделирования данных в современном мире. Он также пролил свет на важность подхода, основанного на метаданных. Давайте посмотрим на некоторые ключевые выводы из дискуссии:

Какова важность моделирования данных для эффективного внедрения хранилища данных?

Хранилище данных — это хранилище всех транзакционных действий, происходящих в системе. Без моделирования данных невозможно построить эффективное решение с точки зрения потребления. [Итак], важно создать модель, прежде чем переходить к потреблению данных. Это означает преобразование полуструктурированных и неструктурированных данных в структурированный формат. Рекомендация «Не моделируйте, когда модель поступает, а моделируйте, когда данные извлекаются».

Должны ли модели данных строиться на основе существующих данных или отражать основной бизнес-процесс?

Данные генерируются для удовлетворения результатов процесса, поэтому модель данных должна строиться с учетом требований конечного пользователя. Это означает, что у вас должна быть модель, когда данные покидают хранилище данных. Модель бизнес-потребителя должна быть помещена между получением данных, а вокруг этого процесса должен быть построен ряд преобразований. Итак, это комбинация того и другого.

Но насколько глубоко и широко вы хотели бы пойти, зависит от того, где приходит автоматизация. В современном мире, управляемом данными, необходимо автоматизировать процесс. Помещение данных в хранилище должно быть ближе к процессу. Данные, поступающие для анализа, должны быть более ориентированы на данные. В промежутке вы можете внедрить автоматизацию для проведения преобразований и максимизации эффективности.

Стоит ли заранее создавать корпоративную модель данных?

Предпочтительным решением является бизнес-ориентированная модель, которая будет использовать собранные необработанные логические данные. Следовательно, необработанные данные [присутствуют] в одном центральном источнике, но могут служить нескольким конечным целям. Это позволит пользователям добавлять и раскручивать модели по мере необходимости.

Вот где в уравнение вступает ориентация на данные. Это требует, чтобы каждый человек в организации понимал, кто производит данные, что входит в данные, кто будет использовать эти данные и как они планируют их использовать.

DАтацентричность означает, что вы не привязаны к технологиямнологии а процесс, который можно смоделировать и изучить, используя технологический уровень.

Должен ли более итеративный подход к моделированию данных быть предпочтительным выбором?

Традиционный подход «Инмон» заключался в том, чтобы построить чудовище и заполнить его. Более итеративный подход — это подход «Кимбалла» размерного моделирования, который дает возможность разворачиваться по требованию и иметь набор точек интеграции, с помощью которых вы можете соединить каждый дополнительный результат. Поэтому нет необходимости каждый раз строить звездообразную схему.

Раньше проектирование схемы в основном определялось системой управления реляционными базами данных. Это потому, что схема должна соответствовать дизайну. Транзакционная система требует такой дисциплины. Но важно понимать, что хранилище данных не является транзакционным, а хранит все, что произошло в нескольких транзакционных системах.

An итерационный подход к моделированию данных предпочтительным выбором должен стать подход, ориентированный на бизнес.

Что такое хранилища данных?

«Хранилища данных были представлены примерно в 2010 году Дэном Линстедтом и Хансом Халлгреном, но в последние годы они были замечены и стали популярными, поскольку все больше компаний переходят в облако. Технологические гиганты, такие как Amazon, Google и Microsoft, а также множество других поставщиков, оказывающих с ними услуги, работают над хранилищем данных из-за преимуществ, которые оно приносит.

Это методология, с помощью которой вы можете перенести критически важные данные в свои системы. Вы можете поместить их [данные] в хранилище и защитить их. Затем вы сможете получить к нему доступ из кошелька на последней встроенной основе, с помощью которого вы сможете получать различные виды данных из разных областей».

Каков преобразующий потенциал автоматизированного моделирования данных?

Криш считает, что более автоматизированное моделирование данных означает, что вы можете более эффективно обрабатывать данные. Например, в системе готова таблица клиентов. Вы можете добавить метаданные, включая имя клиента, адреса, город, штат, страну, почтовый индекс, контактные данные и т. д. Определенные поля помогают ускорить весь процесс документирования этой информации.

Что вам даст эта автоматизация? Это ускоряет необходимость документировать каждое требование.т. НАШИвсе это удалено, Gone. ТЭто уровень, до которого нам нужно автоматизировать.

Это совершенно верно. Процесс автоматизированного моделирования данных значительно облегчает создание метарепозитория, который устанавливает взаимосвязи, минимизирует несоответствия и интегрирует разрозненные системы. Это также устраняет несоответствия и неточности данных, тем самым повышая ценность аналитики и отчетности.

Мысли о расставании?

Нам нужно начать принимать эти перемены, а перемены означают хаос. Хаос – единственная константа в мире, в котором мы живем.

Вы можете увидеть это буквально в мире, в котором мы живем сегодня. Итак, сделайте шаг назад и проведите неделю. почитайте, послушайте серьезные подкасты от разных поставщиков и поймите, какие проблемы решаются.

[А] затем попытайтесь собраться с мыслями и посмотреть, как вы делаете то же самое с новым инструментом в руке. это мои прощальные комментарии к сегодняшней дискуссии».

Если хочешь взять Astera DW Builder на тест-драйве, нажмите здесь.. Или, если вы заинтересованы в обсуждении вашего варианта использования хранилища данных с нашей технической командой, свяжитесь с нами по этому адресу. ссылке.

Вам также может понравиться
7 лучших инструментов агрегирования данных в 2024 году
Структура управления данными: что это такое? Важность, основные принципы и передовой опыт
Лучшие инструменты приема данных в 2024 году
принимая во внимание Astera Для ваших потребностей в управлении данными?

Установите соединение без кода с вашими корпоративными приложениями, базами данных и облачными приложениями для интеграции всех ваших данных.

Давайте соединимся сейчас!
давайте соединимся