IDC Оценки что к 80 году неструктурированные данные составят 2025% всех данных. Причина для этот высокий процент эти неструктурированные данные какs из разных источников, ВКЛЮЧАЕТИНГ комментарии и обзоры в социальных сетях, изображения, аудио, медицинские отчеты и даже электронные письма, которые люди пишут как клиентам, так и коллегам.
Характеристики неструктурированных данных
Основное различие между структурированными и неструктурированными данными заключается в том, что последние не подчиняются какому-либо определенному формату или правилам. относящийся к ул.учение. Эти данные нельзя хранить в строках и столбцах, и никакую заранее определенную модель данных нельзя идентифицировать, просто взглянув на нее. Из-за отсутствия структуры эти данные по своей сути сложно организовать, и они могут даже содержать несколько дубликатов или неточных значений.
Аргументы в пользу неструктурированных данных
Неструктурированные данные могут существовать в различных форматах. и не имеет какой-либо заранее определенной схемы или правил, поэтому извлечь из него ценность может быть очень сложно. В результате большая часть неструктурированных данных никогда не используется для бизнес-аналитики или аналитики.
Это может быть ограничением, особенно когда речь идет о принятии решений и внедрении инноваций, прежде всего потому, что неструктурированные данные потенциально могут содержать много полезной информации, которую предприятия могут использовать. Добавьте к этому тот факт, что 58% респондентов , о принятии решений на основе данных говорят, что менее половины бизнес-решений в их компаниях принимаются на основе данных и информации, и легко понять, насколько больше ценностное бизнес может извлечение осмысливая неструктурированные данные.
Возьмем пример больницы. Хотя идентификаторы пациентов и даты приема обычно имеют структурированный формат, многие другие соответствующие такая информация, как рецепты, история болезни и отзывы пациентов, хранится в TXT-файлы и PDF-файлы. Вся эта информация, если рассматривать ее вместе, может помочь больницам получить ценную информацию и улучшить качество ухода за пациентами предложенный.
Доступно извлечение неструктурированных данных и управление ими добыча и управлениепредприятия могут лучше понять общую картину благодарянетрадиционный' данные, которые они могут использовать. Кроме того, используя инструменты для управления неструктурированные данные, предприятия также могут использовать использовать данные хранятся в нескольких местах и, наконец, экспорт это до места назначения по своему выбору для бизнес-аналитики или любых других целей.
Инфографика ниже показывает, почему управления неструктурированные данные - это сложные, почему вам следует добавить к нему структуру и варианты использования, чтобы понять, как it могут быть использованы в различных условиях и отраслях.