Virtualización de datos: una descripción general de la tecnología

By | 2020-01-15T04:38:40+00:00 30 de enero de XNUM.|

Debido a sus operaciones generalizadas, las empresas recurren a diferentes tipos de sistemas que administran datos heterogéneos. Estos sistemas están conectados a través de una infraestructura de datos intrincadamente unida, que comprende bases de datos, almacenes de datos, marts y lagos, almacenando piezas clave de información inteligible. Sin embargo, facilitar el movimiento de datos y extraer información empresarial requiere el uso de una gran variedad de tecnologías de administración de datos, que pueden ser complejas de aprender y administrar. Aquí es donde las herramientas de virtualización de datos entran en juego.

Exploremos la tecnología y cómo permite a las empresas maximizar las capacidades operativas de su infraestructura de datos integral.

¿Qué es la virtualización de datos?

La virtualización de datos crea una capa de abstracción que trae datos de diferentes fuentes sin realizar todo el proceso. Proceso de extracción-transformación-carga (ETL) o creando una plataforma separada e integrada para ver datos. En su lugar, se conecta virtualmente a diferentes bases de datos, integra toda la información para proporcionar vistas virtuales y las publica como un servicio de datos, como REST. Esto mejora la accesibilidad de los datos, haciendo que bits específicos de información estén disponibles para informes, análisis y toma de decisiones.

Al crear una capa de abstracción, herramientas de virtualización exponga solo los datos requeridos a los usuarios sin requerir detalles técnicos sobre la ubicación o estructura de la fuente de datos. Como resultado, las organizaciones pueden restringir el acceso a los datos a usuarios autorizados solo para garantizar la seguridad y cumplir con los requisitos de gobierno de datos.

La tecnología simplifica los procesos clave, como la integración de datos, la federación y la transformación, haciendo que los datos sean accesibles para paneles, portales, aplicaciones y otras soluciones de front-end. Además, al comprimir o deduplicar datos a través de sistemas de almacenamiento, las empresas pueden satisfacer sus necesidades de infraestructura de manera más eficiente, lo que resulta en ahorros sustanciales de costos.

Herramientas de virtualización de datos.

La virtualización de datos integra datos de fuentes heterogéneas, en lugar de extraerlos y cargarlos en una única plataforma, como Enterprise Service Bus (ESB), Extract-Transform-Load (ETL) y otras aplicaciones de middleware. Cuando se utiliza correctamente, una herramienta de virtualización de datos puede servir como parte integral de la estrategia de integración de datos. Puede proporcionar una mayor flexibilidad en el acceso a los datos, limitar los silos de datos y automatizar la ejecución de consultas para un tiempo de comprensión más rápido.

Hoy en día, las empresas hacen que el software de virtualización de datos sea una parte integral de su enfoque de gestión de datos, ya que permite complementar procesos como el almacenamiento de datos, la preparación de datos, la gestión de la calidad de los datos y la integración de datos.

Aplicaciones de virtualización de datos.

Las empresas pueden aprovechar la tecnología de virtualización para optimizar sus sistemas y operaciones de varias maneras, tales como:

  • Entrega de datos: Le permite publicar conjuntos de datos (solicitados por los usuarios o generados a través de la aplicación cliente) como servicios de datos o vistas de datos de negocios.
  • Federación de datos: Funciona al unísono con el software de federación de datos para proporcionar vistas integradas de las fuentes de datos desde bases de datos dispares.
  • Transformación de datos: Permite a los usuarios aplicar lógicas de transformación en la capa de presentación, mejorando así la calidad general de los datos.
  • Movimiento de datos y replicación: Las herramientas de virtualización de datos no copian ni mueven datos desde el sistema principal o la ubicación de almacenamiento, lo que evita que los usuarios realicen procesos de extracción y conservan múltiples copias de datos inconsistentes y desactualizados.
  • Acceso a datos virtualizados: Le permite desglosar los almacenes de datos estableciendo un punto de acceso de datos lógicos a fuentes dispares.
  • Abstracción: Crea una capa de abstracción que oculta los aspectos técnicos, como la tecnología de almacenamiento, el idioma del sistema, las API, la estructura de almacenamiento y la ubicación de los datos.

Dado que una herramienta de virtualización de datos ofrece un conjunto integral de capacidades, se ha demostrado que es útil para fines de administración, operaciones y desarrollo.

Beneficios de la virtualización de datos

De acuerdo con el GartnerPor 2020, aproximadamente el 35 por ciento de las empresas hará de la virtualización de datos una parte de su estrategia de integración de datos. Aquí es por qué las empresas están optando cada vez más por las herramientas de virtualización de datos:

  • Acceso a datos multimodo y multi-fuente., facilitando a los usuarios en diferentes niveles el uso de datos según sus requisitos
  • Seguridad mejorada y gobierno de datos para mantener los datos críticos a salvo de usuarios no autorizados
  • Escondiendo la complejidad de las fuentes de datos subyacentes, al presentar los datos como si fueran de una sola base de datos o sistema
  • Agilidad de la información, que es integral en los entornos de negocios, ya que los datos están disponibles para tomar decisiones rápidamente
  • Plataforma agnóstica de infraestructura., ya que permite que los datos de una variedad de bases de datos y sistemas se integren fácilmente, lo que reduce los costos operativos y la redundancia de datos
  • Estructura de la tabla simplificada, que puede agilizar el desarrollo de aplicaciones y reducir la necesidad de mantenimiento de aplicaciones
  • Fácil integración de nuevas fuentes de nube a sistemas de TI existentes fácilmente, permitiendo a los usuarios tener una imagen completa de la información externa e interna
  • Optimización de consultas híbridas, permitiéndole agilizar las consultas para un push programado, un pull demand y otros tipos de solicitudes de datos
  • Aumento de la velocidad de comercialización. ya que reduce el tiempo necesario para obtener datos para mejorar productos o servicios nuevos o existentes para satisfacer las demandas de los consumidores

Otros beneficios incluyen ahorros de costos debido a la menor cantidad de requisitos de hardware y menores costos operativos y de mantenimiento asociados con la ejecución de procesos ETL para poblar y mantener bases de datos. Además, las herramientas de virtualización de datos almacenan información de metadatos y crean capas virtuales reutilizables, lo que le permite experimentar una calidad de datos mejorada y una latencia de datos reducida.

Casos de uso de virtualización de datos

De acuerdo con el ForresterLa virtualización de datos se ha convertido en un activo fundamental para cualquier empresa que busque triunfar ante los crecientes desafíos de los datos. Con innovaciones como la reducción de consultas, la optimización de consultas, el almacenamiento en caché, la automatización de procesos, el catálogo de datos y otros, la tecnología de virtualización de datos está avanzando en el tratamiento de una variedad de puntos de dolor de integración de datos de múltiples fuentes.

Aquí hay algunos casos de uso y aplicaciones que muestran cómo la virtualización de la base de datos está ayudando a las empresas a enfrentar los desafíos de la administración de datos maestros:

1. Mejora la funcionalidad del almacén de datos lógicos

La virtualización de datos actúa como un combustible para el arquitectura de almacenamiento de datos lógicos. La tecnología permite la federación de consultas a través de repositorios de datos empresariales y utilidades de software tradicionales y modernas, como almacenes de datos, lagos de datos, servicios web, Hadoop, NoSQL, etc., haciéndolos parecer a los usuarios como si provengan de una única base de datos / ubicación de almacenamiento .

En una arquitectura de almacén de datos lógica, la virtualización de datos le permite crear un único lugar lógico para que los usuarios adquieran datos analíticos, independientemente de la aplicación o la fuente. Permite la transferencia rápida de datos a través de varios protocolos y API de uso común, como REST, JDBC, ODBC y otros. También le permite asignar cargas de trabajo automáticamente para garantizar el cumplimiento de los requisitos del Acuerdo de nivel de servicio (SLA).

2. Trata la complejidad del análisis de Big Data

Las empresas utilizan formas predictivas, cognitivas, en tiempo real e históricas de análisis de big data para obtener una ventaja sobre la competencia. Sin embargo, debido al aumento del volumen y la complejidad de los datos, las empresas deben adoptar una amplia gama de tecnologías, como los sistemas Hadoop, los almacenes de datos, las plataformas de análisis en tiempo real y otras para aprovechar las oportunidades emergentes.

A través de la federación de datos y la abstracción, puede crear vistas lógicas de datos que residen en fuentes dispares, lo que le permite utilizar los datos derivados para análisis avanzados más rápidamente. Además, permite una fácil integración con su almacén de datos, herramientas de inteligencia empresarial y otras plataformas de análisis dentro de la infraestructura de datos de su empresa para agilidad de la información.

3. Facilita el acceso a los datos de la aplicación

Los sistemas y aplicaciones requieren datos para producir los conocimientos necesarios para la toma de decisiones. Sin embargo, un desafío importante cuando se trabaja con aplicaciones es acceder a fuentes y tipos de datos distribuidos. Además, es posible que deba escribir líneas de código extendidas para facilitar el intercambio de activos de datos entre sistemas y aplicaciones. Algunas operaciones también pueden necesitar transformaciones complejas, que solo se pueden lograr a través de técnicas o herramientas especializadas.

Por ejemplo, si tiene dos conjuntos de datos que residen en IBM DB2 y PostgreSQL, la herramienta se asignará a las bases de datos de destino, ejecutará automáticamente consultas separadas (para cada base de datos) para obtener los datos requeridos y los federará en una única plataforma integrada, proporcionando la Vistas virtuales a través de una capa de presentación semántica. También realizará uniones, filtros u otras transformaciones en la capa canónica para presentar los datos en el formato deseado.

4. Optimiza el Almacén de Datos Empresariales (EDW).

Los almacenes de datos juegan un papel crucial para ayudar a las empresas a manejar grandes cantidades de datos entrantes de múltiples fuentes y prepararlos para consultas y análisis. Mientras ETL y otros tradicionales métodos de integración de datos son buenos para el movimiento masivo de datos, los usuarios tienen que trabajar con datos desactualizados de la última operación de ETL. Además, mover grandes volúmenes de datos (en petabytes y zettabytes) requiere mucho tiempo y requiere hardware y software más avanzados y más potentes.

La virtualización de datos agiliza el proceso de integración de datos. Utiliza un mecanismo de federación para homogeneizar datos de diferentes bases de datos y crear una única plataforma integrada que se convierte en un único punto de acceso para los usuarios. Ofrece integración bajo demanda, proporcionando datos en tiempo real para informes y análisis.