Inicio » Tendencias » Data Warehouse, la nueva columna vertebral de las organizaciones

Data Warehouse, la nueva columna vertebral de las organizaciones

La constante evolución tecnológica, hace que cambie día a día nuestra forma de entender cómo las empresas tratan de almacenar y tener organizados los miles y millones de datos que se generan y procesan en nuestros días. El Data Warehouse supone una evolución en nuestra manera de entender los almacenes de datos y las bases de datos analíticas, tradicionalmente, se han utilizado las bases de datos relacionales basadas en SQL que hacían las veces de columna vertebral para las organizaciones y las aplicaciones de negocio.

Sin embargo, en la actualidad vivimos en un boom constante en lo que ha generación de datos se refiere, estos auténticos mares de datos que se generan día a día han favorecido el desarrollo de nuevas tecnologías y por ello nuevos modelos de almacenamiento.

Este nuevo contexto en el que ya no solamente hacen falta los datos propios de una organización, sino que además buscamos datos en fuentes externas como pueden ser las redes sociales, webs, notas de prensa o radio, indicadores externos sobre una legislación vigente, etc.

Hacen que no sea una tarea fácil tener todos estos datos centralizados en un solo punto, la solución a estos problemas surge a través de la aparición del Data Warehouse, pero ¿qué es un Data Warehouse?

¿Qué es un Data Warehouse?

Una definición a este concepto sería: “Un almacén de datos o Data Warehouse es una colección de información creada para soportar las aplicaciones de toma de decisiones”.

LEE  Las principales tendencias en Big Data e Inteligencia Artificial para 2020

Un almacén de datos o Data Warehouse se nutre de diferentes fuentes, entre ellas, obviamente, los sistemas operacionales internos, a través de las llamadas ETL, siglas que dan nombre a los procesos de Extracción (Extraction), Transformación (Transformation) y Carga (Load).

Una arquitectura tipo de un almacén de datos o Data Warehouse es la siguiente:

Propiedades de un Data Warehouse

Los Data Warehouse contienen los datos corporativos de una organización, para entender un poco mejor su funcionamiento vamos a describir sus principales propiedades:

Orientados a empresa

  • Los datos son almacenados y organizados para que cada elemento registrado esté relacionado a un mismo evento del mundo real.
  • Un almacén de datos está organizado a temas importantes tales como clientes, proveedores, productos y ventas realizadas.

Integrado

  • Debe estar diseñado para almacenar todos los datos empresariales. Esto conlleva utilizar diferentes fuentes de datos heterogéneas, como bases de datos relacionales, archivos planos y registros transaccionales procedentes de distintos sistemas.

Cambiantes con el tiempo

  • Los datos se almacenan para proporcionar información desde una perspectiva histórica, pero a su vez, todos los cambios producidos en los datos deben ser registrados para poder reflejar todas las variaciones en el tiempo.
  • Como consecuencia, cada estructura de datos en el Data Warehouse contiene, implícita o explícitamente, un elemento temporal.

No volátil

  • Un almacén de datos está siempre separado de los datos de aplicación encontrados en una organización.
  • Debido a esta separación, un almacén de datos no requiere procesamiento de transacciones, recuperación y mecanismos de control de concurrencia al dato.
  • Por lo general, solo requiere dos operaciones de acceso a datos: carga inicial y acceso a los mismos. Por lo que una vez que los datos son registrados, estos no deben ser modificados ni eliminados.

Estrategias de arquitectura y diseño de un Data Warehouse

Aunque existen muchas metodologías de diseño de un Data Warehouse, se utilizan dos modelos que han probado tener un gran éxito en el desarrollo de soluciones de Business Intelligence.

LEE  ¿Qué es el shazaming de datos? Tendencias en Big Data

A estas propuestas se las conoce como Bus Data Warehouse de Kimball y, Data Warehouse empresarial o repositorio central de datos, de Immon. Vamos a ver la forma esquemática de estos dos enfoques de diseño y arquitectura Data Warehouse.

Diseño Top-Down, diseño Immon

En este enfoque se presenta el Data Warehouse como un conjunto integrado de bases de datos, con orientación temática, diseñado para el apoyo a la toma de decisiones donde cada unidad es relevante en algún momento del tiempo. De esta forma podemos que los Data Mart (un Data Mart está orientado a un grupo específico de usuarios dentro de una compañía u organización). Es decir, que la información generada por varios departamentos origina el Data Warehouse.

Diseño Bottom-Up, diseño Kimball

Kimball define el Data Warehouse como:

Una copia de las transacciones de datos específicamente estructurada para consultas y análisis”.

A diferencia de Immon. Kimball establece una visión más práctica asumiendo que el almacén de datos está compuesto por la unión de todos los Data Marts corporativos que estén relacionados entre sí, a través de dimensiones. De este modo los Data Marts se unen generando el llamado modelo en estrella.

¿Cuáles son sus principales diferencias?

La solución de Kimball muestra cada Data Mart de forma independiente ya que cada uno de ellos es alimentado directamente desde los orígenes de información, por el contrario, en el modelo de Immon sostiene que los Data Marts son dependientes, lo que quiere decir que se alimentan desde el almacén de datos corporativo.

Para finalizar, de una forma más visual podemos establecer una tabla comparativa entre ambos diseños:

LEE  Sancionan a Youtube por recopilación de datos a menores

De forma resumida podríamos concluir afirmando que los Data Warehouse constituyen actualmente la columna vertebral de una empresa, ya que, actualmente el manejo y analítica de datos es un punto crítico y desde el que podemos extraer casi constantemente una ventaja competitiva.

Los Data Warehouse actualmente sirven como un punto central en donde residen no solamente todos los datos corporativos, sino, además todos los datos externos que nos ayudan a ampliar más la información y conocimiento de nuestra organización y entender el entorno o ámbito de operación.

Juan Manuel Moreno, tutor del Master en Big Data y Business Analytics de IMF Business School.

Formación Relacionada

Las dos pestañas siguientes cambian el contenido a continuación.
Equipo de profesionales formado esencialmente por profesores y colaboradores con amplia experiencia en las distintas áreas de negocio del mundo empresarial y del mundo académico. IMF Smart Education ofrece una exclusiva oferta de postgrados en tecnología en colaboración con empresa como Deloitte, Indra o EY (masters en Big Data, Ciberseguridad, Sistemas, Deep Learning, IoT) y un máster que permite acceder a la certificación PMP/PMI. Para ello IMF cuenta con acuerdos con universidades como Nebrija, la Universidad de Alcalá y la Universidad Católica de Ávila así como con un selecto grupo de universidades de Latinoamérica.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¡Noticias, eventos y formación!

Suscríbete ahora y recibe los mejores contenidos sobre Negocios, Prevención, Marketing, Energías Renovables, Tecnología, Logística y Recursos Humanos.

Acepto recibir comunicaciones comerciales por parte del grupo IMF
He leído y acepto las condiciones


Data Warehouse, la nueva columna vertebral de las organizaciones

El Data Warehouse supone una evolución en nuestra manera de entender los almacenes de datos y las bases de datos analíticas en las organizaciones.