Saltar al contenido

¿Qué es un Data Hub?

septiembre 23, 2021
10j5XVstHZcCywGZbFBYB9A

¿Qué es un Data Hub?

Por qué las arquitecturas como los centros de datos están en auge

Christianlauer

18 de enero·3 min de lectura

Foto de Luca Bravo en Unsplash

Definición

Un centro de datos es un intercambio de datos con un flujo de datos sin fricciones en su núcleo. Se puede describir como una solución que consta de diferentes tecnologías: Data Warehouse, Ingeniería, Data Science. Es más bien una tecnología, pero un enfoque para determinar de manera más efectiva dónde, cuándo y para quién los datos deben ser mediados, compartidos y luego vinculados y / o persistidos. Los puntos finales, que pueden ser aplicaciones, procesos, personas o algoritmos, interactúan con el concentrador, potencialmente en tiempo real, para proporcionar o recibir datos del concentrador. [1].

Distinción del Data Warehouse y Lake

Mientras que Data Warehouses y Data Lakes se entienden como puntos finales para la recopilación de datos que existen para respaldar el análisis de una organización, los Data Hubs sirven como puntos de intermediación e intercambio de datos. A continuación se muestra un resumen de las características de cada solución.

1*Uq2zDwmO

Características – Imagen del autor

Beneficios de un centro de datos

Un centro de datos permite el intercambio de datos al conectar a los productores de datos con los consumidores de datos. Los puntos finales interactúan con el centro de datos al proporcionar datos en él o recibir datos de él, y el centro proporciona un punto de gestión y mediación, lo que hace visible cómo fluyen los datos en la empresa. [2].

Un Data Hub conecta muchos sistemas diferentes en tiempo real; es una herramienta adecuada para los desafíos actuales: a saber, intercambiar una gran cantidad de datos lo más rápido y estandarizado posible y ponerlos a disposición para aplicaciones como sistemas, aprendizaje automático o informes.

Ejemplos de tecnologías de Data Hub

Incluso si, como se describe, los centros de datos no son una tecnología en sí mismos sino más bien un enfoque, existen productos en el mercado que se comercializan como centros de datos. Estos ejemplos también muestran claramente que un centro de datos es una combinación de varias tecnologías.

Ejemplos:

  • Cumulocity IoT DataHub [3]
  • Cloudera, centro de datos empresarial [4]
  • Centro de datos de Google Ads [5]

Otro buen ejemplo es la descripción de SAP. Esto muestra bastante bien la interacción de las tecnologías y cuál podría ser la idea real de un Data Hub.

SAP DATA HUB – Fuente SAP [6]

Conclusión

Un centro de datos reúne datos empresariales de diferentes fuentes y formatos para extraer conocimientos valiosos. Hablamos menos de tecnología que de enfoque o plataforma. Con suerte, este artículo le dará una primera idea de lo que es un centro de datos. Sin embargo, para profundizar, recomiendo leer más sobre el tema. Mis fuentes a continuación podrían ser de ayuda.

Fuentes y lecturas adicionales

[1] Eckerson, Data Hubs: ¿Qué sigue en la arquitectura de datos? (2019)

[2] A. Awadallah, The Platform for Big Data, Libro blanco de Cloudera (2013)

[3] Cumulocity IoT, descripción general de DataHub (2021)

[4] Cloudera, Enterprise Data Hub (2020)

[5] Google, Ads Data Hub (2021)

[6] SAP, tengo SAP HANA, ¿cuándo necesitaría SAP Data Hub (2019)?

close