Quelle est la différence entre un entrepôt de données fédéré et décentralisé?

9

Je ne trouve aucune définition ou explication claire de ces éléments. Les deux semblent décentralisés. Il apparaît que dans Federated DWH, les données sont distribuées et non intégrées dans un référentiel unique et accessibles à partir de sources distribuées.

Dans l'implémentation DWH décentralisée, les données sont intégrées dans un référentiel central.

Veuillez expliquer la différence entre ces deux implémentations.

LifeH2O
la source

Réponses:

6

Un entrepôt de données décentralisé est essentiellement une collection d'entrepôts de données gérés par des régions ou des unités commerciales individuelles mais mis à disposition de manière centralisée. Ceux-ci peuvent se trouver sur le même serveur physique, partager des outils de génération de rapports ou être mis à disposition dans toute l'organisation d'une autre manière. Il peut également y avoir des composants centralisés tels que la gestion des données de base. Cela se fait normalement car les entrepôts de données centralisés deviennent difficiles à gérer au-delà d'une certaine taille d'organisation. Un entrepôt de données doit être réactif au changement et s'il ne répond pas trop, les différents services commenceront à créer leurs propres solutions.

Vous pouvez le constater dans les banques d'investissement, où la tendance est de faire des entrepôts de données pour répondre à des exigences spécifiques (par exemple, une initiative réglementaire particulière ou un certain type de rapports financiers) plutôt que de construire un entrepôt centralisé dans l'ensemble de l'entreprise. Une entreprise de la taille d'une grande banque est tout simplement trop complexe pour répondre aux exigences d'un EDW entièrement centralisé dans un délai raisonnable.

Un entrepôt de données fédéré ajoute une couche de consolidation principale dans les entrepôts de données décentralisés. En règle générale, cela ne contiendra qu'une étroite tranche verticale des données, car son objectif est de consolider les mesures clés dans l'ensemble de l'entreprise pour les rapports au niveau de l'entreprise ou du groupe, plutôt que de fournir une plate-forme d'IM généralisée pour tous les départements. Les départements doivent produire leurs propres systèmes EDW ou MI mais doivent fournir les ensembles de données nécessaires pour peupler la couche centrale de consolidation.

Cette architecture vous offre le meilleur des deux mondes. La direction centrale peut voir leurs métriques dans l'ensemble de l'organisation, et les départements peuvent organiser des solutions MI pour répondre à leurs besoins. La direction centrale n'a qu'à imposer les exigences en matière de données nécessaires à ses analyses et à l'IM en tant que flux fournis par les systèmes ministériels. S'ils ont besoin de rapports ou d'analyses plus approfondis sur un département spécifique, cela peut être fourni par les systèmes départementaux.

L'article ci-dessous décrit plus en détail les entrepôts de données fédérés.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

Cet article décrit plus en détail les topologies d'entrepôt de données.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2

ConcernedOfTunbridgeWells
la source
Ils sont donc tous deux décentralisés, mais fédérés intègrent un sous-ensemble (métriques clés) à un seul endroit?
LifeH2O
Oui. C'est correct. Gardez à l'esprit que ces définitions sont assez informelles, donc les gens peuvent les utiliser différemment. Je n'ai jamais eu l'occasion de construire l'un ou l'autre type de système, bien que j'aie fait une proposition pour une architecture fédérée une fois et j'ai vu quelques sites qui avaient des systèmes qui pourraient être caractérisés comme décentralisés par les définitions que j'utilise.
ConcernedOfTunbridgeWells