Qual è la differenza tra il data warehouse federato e decentralizzato?


9

Non riesco a trovare chiare definizioni o spiegazioni di nessuno di questi. Entrambi sembrano decentralizzati. Sembra che in DWH federato i dati siano distribuiti e non integrati in un singolo repository e accessibili da fonti distribuite.

Durante l'implementazione decentralizzata di DWH, i dati sono integrati in un repository centrale.

Spiegare la differenza tra queste due implementazioni.

Risposte:


6

Un data warehouse decentralizzato è essenzialmente una raccolta di data warehouse gestiti da singole regioni o unità aziendali ma resi disponibili centralmente. Questi possono trovarsi sullo stesso server fisico, condividere strumenti di reporting o essere resi disponibili in tutta l'organizzazione in qualche altro modo. Potrebbero esserci anche componenti centralizzati come la gestione dei dati anagrafici. Ciò avviene normalmente perché i data warehouse centralizzati diventano ingombranti oltre una determinata dimensione dell'organizzazione. Un data warehouse deve rispondere ai cambiamenti e, se non risponde, i singoli dipartimenti inizieranno a costruire le proprie soluzioni.

Puoi vederlo nelle banche di investimento, dove la tendenza è quella di creare data warehouse per soddisfare requisiti specifici (ad esempio una particolare iniziativa normativa o un tipo di rendicontazione finanziaria) piuttosto che costruire un magazzino centralizzato in tutta l'azienda. Una società delle dimensioni di una grande banca è semplicemente troppo complessa per soddisfare i requisiti di un EDW completamente centralizzato in un periodo di tempo ragionevole.

Un data warehouse federato aggiunge un livello di consolidamento master tra i data warehouse decentralizzati. In genere, ciò ospiterà solo una porzione verticale ristretta dei dati, poiché il suo scopo è quello di consolidare le metriche chiave dell'intera attività per i report aziendali o di gruppo, piuttosto che fornire una piattaforma MI generalizzata per tutti i dipartimenti. I dipartimenti hanno il compito di produrre i propri sistemi EDW o MI ma sono tenuti a fornire i set di dati necessari per popolare il livello di consolidamento centrale.

Questa architettura offre il meglio di entrambi i mondi. La direzione centrale può vedere le loro metriche nell'intera organizzazione e i dipartimenti possono organizzare soluzioni di infortunio per soddisfare le loro esigenze. La direzione centrale deve solo imporre i requisiti relativi ai dati richiesti dall'analitica e dall'MI come feed forniti dai sistemi dipartimentali. Se necessitano di rapporti o analisi più approfonditi su un reparto specifico, ciò può essere fornito dai sistemi dipartimentali.

L'articolo collegato di seguito tratta i data warehouse federati in modo più approfondito.

http://www.zentut.com/data-warehouse/federated-data-warehouse-architecture/

Questo articolo illustra le topologie del data warehouse in modo più approfondito.

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-1

https://www.ibmbigdatahub.com/blog/data-warehouse-architectures-multinational-organizations-part-2


Quindi sono entrambi decentralizzati, ma federati integrano un sottoinsieme (metriche chiave) in un unico posto?
LifeH2O

Sì. È corretto. Ricorda che queste definizioni sono piuttosto informali, quindi la gente può usarle in modo diverso. Non ho mai avuto occasione di costruire alcun tipo di sistema, anche se una volta ho fatto una proposta per un'architettura federata e ho visto un paio di siti che avevano sistemi che potevano essere caratterizzati come decentralizzati dalle definizioni che sto usando.
Preoccupato di
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.