Risposte:
Dai un'occhiata a questo per ulteriori informazioni.
Da un link precedente:
Banca dati
Data Warehouse
È anche importante notare che i Data Warehouse potrebbero essere forniti da zero a molti database.
Da una vista non tecnica: un database è vincolato a una particolare applicazione o serie di applicazioni.
Un data warehouse è un repository di dati a livello aziendale. Conterrà i dati di tutti / molti segmenti dell'azienda. Condividerà queste informazioni per fornire un quadro globale dell'azienda. È anche fondamentale per l'integrazione tra i diversi segmenti del business.
Da un punto di vista tecnico: alla parola "Data Warehouse" non è stata data alcuna definizione riconosciuta. Personalmente, definisco un data warehouse come una raccolta di data mart. Dove ogni data-mart è costituito da uno o più database in cui il database è specifico per un set di problemi specifico (applicazione, set di dati o processo).
In poche parole, un database è un componente di un data-warehouse. Ci sono molti posti in cui esplorare questo concetto, ma poiché non esiste una "definizione", troverai delle sfide con ogni risposta che dai.
Un data warehouse è un TIPO di database.
Oltre a ciò che la gente ha già detto, i data warehouse tendono ad essere OLAP, con indici, ecc. Ottimizzati per la lettura, non per la scrittura, e i dati vengono de-normalizzati / trasformati in moduli che sono più facili da leggere e analizzare.
Alcuni hanno affermato che i "database" sono gli stessi di OLTP - questo non è vero. OLTP, ancora una volta, è un TIPO di database.
Altri tipi di "database": file di testo, XML, Excel, CSV ..., file flat :-)
It is a logical subset of Data warehouse, generally based upon business functions.
Il modo più semplice per spiegare sarebbe dire che un data warehouse è costituito da più di un semplice database. Un database è una raccolta di dati organizzata in qualche modo, ma un data warehouse è organizzato appositamente per "facilitare la reportistica e l'analisi". Questa tuttavia non è l'intera storia poiché il data warehousing contiene anche "i mezzi per recuperare e analizzare i dati, estrarre, trasformare e caricare i dati e gestire il dizionario dei dati sono anche considerati componenti essenziali di un sistema di data warehousing".
Base di dati : - OLTP (processo di transazione online)
Datawarehouse
Data Warehouse vs Database: un data warehouse è appositamente progettato per l'analisi dei dati, che prevede la lettura di grandi quantità di dati per comprendere le relazioni e le tendenze tra i dati. Un database viene utilizzato per acquisire e archiviare dati, ad esempio la registrazione dei dettagli di una transazione.
Data warehouse: carichi di lavoro adeguati : analisi, reportistica, big data. Fonte dei dati : dati raccolti e normalizzati da molte fonti. Acquisizione dati : operazioni di scrittura in blocco in genere su una pianificazione batch predeterminata. Normalizzazione dei dati - Schemi denormalizzati, come lo schema a stella o lo schema a fiocco di neve. Archiviazione dati : ottimizzata per semplicità di accesso e query ad alta velocità. prestazioni usando l'archiviazione colonnare. Accesso ai dati : ottimizzato per ridurre al minimo l'I / O e massimizzare il throughput dei dati.
Database transazionale: carichi di lavoro adeguati - Elaborazione delle transazioni. Origine dati : i dati acquisiti così come sono da un'unica fonte, ad esempio un sistema transazionale. Acquisizione dati : ottimizzata per le operazioni di scrittura continue poiché sono disponibili nuovi dati per massimizzare il throughput delle transazioni. Normalizzazione dei dati - Schemi statici altamente normalizzati. Archiviazione dei dati : ottimizzata per operazioni di scrittura elevate in un singolo blocco fisico orientato alla riga. Accesso ai dati : volumi elevati di operazioni di lettura di piccole dimensioni.
Qualsiasi archiviazione di dati per l'applicazione generalmente utilizza il database. Potrebbe essere un database relazionale o nessun database sql che è attualmente di tendenza.
Il data warehouse è anche un database. Siamo in grado di chiamare il database del data warehouse come archivio dati specializzato ai fini di report analitici per l'azienda. Questi dati utilizzati per le decisioni aziendali chiave.
I dati organizzati aiutano a segnalare e prendere decisioni aziendali in modo efficace.
Banca dati:
Utilizzato per l'elaborazione transazionale online (OLTP).
Data Warehouse:
Utilizzato per l'elaborazione analitica online (OLAP).
Un Data Warehousing (DW) è un processo per la raccolta e la gestione di dati da varie fonti per fornire approfondimenti aziendali significativi. Un data warehouse viene in genere utilizzato per connettere e analizzare dati aziendali da fonti eterogenee. Il data warehouse è il nucleo del sistema di BI che è stato creato per l'analisi e il reporting dei dati.
L'origine del data warehouse può essere un cluster di database, poiché i database vengono utilizzati per il processo di transazione online come la conservazione dei record correnti ... ma nel data warehouse memorizza i dati storici relativi al processo analitico online.
Un data warehouse è un tipo di struttura dati generalmente ospitato in un database. Il Data Warehouse fa riferimento al modello di dati e al tipo di dati ivi archiviati: dati modellati (modello di dati) per servire uno scopo analitico.
Un database può essere classificato come qualsiasi struttura che contiene dati. Tradizionalmente sarebbe un RDBMS come Oracle, SQL Server o MySQL. Tuttavia, un database può anche essere un database NoSQL come Apache Cassandra o un MPP colonnare come AWS RedShift.
Vedete che un database è semplicemente un posto dove archiviare i dati; un data warehouse è un modo specifico per archiviare i dati e serve uno scopo specifico, che è quello di servire query analitiche.
OLTP vs OLAP non ti dice la differenza tra un DW e un Database, sia OLTP che OLAP risiedono sui database. Memorizzano semplicemente i dati in modo diverso (diverse metodologie di modelli di dati) e servono a scopi diversi (OLTP: registra le transazioni, ottimizzato per gli aggiornamenti; OLAP: analizza le informazioni, ottimizzato per le letture).
Vedi in parole semplici: Dataware -> Enormi dati usando per Analitica / archiviazione / copia e analisi. Database -> Operazione CRUD con dati utilizzati di frequente.
La casa del dataware è il tipo di archiviazione che non si utilizza quotidianamente e il database è qualcosa che si gestisce frequentemente.
Per esempio. Se chiediamo l'estratto conto della banca, ci dà per gli ultimi 3/4/6 / più mesi perché è nel database. Se vuoi più di questo, memorizza su Dataware house.
Esempio: una casa vale $100,000
ed è apprezzata $1000
ogni anno.
Per tenere traccia del valore attuale della casa, è necessario utilizzare un database poiché il valore cambierebbe ogni anno.
Tre anni dopo, sarai in grado di vedere il valore della casa che è $103,000.
Per tenere traccia del valore storico della casa, è necessario utilizzare un data warehouse come dovrebbe essere il valore della casa
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.