Qual è la differenza tra un database e un data warehouse?


163

Qual è la differenza tra un database e un data warehouse?

Non sono la stessa cosa, o almeno scritti nella stessa cosa (cioè Oracle RDBMS)?

Risposte:


147

Dai un'occhiata a questo per ulteriori informazioni.

Da un link precedente:

Banca dati

  1. Utilizzato per l'elaborazione transazionale online ( OLTP ) ma può essere utilizzato per altri scopi come il data warehouse. Ciò registra i dati dell'utente per la cronologia.
  2. Le tabelle e i join sono complessi poiché sono normalizzati (per RDMS ). Questo viene fatto per ridurre i dati ridondanti e per risparmiare spazio di archiviazione.
  3. Entità: le tecniche di modellazione relazionale vengono utilizzate per la progettazione di database RDMS.
  4. Ottimizzato per l'operazione di scrittura.
  5. Le prestazioni sono basse per le query di analisi.

Data Warehouse

  1. Utilizzato per l'elaborazione analitica online ( OLAP ). Questo legge i dati storici per gli utenti per le decisioni aziendali.
  2. Le tabelle e i join sono semplici poiché non sono normalizzati. Questo viene fatto per ridurre i tempi di risposta per le query analitiche.
  3. Dati: le tecniche di modellazione vengono utilizzate per la progettazione del data warehouse.
  4. Ottimizzato per le operazioni di lettura.
  5. Prestazioni elevate per query analitiche.
  6. Di solito è un database.

È anche importante notare che i Data Warehouse potrebbero essere forniti da zero a molti database.


3
La modellazione dei dati è un termine generico e non si applica solo ai data warehouse. (Forse nel secondo n. 3 intendevano "modellazione dimensionale" in quanto, secondo la mia esperienza, è il modo più popolare per costruirli.) L'ultima riga non ha senso: in che modo un data warehouse "contiene" un database? Potrei dire che un data warehouse proviene da 0 a molti database (OLTP).
Patrick Marchand,

2
@Mark - Dove dice che i database sono SOLO per OLTP? Sta mostrando come i database si collegano ai data warehouse.
TheCloudlessSky

5
@Nickolay - Questa è una risposta di due anni. Modificalo e correggilo se sei preoccupato.
TheCloudlessSky

1
@DataMan - Contrassegna come risposta corretta. è una risposta abbastanza buona ed equa per la tua domanda.
sanzy,

1
qual è la differenza tra tecniche di modellazione dei dati e tecniche di modellazione delle entità?
QAIS

32

Da una vista non tecnica: un database è vincolato a una particolare applicazione o serie di applicazioni.

Un data warehouse è un repository di dati a livello aziendale. Conterrà i dati di tutti / molti segmenti dell'azienda. Condividerà queste informazioni per fornire un quadro globale dell'azienda. È anche fondamentale per l'integrazione tra i diversi segmenti del business.

Da un punto di vista tecnico: alla parola "Data Warehouse" non è stata data alcuna definizione riconosciuta. Personalmente, definisco un data warehouse come una raccolta di data mart. Dove ogni data-mart è costituito da uno o più database in cui il database è specifico per un set di problemi specifico (applicazione, set di dati o processo).

In poche parole, un database è un componente di un data-warehouse. Ci sono molti posti in cui esplorare questo concetto, ma poiché non esiste una "definizione", troverai delle sfide con ogni risposta che dai.


Il Datamart è preferibilmente un database OLTP?
CᴴᴀZ,

@ CᴴᴀZ per cosa? Datamart sono creati per OLAP, Datamart è bassamente un piccolo DWH (per una piccola parte del business). è stato creato per l'analisi, quindi se hai bisogno di un sistema OLTP un Datamart non è la tua scelta, se hai bisogno di un modello di dati per l'analisi (Start Schema o Snow flow), preferisci un Datamart.
Enrique Benito Casado,

Ehi @Enrique, hai capito bene: Datamart contribuisce all'OLAP. Da qui ho preso spunto dal fatto che Datamarts fosse OLTP : SQL Server OLTP Datamart .
CᴴᴀZ

Ciao @ CᴴᴀZ, ho letto l'articolo e sarebbe proprio come fare un OLTP con un Datamart. ok . (ma penso che l'hanno detto come un'eccezione) Prendi il conto del modo in cui dicono, le tabelle OLTP devono essere normalizzate per non avere incoerenze. la normalizzazione non è così complicata da fare in uno schema ER, ma è molto più complicata per Star-Schema o Snow-Flow. Questi schemi sono fatti per facilitare una lettura nel database e non operazioni transazionali. Ecco perché usare un Datamart come OLTP non dovrebbe essere una buona idea anche se è possibile.
Enrique Benito Casado,

16

Un data warehouse è un TIPO di database.

Oltre a ciò che la gente ha già detto, i data warehouse tendono ad essere OLAP, con indici, ecc. Ottimizzati per la lettura, non per la scrittura, e i dati vengono de-normalizzati / trasformati in moduli che sono più facili da leggere e analizzare.

Alcuni hanno affermato che i "database" sono gli stessi di OLTP - questo non è vero. OLTP, ancora una volta, è un TIPO di database.

Altri tipi di "database": file di testo, XML, Excel, CSV ..., file flat :-)


1
Questa è la risposta corretta di tutti. E un po 'su Datamart:It is a logical subset of Data warehouse, generally based upon business functions.
CᴴᴀZ

7

Il modo più semplice per spiegare sarebbe dire che un data warehouse è costituito da più di un semplice database. Un database è una raccolta di dati organizzata in qualche modo, ma un data warehouse è organizzato appositamente per "facilitare la reportistica e l'analisi". Questa tuttavia non è l'intera storia poiché il data warehousing contiene anche "i mezzi per recuperare e analizzare i dati, estrarre, trasformare e caricare i dati e gestire il dizionario dei dati sono anche considerati componenti essenziali di un sistema di data warehousing".

Data Warehouse


4

Base di dati : - OLTP (processo di transazione online)

  • Sono dati attuali, dati dettagliati aggiornati, dati isolati relazionali piatti.
  • La relazione tra entità viene utilizzata per progettare il database
  • Dimensione DB 100 MB-GB transazione semplice o richieste

Datawarehouse

  • OLAP (processo analitico online)
  • Si tratta di dati storici Schema a stella, schema innevato e galassia
  • lo schema viene utilizzato per progettare il data warehouse
  • Dimensione DB 100 GB-TB Base delle prestazioni della query migliorata per VISUALIZZAZIONE DATI MINING DATI
  • Consente agli utenti di acquisire una comprensione e una conoscenza più approfondite dei vari aspetti dei propri dati aziendali attraverso un accesso rapido, coerente e interattivo a un'ampia varietà di possibili visualizzazioni dei dati

4

Data Warehouse vs Database: un data warehouse è appositamente progettato per l'analisi dei dati, che prevede la lettura di grandi quantità di dati per comprendere le relazioni e le tendenze tra i dati. Un database viene utilizzato per acquisire e archiviare dati, ad esempio la registrazione dei dettagli di una transazione.

Data warehouse: carichi di lavoro adeguati : analisi, reportistica, big data. Fonte dei dati : dati raccolti e normalizzati da molte fonti. Acquisizione dati : operazioni di scrittura in blocco in genere su una pianificazione batch predeterminata. Normalizzazione dei dati - Schemi denormalizzati, come lo schema a stella o lo schema a fiocco di neve. Archiviazione dati : ottimizzata per semplicità di accesso e query ad alta velocità. prestazioni usando l'archiviazione colonnare. Accesso ai dati : ottimizzato per ridurre al minimo l'I / O e massimizzare il throughput dei dati.

Database transazionale: carichi di lavoro adeguati - Elaborazione delle transazioni. Origine dati : i dati acquisiti così come sono da un'unica fonte, ad esempio un sistema transazionale. Acquisizione dati : ottimizzata per le operazioni di scrittura continue poiché sono disponibili nuovi dati per massimizzare il throughput delle transazioni. Normalizzazione dei dati - Schemi statici altamente normalizzati. Archiviazione dei dati : ottimizzata per operazioni di scrittura elevate in un singolo blocco fisico orientato alla riga. Accesso ai dati : volumi elevati di operazioni di lettura di piccole dimensioni.


1

Qualsiasi archiviazione di dati per l'applicazione generalmente utilizza il database. Potrebbe essere un database relazionale o nessun database sql che è attualmente di tendenza.

Il data warehouse è anche un database. Siamo in grado di chiamare il database del data warehouse come archivio dati specializzato ai fini di report analitici per l'azienda. Questi dati utilizzati per le decisioni aziendali chiave.

I dati organizzati aiutano a segnalare e prendere decisioni aziendali in modo efficace.


1

Banca dati:

Utilizzato per l'elaborazione transazionale online (OLTP).

  • Transaction-oriented.
  • Orientato all'applicazione.
  • Dati attuali.
  • Dati dettagliati.
  • Dati scalabili
  • Molti utenti, amministratori / operativi.
  • Tempo di esecuzione: breve.

Data Warehouse:

Utilizzato per l'elaborazione analitica online (OLAP).

  • Analisi orientata
  • Orientamento al soggetto.
  • Dati storici.
  • Dati aggregati.
  • Dati statici.
  • Non molti utenti, manager.
  • Tempo di esecuzione: lungo.

1

Un Data Warehousing (DW) è un processo per la raccolta e la gestione di dati da varie fonti per fornire approfondimenti aziendali significativi. Un data warehouse viene in genere utilizzato per connettere e analizzare dati aziendali da fonti eterogenee. Il data warehouse è il nucleo del sistema di BI che è stato creato per l'analisi e il reporting dei dati.


0

L'origine del data warehouse può essere un cluster di database, poiché i database vengono utilizzati per il processo di transazione online come la conservazione dei record correnti ... ma nel data warehouse memorizza i dati storici relativi al processo analitico online.


0

Un data warehouse è un tipo di struttura dati generalmente ospitato in un database. Il Data Warehouse fa riferimento al modello di dati e al tipo di dati ivi archiviati: dati modellati (modello di dati) per servire uno scopo analitico.

Un database può essere classificato come qualsiasi struttura che contiene dati. Tradizionalmente sarebbe un RDBMS come Oracle, SQL Server o MySQL. Tuttavia, un database può anche essere un database NoSQL come Apache Cassandra o un MPP colonnare come AWS RedShift.

Vedete che un database è semplicemente un posto dove archiviare i dati; un data warehouse è un modo specifico per archiviare i dati e serve uno scopo specifico, che è quello di servire query analitiche.

OLTP vs OLAP non ti dice la differenza tra un DW e un Database, sia OLTP che OLAP risiedono sui database. Memorizzano semplicemente i dati in modo diverso (diverse metodologie di modelli di dati) e servono a scopi diversi (OLTP: registra le transazioni, ottimizzato per gli aggiornamenti; OLAP: analizza le informazioni, ottimizzato per le letture).


-1

Vedi in parole semplici: Dataware -> Enormi dati usando per Analitica / archiviazione / copia e analisi. Database -> Operazione CRUD con dati utilizzati di frequente.

La casa del dataware è il tipo di archiviazione che non si utilizza quotidianamente e il database è qualcosa che si gestisce frequentemente.

Per esempio. Se chiediamo l'estratto conto della banca, ci dà per gli ultimi 3/4/6 / più mesi perché è nel database. Se vuoi più di questo, memorizza su Dataware house.


-1

Esempio: una casa vale $100,000ed è apprezzata $1000ogni anno.

Per tenere traccia del valore attuale della casa, è necessario utilizzare un database poiché il valore cambierebbe ogni anno.

Tre anni dopo, sarai in grado di vedere il valore della casa che è $103,000.

Per tenere traccia del valore storico della casa, è necessario utilizzare un data warehouse come dovrebbe essere il valore della casa

$100,000 on year 0, 
$101,000 on year 1, 
$102,000 on year 2, 
$103,000 on year 3. 
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.