Un sistema di database ottimizzato per il reporting, in particolare in forma aggregata. Spesso, ma non sempre implementato utilizzando uno schema a stella.
Le topologie dominanti della modellazione di Data Warehouse (Star, Snowflake) sono progettate tenendo conto delle relazioni uno-a-molti. La leggibilità, le prestazioni e la struttura delle query peggiorano gravemente di fronte a una relazione molti-a-molti in questi schemi di modellazione. Quali sono alcuni modi per implementare una relazione molti-a-molti tra dimensioni …
Mi sono reso conto che la mia azienda utilizza un processo ELT (extract-load-transform) invece di utilizzare un processo ETL (extract-transform-load). Quali sono le differenze tra i due approcci e in quali situazioni uno sarebbe "migliore" dell'altro? Sarebbe bello se potessi fornire alcuni esempi.
Sto ottimizzando le prestazioni di un data warehouse utilizzando gli indici. Sono abbastanza nuovo in SQL Server 2014. Microsoft descrive quanto segue: "Consideriamo l'indice columnstore cluster come standard per l'archiviazione di tabelle dei fatti di data warehouse di grandi dimensioni e prevediamo che verrà utilizzato nella maggior parte degli scenari …
Quando si utilizza una tabella temporale con versione del sistema (nuova in SQL Server 2016), quali sono le implicazioni sulla creazione e sulle prestazioni della query quando questa funzionalità viene utilizzata per gestire le dimensioni a modifica lenta in un grande data warehouse relazionale? Ad esempio, supponiamo che io abbia …
Chiuso. Questa domanda è fuori tema . Al momento non accetta risposte. Vuoi migliorare questa domanda? Aggiorna la domanda in modo che sia in argomento per Exchange Stack di amministratori di database. Chiuso 4 anni fa . Mi chiedo che questa domanda non sia già stata posta. Google ha solo …
Di tanto in tanto scarico set di dati disponibili pubblicamente sotto forma di dB di Postgres. Questi set di dati vengono aggiornati / modificati / ampliati nel tempo dall'host del repository. Esiste un comando o uno strumento Postgres (idealmente FOSS) in grado di mostrare le differenze tra un database OLD …
Devo supportare campi e valori dinamici in un grande datawarehouse per l'archiviazione del registro delle richieste API, il mio caso utente è che devo archiviare tutte le stringhe di query delle richieste API e in grado di eseguire query su di esse in futuro (quindi non è solo archiviazione, quindi …
Sulla base della mia analisi, un modello dimensionale completo per il nostro data warehouse richiederà l'estrazione da oltre 200 tabelle di origine. Alcune di queste tabelle verranno estratte come parte di un carico incrementale e altre saranno a pieno carico. Da notare, abbiamo circa 225 database di origine tutti con …
Ho 200 GB di data warehouse in SQL Server. Ho riscontrato tempi di esecuzione molto lenti per alcune query; ad esempio 12 ore per una deletequery semplice con un inner join. Dopo aver fatto qualche ricerca con i piani di esecuzione, ho aggiornato le statistiche delle 2 tabelle coinvolte nella …
Stiamo iniziando a progettare gli elementi costitutivi di un data mart / magazzino e dobbiamo essere in grado di supportare tutti i fusi orari (i nostri clienti provengono da tutto il mondo). Dalla lettura delle discussioni online (e nei libri), una soluzione comune sembra essere quella di avere una dimensione …
Alcune pubblicazioni sulla compressione dei dati di SQL Server che ho letto affermano che il costo di scrittura aumenta a circa quattro volte quello che sarebbe normalmente richiesto. Sembra anche implicare che questo è il principale svantaggio della compressione dei dati, il che implica fortemente che per un database di …
Sono abbastanza nuovo in PostgreSQL, non ho mai fatto una grande distribuzione usando prima. Ma ho una buona esperienza nelle soluzioni aziendali e voglio provare ad applicare alcune delle cose che ho imparato usando PostgreSQL. Ho un sito che è dimensionato per gestire un gran numero di dati e traffico. …
Su Oracle Exadata (11gR2), abbiamo un database relativamente robusto. cpu_count è 24 parallel_server_instances è 2 parallel_threads_per_cpu è 2 Abbiamo osservato, attraverso l'osservazione in Oracle Enterprise Manager (OEM), che le prestazioni sono state terribili a causa delle query eseguite in serie. Per risolvere questo problema, tutte le tabelle, le viste materializzate …
Stiamo cercando di ottimizzare un progetto di data warehouse che supporterà la creazione di report sui dati per molti fusi orari. Ad esempio, potremmo avere un rapporto per un mese di attività (milioni di righe) che deve mostrare l'attività raggruppata per ora del giorno. E, naturalmente, quell'ora del giorno deve …
Sto lavorando a un calcolo "retro della busta" per una configurazione del database di report da 100 TB. Sto cercando pensieri dagli esperti qui. Ambiente proposto: Capacità di memoria ~ 100 TB Tabelle ~ 200, dimensioni che vanno da 1 GB a 5 TB. la dimensione media potrebbe essere compresa …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.