Sì, ci sono vantaggi significativi nella normalizzazione dei dati se si è disposti a fare il lavoro per raggiungerlo e mantenerlo. I due vantaggi fondamentali della normalizzazione sono:
- Integrità dei dati
- Flessibilità delle query
L'approccio semplice alla normalizzazione è quello di creare una tabella per ogni persona, luogo, cosa, concetto o evento. In questo modo, hai ogni caratteristica di ogni persona, luogo, cosa, concetto o evento che ti interessa in un unico posto nel database. Il vantaggio dell'integrità dei dati si ottiene quando si inseriscono e si aggiornano i dati. Poiché hai normalizzato non hai copie ridondanti della stessa caratteristica in molti punti del database, ognuno con un valore diverso, che devi ricordare di aggiornare e mantenere sincronizzato. In secondo luogo, esiste un solo posto nel database per programmare i controlli quando si inseriscono o si aggiornano i dati per assicurarsi che siano validi. Poiché i tuoi dati provengono da molti fogli di calcolo Excel, la normalizzazione dei dati ti dà l'opportunità di implementare controlli di integrità dei dati sul carico per assicurarti che l'analisi sia basata su dati accurati. Il vantaggio della flessibilità delle query si ottiene quando si desidera leggere e analizzare i dati. Poiché i dati sono stati normalizzati, è possibile connettere le tabelle in modo flessibile in base alla domanda sui dati a cui si desidera rispondere, incluso solo ciò che è necessario per rispondere alla domanda specifica. In secondo luogo, ciò consente al database di restituire le risposte alle tue domande molto più rapidamente rispetto a se dovesse scansionare tutti i dati, inclusi quelli non rilevanti per la tua domanda, nelle tue tabelle non normalizzate. Poiché i dati sono stati normalizzati, è possibile connettere le tabelle in modo flessibile in base alla domanda sui dati a cui si desidera rispondere, incluso solo ciò che è necessario per rispondere alla domanda specifica. In secondo luogo, ciò consente al database di restituire le risposte alle tue domande molto più rapidamente rispetto a se dovesse scansionare tutti i dati, inclusi quelli non rilevanti per la tua domanda, nelle tue tabelle non normalizzate. Poiché i dati sono stati normalizzati, è possibile connettere le tabelle in modo flessibile in base alla domanda sui dati a cui si desidera rispondere, incluso solo ciò che è necessario per rispondere alla domanda specifica. In secondo luogo, ciò consente al database di restituire le risposte alle tue domande molto più rapidamente rispetto a se dovesse scansionare tutti i dati, inclusi quelli non rilevanti per la tua domanda, nelle tue tabelle non normalizzate.
L'accesso è un DBMS semplificato e include un processore SQL di base che consente di scrivere query e sfruttare quindi i vantaggi dei dati normalizzati. Se alla fine passerai a SQL Server, che è un DBMS con funzionalità complete, la normalizzazione dei dati ora faciliterà la transizione e ti consentirà di sfruttare tutte le funzionalità di SQL Server e la sua ricca implementazione di SQL.
Come ho detto all'inizio, per ottenere questi vantaggi devi essere disposto a fare la programmazione iniziale per tradurre i dati provenienti dai tuoi vari dump Excel e mappare le righe e le colonne in quei fogli di calcolo alle tue tabelle normalizzate. Questo non è un esercizio banale ma fattibile usando la programmazione di Access. Un approccio sarebbe quello di creare tabelle che replicano i dati come nell'origine e caricare i dati in essi. Questi sono conosciuti come palcoscenicotabelle. Una volta che hai i dati non normalizzati nelle tabelle di Access, puoi quindi scrivere più facilmente il codice di accesso usando SQL per estrarre i dati da quelle tabelle di stage, normalizzarli, identificare i problemi di qualità dei dati (ad esempio la stessa caratteristica in due diversi dump Excel che dovrebbero avere lo stesso valore, ma non) e caricarlo nelle tabelle normalizzate. Questo è il metodo comune per normalizzare i dati provenienti da una fonte non normalizzata molto comune nei data warehouse basati sull'area tematica.
Troverai che questo ulteriore livello di sforzo ne varrà la pena anche se una volta che avrai dati normalizzati di alta qualità nel tuo database di accesso. Riferisci che i consumatori vedranno che sei un vero professionista dei dati quando mostri loro esempi in cui la qualità dei dati era scarsa e hai scoperto questo fatto in modo che possa essere corretto nelle fonti. Allo stesso modo, quando chiedono un nuovo report che analizza i dati in un modo molto diverso, è possibile creare rapidamente il nuovo report utilizzando SQL per combinare i dati nelle tabelle normalizzate in questo modo molto diverso che inizialmente non era previsto. Saranno molto colpiti dal fatto che tu sia in grado di farlo rapidamente e facilmente!
Spero che questo ti aiuti a spiegare perché la normalizzazione ti sarebbe di beneficio.