PowerPivot; Ottieni un datadump da SQL rispetto alla creazione di un modello di dati in Excel


0

Ho una tabella SQL che include dati sulle vendite e sui lead insieme a informazioni dettagliate sull'account e un'altra tabella che include solo informazioni dettagliate sull'account.

La mia domanda è se sia più efficiente estrarre solo la cifra delle vendite e l'ID account (escludere le informazioni dettagliate sull'account) e tirare una tabella separata che contiene solo informazioni dettagliate sull'account, quindi creare una relazione in powerpivot usando l'ID account. O è più efficiente / più veloce eseguire il dump di una sola tabella che contiene tutte le informazioni su powerpivot (tutto il lavoro è svolto in SQL).

Innanzitutto, ho pensato che informazioni come gestori degli account, segmenti e nome dell'account sarebbero state duplicate per molti dati di vendita (l'account A potrebbe acquistare più prodotti più volte), avere una tabella separata che contenga solo le informazioni dell'account sarebbe più efficiente. Ma più ci penso, se avessi due tabelle, Excel dovrebbe fare tutto il lavoro al volo invece di lasciare che SQL gestisca tutto il lavoro.

Mi piacerebbe sentire l'opinione degli esperti su questo. Ho bisogno di powerbi / powerpivot per lavorare velocemente, anche se questo significa meno memoria efficiente.

Risposte:


0

Le tabelle separate saranno sicuramente più veloci da aggiornare e analizzare utilizzando le tabelle pivot e saranno anche più compatte (su disco e in memoria).

Tale progettazione apre anche la possibilità di calcoli a livello di account efficienti (se necessari in un secondo momento), ad esempio conteggio distinto di prodotti per account.

Il problema può essere che i set di dati sono spesso sporchi e le chiavi presunte sono spesso inaffidabili - questo problema di solito peggiora con il passare del tempo nella storia. Tali problemi potrebbero farti tornare a una singola tabella in Power Pivot, in modo da poter provare a sfogliare tali problemi utilizzando il codice SQL, Power Query o uno strumento ETL.


Dal punto di vista delle prestazioni (tempi di risposta più rapidi in pivot / Domande e risposte), sarebbe più veloce se i dati si trovassero sulla tabella singola rispetto a quella separata? Non sono troppo preoccupato per la query più veloce (se intendi processo durante l'aggiornamento) poiché la query viene già eseguita di notte.
user2669043

sì scusa sono scivolato nella terminologia SSAS - intendevo "aggiorna" anziché "processo", e intendevo "analizzare usando le tabelle pivot" più che "query". Modificherò la mia risposta.
Mike Honey,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.