Attualmente sto confrontando due set di dati, che contengono StoreKey/ProductKey
combinazioni uniche .
Il primo set di dati presenta le StoreKey/ProductKey
combinazioni uniche per le vendite tra inizio gennaio 2012 e fine maggio 2014 (risultato = 450.000 righe). Il 2 ° set di dati ha le StoreKey/ProductKey
combinazioni uniche , per le vendite a partire da giugno 2014, fino ad oggi (risultato = 190 K righe).
Sto cercando di trovare le StoreKey/ProductKey
combinazioni che si trovano nel 2 ° set, ma non nel 1 ° set, ovvero nuovi prodotti venduti dall'inizio di giugno.
Fino ad ora, ho scaricato i due set di dati in tabelle temporanee, creato indici per entrambe le tabelle su entrambe le chiavi e usato l' EXCEPT
istruzione per trovare elementi unici.
Qual è il modo più efficiente di confrontare set di dati così grandi? Esiste un modo più efficiente di eseguire questo tipo di confronto di grandi dimensioni?