Mi sono imbattuto nel seguente problema, che riconosco è piuttosto tipico.
Ho alcuni dati di grandi dimensioni, diciamo, alcuni milioni di righe. Eseguo alcune analisi non banali su di esso, ad esempio una query SQL composta da diverse sottoquery. Ottengo alcuni risultati, affermando, ad esempio, che la proprietà X sta aumentando nel tempo.
Ora, ci sono due possibili cose che potrebbero portare a questo:
- X sta davvero aumentando nel tempo
- Ho un bug nella mia analisi
Come posso verificare che sia accaduto il primo, anziché il secondo? Un debugger graduale, anche se esistente, non aiuta, poiché i risultati intermedi possono ancora consistere in milioni di righe.
L'unica cosa a cui potevo pensare era di generare in qualche modo un piccolo set di dati sintetici con la proprietà che volevo testare ed eseguire l'analisi su di esso come test unitario. Ci sono strumenti per farlo? In particolare, ma non limitato a, SQL.