Strumento per generare grandi set di dati di dati di test [chiuso]


25

Molte volte, quando si tenta di elaborare una progettazione di database efficiente, la migliore linea d'azione è costruire due database di esempio, riempirli di dati ed eseguire alcune query su di essi per vedere quale si comporta meglio.

Esiste uno strumento che genererà (idealmente direttamente nel database) grandi (~ 10.000 record) serie di dati di test relativamente rapidamente? Sto cercando qualcosa che almeno funzioni con MySQL.

Risposte:


12

Lo strumento migliore (se riesci a trovarlo) è DataFactory. (Purtroppo fuori stampa). Ho generato set di dati assolutamente deliziosi (e piuttosto autentici) da esso.

Generatedata.com è ... accettabile, ma non si adatta molto bene.

DataGenerator è qualcosa da tenere d'occhio.

E mentre DTM Data Generator è grosso e un sostituto scadente per DataFactory, esiste e viene venduto, e l'ho usato per generare dati leggermente accettabili.



4

Generalmente genera il mio, usando alcuni dati noti come input - se è troppo casuale, non è sempre un buon test; Ho bisogno di dati che verranno distribuiti in modo simile al mio prodotto finale.

Tutti i database più grandi che devo ottimizzare sono di natura scientifica, quindi di solito posso prendere qualche altra indagine come input, ridimensionarla e aggiungere jitter. (ad esempio, prendendo i dati con una cadenza di 5 minuti con precisione in millisecondi e trasformandoli in una cadenza di 10 secondi con precisione in millisecondi ma un jitter di +/- 100 ms ai tempi)

...

Ma, come altra alternativa, se non vuoi scrivere il tuo, è guardare alcuni degli strumenti di benchmarking - poiché possono ripetere più e più volte le cose sulla base di un set di formazione, puoi usarli per inserire un sacco dei record (e quindi semplicemente ignorare i report sulla velocità con cui è stato eseguito) ... e quindi è possibile utilizzare lo stesso strumento per testare la velocità con cui il database esegue una volta popolato.





1

Il modo più economico è probabilmente quello di utilizzare un generatore di dati commerciale o open source. Lo facevo una volta.

Ora, nei miei anni d'oro, considero ogni necessità di dati di test come un mandato per imparare un altro linguaggio di scripting.


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.