Consentitemi di aggiungere il mio 2 ¢, è il mio lavoro ottenere dati validi e puliti per un hedge fund, ho visto molti feed di dati e fornitori di dati storici. Si tratta principalmente di dati azionari statunitensi.
Per cominciare, se hai un po 'di soldi non preoccuparti di scaricare dati da Yahoo, ottieni i dati di fine giornata direttamente dai dati CSI , è qui che Yahoo ottiene i loro dati EOD e AFAIK. Hanno un'API in cui è possibile estrarre i dati in qualsiasi formato desiderato. Penso che l'abbonamento annuale per i dati sia di pochi $ 100 dollari.
Il problema principale con il download di dati da un servizio gratuito è che ottieni solo scorte ancora esistenti, questo si chiama pregiudizio di sopravvivenza e può darti risultati sbagliati se guardi molte scorte, perché includerai solo quelle che lo hanno reso così lontano e non quelli che sono stati eliminati.
Per giocare con alcuni dati intraday esaminerei IQFeed , forniscono diverse API per estrarre dati storici, anche se sono principalmente un equipaggiamento per feed in tempo reale. Ma qui ci sono alcune opzioni, alcuni broker forniscono persino download di dati storici tramite le loro API, quindi scegli il tuo veleno.
MA di solito tutti questi dati non sono molto chiari, una volta che inizi davvero a ripetere i test vedrai che alcune scorte mancano o appaiono come due simboli diversi, o le divisioni di scorte non sono adeguatamente contabilizzate, ecc. E poi ti rendi conto che storico anche i dati sui dividendi sono necessari e quindi inizi a correre in cerchio, mettendo insieme i dati da 100 diverse fonti di dati e così via. Quindi, per iniziare con un feed di dati "sconto", lo farai, ma non appena esegui backtest più completi potresti riscontrare problemi a seconda di ciò che fai. Se guardiamo, diciamo, alle scorte di S&P 500 questo non sarà un problema ma un feed intraday "economico" lo farà.
Ciò che non troverai sono dati intraday gratuiti. Voglio dire che potresti trovare alcuni esempi, sono sicuro che ci siano da qualche parte 5 anni di dati tick tick MSFT in giro, ma questo non ti porterà molto lontano.
Quindi, se hai bisogno di cose reali (libro degli ordini di livello II, tutte le zecche come sono successe in tutti gli scambi) una "conveniente", ma l'opzione eccellente è Nanex . In realtà ti spediranno un disco con terabyte di dati. Se ricordo bene sono circa $ 3k-4K per anno di dati. Ma credetemi, una volta capito quanto sia difficile ottenere buoni dati intraday, non penserete che si tratti di un sacco di soldi.
Non scoraggiarti, ma ottenere buoni dati è difficile, tanto difficile che molti hedge fund e banche spendono centinaia di migliaia di dollari al mese per ottenere dati di cui fidarsi. Ancora una volta, puoi iniziare da qualche parte e poi andare da lì, ma è bello vederlo un po 'nel contesto.
Modifica: la risposta sopra è dalla mia esperienza. Questo articolo di Caltech sui feed di dati disponibili fornirà ulteriori approfondimenti e in particolare raccomanda QuantQuote .