Quale algoritmo di apprendimento automatico può essere utilizzato per prevedere il mercato azionario?


15

In alternativa, per prevedere i mercati dei cambi. So che questo può diventare piuttosto complicato, quindi come introduzione, sto cercando un semplice algoritmo di previsione con una certa precisione.

(È per un progetto universitario di M.Sc. che dura quattro mesi)

Ho letto che una rete neurale multistrato potrebbe essere utile. Qualche idea su questo? Inoltre, l'analisi semantica dei social media può fornire informazioni sul comportamento del mercato che influenza il mercato azionario. Tuttavia, al momento l'analisi semantica è un po 'al di fuori dell'ambito del progetto.


15
Mio, ma per ovvie ragioni lo tengo tutto per me!
babelproofreader

7
Se si crede all'ipotesi di un mercato efficiente, è impossibile ottenere costantemente rendimenti di mercato superiori alla media (senza conoscenza di informazioni privilegiate), che è integrato nei tassi / prezzi attuali. Molte persone non sono d'accordo con questo, ma quasi tutti concordano sul fatto che è vero per un investitore occasionale. In altre parole, un modello a 3 linee basato su rand () è probabilmente buono quasi quanto l'investitore tipico: P
rm999

5
Sembra improbabile che qualcuno sia disposto a condividere un algoritmo con una precisione fuori campione. Tranne, forse, alcuni lavori accademici pubblicati in cui l'anomalia è piccola e non copre i costi di transazione.
NPE,

2
Per il lavoro accademico, potrebbe essere più utile modellare i prezzi piuttosto che cercare di prevederlo. La previsione si rivelerà probabilmente non riuscita, ma la modellistica potrebbe almeno fornire alcune informazioni su come funzionano effettivamente le cose e teoricamente potrebbe essere estesa alla previsione.
highBandWidth

2
@wayne Non penso che si tratti di overfitting, si tratta di consentire predittori che non possono essere utilizzati per le previsioni, ad esempio le variabili che si verificano durante / dopo i movimenti delle scorte - se trovi che apple e microsoft stock tendono a correlarsi, questo fatto non può essere usato per prevedere stock msft ma può essere molto informativo.
rm999

Risposte:


17

Come menzionato babelproofreader , quelli che hanno un algoritmo di successo tendono ad essere molto riservati. Pertanto, è improbabile che qualsiasi algoritmo ampiamente disponibile sia molto utile pronto all'uso a meno che tu non stia facendo qualcosa di intelligente con esso (a quel punto smette di essere ampiamente disponibile da quando lo stai aggiungendo).

Detto questo, l'apprendimento dei modelli di media mobile integer (ARIMA) autoregressiva potrebbe essere un utile inizio per la previsione dei dati delle serie temporali. Non aspettarti risultati migliori di quelli casuali.


5
+1: Quante volte ho letto o sono stato in una classe e ho sentito persone che credevano che se avessero un algoritmo abbastanza complicato, potrebbero diventare ricchi nei mercati azionari / elettricità / materie prime. Si tenta di spiegare il sovradimensionamento, ecc., Ma senza risultati. Cavolo, per quanto ne so, non essendo un addetto ai lavori, il successo del software di trading azionario non è dipeso da commissioni di transazione, arbitraggio e alta velocità. L'avanguardia è ora quella di utilizzare le lacune nelle regole di trading automatizzato e la proposta / ritiro delle offerte ad alta velocità per succhiare a pugni altri trader automatizzati.
Wayne,

1
L'altro problema è quello in cui più persone finiscono con lo stesso algoritmo perché hanno fatto la loro formazione esattamente sugli stessi dati, quindi hanno messo a volume vendite / acquisti. Ci si aspetta che un algoritmo abbia una precisione a lungo termine?
Michelle,

@Wayne ci sono strategie per ridurre il sovra-adattamento, sebbene siano difficili da implementare su dati di serie temporali.
Zach,

1
@Zach: sì, ci sono modi per penalizzare l'eccessivo adattamento, ma è l'atteggiamento su cui sto riflettendo: le persone che hanno fatto un adattamento di base (probabilmente errato) alla curva in Excel e sentono che avrebbero potuto guadagnare con la loro salsa segreta , ma ciò di cui hanno davvero bisogno è uno di quegli algoritmi all'avanguardia e sofisticati che il professore non condividerà con la classe. Quell'algoritmo si adatterebbe ai dati come un guanto, e quindi predirebbe molto meglio di tutti quegli altri speculatori che usano fogli di calcolo Excel ... ma il professore continua a concentrarsi su overfitting e limiti dei dati. Sospiro.
Wayne,

12

Penso che per i tuoi scopi, dovresti scegliere un algoritmo di apprendimento automatico che trovi interessante e provarlo.

Per quanto riguarda la teoria efficiente del mercato, i mercati non sono efficienti, in qualsiasi scala temporale. Inoltre, alcune persone (sia nel mondo accademico che in quello della vita reale) sono motivate dalla sfida intellettuale, non solo per arricchirsi rapidamente, e pubblicano risultati interessanti (e considero un risultato fallito come interessante). Ma tratta tutto ciò che leggi con un pizzico di sale; se i risultati sono davvero buoni, forse il loro metodo scientifico non lo è.

Data mining con R potrebbe essere un libro utile per te; è costoso, quindi prova a trovarlo nella tua biblioteca universitaria. Il capitolo 2 tratta esattamente quello che vuoi fare e ottiene i migliori risultati con una rete neurale. Ma tieni presente che ottiene scarsi risultati e impiega molto tempo in CPU per ottenerli. Le recensioni di Amazon sottolineano che il libro costa $ 20 in più perché quel capitolo menziona la parola finanza ; durante la lettura ho avuto l'impressione che l'editore lo avesse spinto a scriverlo. Ha fatto i compiti, ha letto i documenti, ha esaminato le giuste mailing list, ma il suo cuore non c'era. Ho avuto alcune utili conoscenze R da esso, ma non batterò il mercato con esso :-)


@Darren - Mi piace il tuo stile.
rolando2,

1
Una bozza (maggio 2003) di Data Mining con R è disponibile qui . (Non ho il libro, quindi non posso dire quale sia il divario tra le due versioni.)
chl

@chi Grazie! Ho dato una rapida occhiata e solo due dei quattro capitoli sono lì. Ma la differenza più grande è che il capitolo sulla previsione dei rendimenti del mercato azionario è molto diverso. Nessuna menzione di xts o quantmod e invece usando il pacchetto ts e usando acf e il pacchetto MARS per le previsioni. È quasi come un capitolo bonus, e ho intenzione di trovare il tempo di leggerlo correttamente. Sta ancora usando le reti neurali, ma non le confronta con le SVM come nel libro pubblicato.
Darren Cook,

10

A mio avviso, qualsiasi forte intelligenza artificiale che potrebbe fare tutto quanto segue potrebbe facilmente produrre una previsione statisticamente significativa:

  • Raccogli e capisci le voci

  • Accedi e interpreta tutte le conoscenze del governo

  • Fallo in ogni paese rilevante

  • Fai previsioni pertinenti su:

    • Condizioni meteo

    • Attività terroristica

    • Pensieri e sentimenti degli individui

    • Tutto il resto che influisce sul commercio

L'analisi statistica è davvero l'ultima delle tue preoccupazioni.


4

Puoi provare le funzioni auto.arima ed ets in R. Potresti anche avere qualche successo con il pacchetto rugarch , ma non ci sono funzioni esistenti per la selezione automatica dei parametri. Forse potresti ottenere parametri per il modello medio da auto.arima, quindi passarli a rugarche aggiungeregarch(1,1) ?

Ci sono tutti i tipi di blog là fuori che affermano un certo successo nel fare questo. Ecco un sistema che utilizza un modello Arima (e successivamente un modello Garch) e un sistema che utilizza un modello SVM . Troverai molte buone informazioni sul trading FOSS , in particolare se inizi a leggere i blog sul suo blogroll.

Qualunque sia il modello che usi, assicurati di effettuare una convalida incrociata e un benchmark! Sarei molto sorpreso se trovassi un arima, un ets o persino un modello di garch che potrebbe costantemente battere un modello ingenuo fuori campione. Esempi di convalida incrociata di serie storiche sono disponibili qui e qui . Tieni presente che ciò che vuoi DAVVERO prevedere sono i rendimenti, non i prezzi.


2

Conosco un approccio di apprendimento automatico che è attualmente in uso da almeno un hedge fund. numer.ai utilizza un insieme di algoritmi di machine learning forniti dagli utenti per dirigere le azioni del fondo.

In altre parole: un hedge fund offre accesso aperto a una versione crittografata di dati su un paio di centinaia di veicoli di investimento, molto probabilmente azioni. Migliaia di data scientist e simili addestrano tutti i tipi di algoritmi di machine learning su tali dati e caricano i risultati su un quadro di valutazione. I marcatori più alti ottengono una piccola quantità di denaro a seconda dell'accuratezza dei loro risultati e da quanto tempo i loro risultati sono disponibili online.

Le migliori previsioni sono presumibilmente fatte da gruppi di algoritmi.

Quindi molti scienziati forniscono ipotesi qualificate, alcune delle quali sono esse stesse insiemi di ipotesi e l'hedge fund utilizza l'insieme di tutte le ipotesi fornite per dirigere i propri investimenti.

I risultati di questo hedge fund piuttosto interessanti mi hanno insegnato due cose:

  1. Gli ensemble sono spesso visti come un buon modo di fare previsioni sul mercato azionario.
  2. Le buone previsioni richiedono più ensemble di quelli che sono disposto a costruirmi ...

Se vuoi provare, visita: https://numer.ai/ No, NON sono affiliato con loro, molto probabilmente non passerei i miei giorni online se fossi collegato a un hedge fund che impiega migliaia di persone , ma pagando solo quelli che forniscono risultati misurabili :)

La comunità num.ai ha un forum in cui discutono del loro approccio in modo che tu possa imparare dagli altri che stanno cercando di fare lo stesso.

Personalmente penso che chiunque abbia un buon algoritmo lo manterrà molto, molto segreto.


1

Dovresti provare le reti neurali di tipo GMDH. So che alcuni pacchetti commerciali di successo per la previsione del mercato azionario lo stanno usando, ma menzionarlo solo nel profondo della documentazione. In breve, si tratta di una rete neurale iterativa multistrato, quindi sei sulla strada giusta.


0

Penso che i modelli markov nascosti siano popolari nel mercato azionario. La cosa più importante da tenere a mente è che vuoi un algoritmo che preservi l'aspetto temporale dei tuoi dati.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.