Transizione dall'uso del software statistico alla comprensione delle equazioni matematiche?


12

Contesto:

Sono uno studente di dottorato in psicologia. Come con molti dottorandi in psicologia, so come eseguire varie analisi statistiche utilizzando software statistico, fino a tecniche come PCA, alberi di classificazione e analisi dei cluster. Ma non è davvero soddisfacente perché anche se posso spiegare perché ho fatto un'analisi e cosa significano gli indicatori, non posso spiegare come funziona la tecnica.

Il vero problema è che padroneggiare il software statistico è semplice, ma è limitato. Per apprendere nuove tecniche negli articoli è necessario comprendere come leggere le equazioni matematiche. Al momento non sono riuscito a calcolare autovalori o K-medie. Le equazioni sono come una lingua straniera per me.

Domanda:

  • Esiste una guida completa che aiuta a comprendere le equazioni negli articoli di riviste?

Modificare:

Ho pensato che la domanda sarebbe stata più esplicativa: al di sopra di una certa complessità, la notazione statistica diventa per me incomprensibile; diciamo che vorrei codificare le mie funzioni in R o C ++ per capire una tecnica ma c'è una barriera. Non riesco a trasformare un'equazione in un programma. E davvero: non conosco la situazione nelle scuole di dottorato statunitensi, ma nella mia (Francia), l'unico corso che posso seguire è circa un movimento letterario del XVI secolo ...


@Coronier Siamo spiacenti, dubito che esista una guida completa per la comprensione degli articoli di psicologia che utilizzano modelli statistici. Ma lo sfondo richiesto dovrebbe essere tutto a livello di un master in statistica. Se il tuo programma pagherà per questo, considera di ottenere un MA nelle statistiche. La prossima migliore opzione per i tuoi scopi potrebbe essere quella di riprendere la versione delle statistiche multivariate del dipartimento delle statistiche - di solito forniscono note con lo sfondo matematico per PCA, clustering, alberi, ecc. Avrai bisogno di uno sfondo in algebra lineare e matematica di base statistiche a prescindere.
chiuso il

Si prega di porre domande più specifiche.

4
Sono anche uno studente di dottorato in psicologia e ho fatto la scelta di prendere una quantità significativa di matematica nei miei anni di laurea perché c'erano così tanti dottorati in psicologia che non hanno idea di come sia stato calcolato un PCA (per esempio). La prima cosa che devi fare è farti strada attraverso qualsiasi manuale di algebra lineare decente. Che cos'è un decente algebra lineare da manuale? La bomba di Gilbert Strang è, e ha video lezioni del suo corso di algebra lineare sul sito web del MIT per l'avvio. Puoi persino ottenerli su iTunes.
Phillip Cloud,

1
La domanda è così ampia che non otterrà una risposta soddisfacente in pochi paragrafi. Le statistiche sono come domande: diventa più semplice se si suddivide in più componenti gestibili.
P.

Posso solo essere d'accordo con i commenti sopra. O dovrai concentrarti su un problema particolare, oppure devi prima leggere alcuni libri di testo o dispense online. Un libro di testo decente che copre concetti di base per statistiche multivariate con illustrazioni è Strumenti matematici per l'analisi multivariata applicata , di Carroll e Green (AP, 1997, Rev. Ed.). Un altro è Applied Multivariate Statistics and Mathematical Modeling , di Tinsley e Brown (AP, 2000).
chl

Risposte:


9

Panoramica:

  • La mia impressione è che la tua esperienza sia comune a molti studenti di scienze sociali.
  • Il punto di partenza è una motivazione per imparare.
  • Puoi seguire percorsi di istruzione autodidatta o formali .

Istruzione formale:

Ci sono molte opzioni al riguardo. Potresti considerare un master in statistica o semplicemente prendere alcune materie in un dipartimento di statistica. Tuttavia, probabilmente vorrai verificare di avere il background matematico necessario. A seconda del corso, potresti scoprire che è necessario rivisitare la matematica pre-calcolo e forse alcuni materiali come il calcolo e l'algebra lineare prima di affrontare argomenti statistici matematicamente rigorosi a livello universitario.

Autodidatta

In alternativa, potresti percorrere la strada autodidatta. Ci sono un sacco di buone risorse su Internet. In particolare, leggere e fare esercizi nei libri di testo di matematica è importante, ma probabilmente non sufficiente. È importante ascoltare gli istruttori che parlano di matematica e vederli risolvere i problemi.

È anche importante pensare ai tuoi obiettivi matematici e ai prerequisiti matematici necessari per raggiungere tali obiettivi. Se le equazioni sono come una lingua straniera per te, allora potresti scoprire che devi prima studiare la matematica elementare.

Ho preparato alcune risorse per aiutare le persone che stanno passando dall'uso del software statistico alla comprensione della matematica sottostante.

  • Video : Elenco di video di matematica online gratuiti - Questo post fornisce anche alcune indicazioni su quale sarebbe una sequenza matematica appropriata a partire dal pre-calcolo e lavorando attraverso il calcolo, l'algebra lineare, la probabilità e le statistiche matematiche. Vedi anche questa domanda sui video statistici matematici .
  • Lettura e pronuncia : una delle prime sfide è imparare a pronunciare e leggere equazioni matematiche. Ho scritto due post, uno sulla pronuncia e un altro sui consigli per leggere la matematica per il non matematico .
  • Scrivere - Imparare a scrivere matematica può aiutare a leggere la matematica. Prova ad imparare LaTeX e consulta alcune delle guide sulla matematica in LaTeX
  • Libri : quando si tratta di imparare la matematica, penso che valga la pena investire in alcuni buoni libri di testo. Tuttavia, ci sono un sacco di opzioni online gratis in questi giorni

Grazie, le risorse fornite sono eccezionali. A proposito, il tuo blog è totalmente coinvolgente (sono uno studente I / OP e uso R, è come una rivelazione per me).
Coronier,

@Coronier È bello incontrare un'altra persona che combina R con I / O Psych.
Jeromy Anglim,

3

Ho l'impressione che tu pensi di poter avere un'idea di un'equazione statistica programmandola in R o C ++; non puoi. Per comprendere un'equazione statistica, trova un libro di testo "universitario" con molti problemi di compiti alla fine di ogni capitolo che contiene l'equazione, quindi esegui i compiti alla fine del capitolo che contiene l'equazione.

Ad esempio, per comprendere la PCA è necessaria una buona comprensione dell'algebra lineare e in particolare della scomposizione dei valori singolari. Mentre imparavo l'informatica quantistica attraverso il libro di Michael Nielsen, mi è diventato chiaro che dovevo rivedere l'algebra lineare. Mi sono imbattuto nei video di Gilbert Strang, che sono stati estremamente utili per stabilire una comprensione di base dei concetti. Tuttavia, la sfumatura del materiale non è passata fino a quando non ho trovato un libro di algebra lineare contenente molti problemi di compiti a casa, e quindi ho dovuto farlo.


4
@ schenectady mentre simpatizzo per il tuo punto di vista, almeno per me, il codice R fornisce un ponte che posso usare per migliorare la mia comprensione delle equazioni e della matematica in questione. Detto questo, sono pienamente d'accordo con la necessità di problemi, statistiche e matematica in generale è qualcosa che può essere appreso solo facendo.
richiemorrisroe,

2

Capisco la tua difficoltà poiché ho un problema simile quando provo a fare qualcosa di nuovo in statistica (sono anche uno studente laureato, ma in un campo diverso). Ho trovato molto utile esaminare il codice R per avere un'idea di come viene calcolato qualcosa. Ad esempio, di recente ho imparato a utilizzare il kmeansclustering e ho molte domande di base, sia concettuali che di implementazione. Utilizzando Run'installazione (consiglio R Studio, http://www.rstudio.org/ , ma qualsiasi installazione funziona), basta digitare kmeansnella riga di comando. Ecco un esempio di parte dell'output:

x <- as.matrix(x)
    m <- nrow(x)
    if (missing(centers)) 
        stop("'centers' must be a number or a matrix")
    nmeth <- switch(match.arg(algorithm), `Hartigan-Wong` = 1, 
        Lloyd = 2, Forgy = 2, MacQueen = 3)
    if (length(centers) == 1L) {
        if (centers == 1) 
            nmeth <- 3
        k <- centers
        if (nstart == 1) 
            centers <- x[sample.int(m, k), , drop = FALSE]
        if (nstart >= 2 || any(duplicated(centers))) {
            cn <- unique(x)
            mm <- nrow(cn)
            if (mm < k) 
                stop("more cluster centers than distinct data points.")
            centers <- cn[sample.int(mm, k), , drop = FALSE]
        }
    } 

Non sono sicuro di quanto sia pratico esaminare la fonte ogni volta, ma mi aiuta davvero a farmi un'idea di quello che sta succedendo, supponendo che tu abbia una certa familiarità con la sintassi.

Una domanda precedente che ho posto su StackOverflow mi ha indirizzato in questa direzione, ma mi ha anche utilmente detto che i commenti sul codice sono talvolta inclusi qui .


Più in generale, il Journal of Statistical Software illustra questo legame tra teoria e implementazione, ma spesso tratta argomenti avanzati (che personalmente ho difficoltà a comprendere), ma è utile come esempio.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.