Quali sono stati i principali contributi statistici di Ronald Fisher?


13

Richard Dawkins ha descritto Ronald Fisher come "il padre della statistica moderna e del design sperimentale", una linea che è citata nella biografia di Wikipedia di Fisher . E anche Anders Hald lo ha definito "un genio che ha creato quasi da solo le basi della moderna scienza statistica" nel suo libro A History of Mathematical Statistics .

Mi chiedo solo cosa abbia fatto esattamente così le persone gli hanno dato una valutazione così alta?


10
Questo sarebbe un ottimo post per HSM .
Antoni Parellada,

6
@Antoni Penso che ad un certo punto in futuro, poiché HSM continua a crescere e prosperare, HSM potrebbe diventare una casa migliore per le domande sulla storia statistica. Ma esiste una base di competenze così forte sul CV, con molti utenti che hanno un reale interesse per gli aspetti storici, che il CV è probabilmente il posto migliore per ora. (Penso che a lungo termine, CV continuerà probabilmente a essere il posto migliore per le domande di storia più "concettuali".)
Silverfish

3
Non penso che il problema sia la natura potenzialmente "basata sull'opinione". Sono d'accordo con @AntoniParellada: se questa domanda non appartiene al sito History of Science and Mathematics SE, non è chiaro cosa sarebbe. Lo dobbiamo ai nostri colleghi SE per migrare lì. L'inquadratura originale andava perfettamente bene.
gung - Ripristina Monica

3
Sono d'accordo, "bella domanda", ma forse non qui. Il lavoro di Fisher è già stato raccolto in un bel volume. Contributi alle statistiche matematiche che possono essere facilmente ottenuti da qualsiasi negozio di libri usati. Per una recensione di un libro vedi: jstor.org/stable/2332332 Personalmente non sono in grado di aggiungere parole migliori e posso solo fare riferimento a Efron jstor.org/stable/2676745 Ciò che sarebbe davvero interessante e aggiungere informazioni è una visione degli storici. (o filosofi poiché le diverse visioni statistiche sono una domanda concreta e in realtà non la capisco davvero, cioè. Le uso tutte)
Sisto Empirico

7
@MatthewDrury Abbiamo un tag [history] relativamente popolare. Le domande sulla storia sono in argomento sul nostro sito. Se qualcosa è in tema qui, non dovremmo migrare via IMHO anche se è in argomento altrove.
ameba dice di reintegrare Monica il

Risposte:


19

È molto difficile scrivere una risposta alla domanda

Quali sono stati i principali contributi statistici di Ronald Fisher?

dal momento che ci sono già numerose opere eccellenti su questo argomento, create da eccellenti scrittori, tra cui grandi statistici ad esempio:

Questi lavori sono molto difficili da abbinare in poche semplici righe su una scheda di domande e risposte su Internet. Inoltre, non è abbastanza facile cogliere tutte le idee di Fisher, come ha scritto Efron nel suo lavoro su Fisher:

Una difficoltà nel valutare l'importanza delle statistiche dei pescatori è che è difficile dire semplicemente di cosa si tratta. Fisher aveva un numero incredibile di idee importanti e alcune di esse, come l'inferenza sulla randomizzazione e la condizionalità, sono contraddittorie. È un po 'come se in economia Marx, Adam Smith e Keynes risultassero essere la stessa persona.


Fisher è stato un pioniere

Già una semplice, ma molto buona, fonte del contributo di Fisher è Wikipedia. Basta leggere l'articolo sulla storia delle statistiche (o puoi usare qualsiasi altro testo) ti darà un'idea della quantità e dell'importanza dei contributi di Fisher.

Vedrai anche che è stato in parte il tempo, il luogo e la fortuna a rendere Fisher un grande contributo. Fisher fu un importante e influente statistico all'inizio del XX secolo quando furono create le basi di base delle statistiche applicate e il campo era relativamente piccolo (paragonabile al periodo del 18 ° e 19 ° secolo in matematica).

Il primo diario di statistica e il primo dipartimento di statistica di un'università erano appena iniziati quando Fisher entrò sul palco. Prima dell'inizio del 20 ° secolo, c'erano principalmente metodi per fare la regressione e diverse idee sulla distribuzione di termini ed errori residui, usati in campi come l'astronomia.

Concetti di errori di misura e probabilità di risultati. Questo tipo di matematica e logica (più vicina alla matematica pura e ... vista come più nobile e meno condannata dai matematici seri di quel tempo), venne applicata più ampiamente ai campi scelti da Fisher: genetica, evoluzione, biologia, agricoltura . Poiché Fisher, un eccellente matematico, ha fornito importanti contributi a questi primi sviluppi (o può persino essere considerato il principale motore di questi sviluppi), il suo lavoro è stato collocato in una posizione importante nella storia delle statistiche.

Concetti e strumenti di base

Se guardi gli argomenti in un libro introduttivo sulla statistica (in particolare i concetti matematici o inferenza) potresti considerare Fisher come il contributo dominante. È anche Fisher che ha scritto la prima e più influente introduzione ai libri statistici :

  • Metodi statistici per i ricercatori (1925)
  • The Design of Experiments (1935) (usando l'esperimento della tazza di tè per spiegare tra l'altro, randomizzazione, uso di quadrati latini, ipotesi nulla, significato, sensibilità / potere e praticamente tutto; Yates fornisce uno sfondo storico a questo lavoro)

Si noti che le versioni online di questi libri esistono SMRW e parzialmente DE (vedi letture 29 ottobre b) .

Dal 1912 al 1925, Fisher:

  • ha contribuito a migliorare il test del chi quadro (in cui Pearson e altri avevano torto sul numero di gradi di libertà per molti anni),
  • ha fornito un test esatto per calcolare il valore p per la bontà dell'adattamento con un basso numero di osservazioni (che è stato nominato dopo di lui come test esatto di Fisher ),
  • N-1N
  • ha sviluppato l'analisi della varianza e della distribuzione F (che porta anche il suo nome), e
  • (un'altra "piccola" cosa che ha fatto come studente universitario) è stata sviluppare le basi e i concetti per la massima verosimiglianza ( RA Fisher di Aldrich e Making of Maximum Likelihood ).

In modo approssimativo, questo copre la maggior parte degli strumenti inferenziali di base utilizzati dagli attuali testi introduttivi. Mentre svolgeva questo lavoro sulle statistiche, Fisher ha affrontato importanti problemi di genetica che fanno ammirare così tanto le persone come Richard Dawkins.

Terminologia

Fisher ha introdotto molti concetti e termini e ha migliorato il linguaggio statistico. Due domande recenti su questo sito di domande e risposte riguardano Fisher. La domanda sul perché così tante variabili sono quadrate nelle statistiche e perché abbiamo così spesso la norma invece diL2L1 . È Fisher che ha "dimostrato" che la norma è uno stimatore migliore (più efficiente) della norma (ipotizzando una distribuzione gaussiana perfetta, che Fisher ha concordato in seguito non è sempre vera per errori "reali") e ha introdotto i termini derivanti come una "statistica efficiente" e una "statistica sufficiente" mentre lo fa, oltre a introdurre il termine "varianza"L2L1(nel suo articolo del 1920 Un'osservazione matematica dei metodi per determinare l'accuratezza dell'osservazione mediante l'errore medio e l'errore quadratico medio ).

Fondazioni

Nel documento del 1922 Sulle basi matematiche delle statistiche teoriche Fisher fornisce una breve e semplice panoramica dei concetti principali, solo per nominare l'elenco delle definizioni: "centro della posizione", "coerenza", "distribuzione", "efficienza", " stima "," precisione intrinseca "," regioni isostatistiche "," probabilità "," posizione "," ottimale "," ridimensionamento "," specifica "," sufficienza "," validità " . Richiede a uno storico di vedere ciò che Fisher ha contribuito qui nel senso di essere il creatore di concetti, e questo si riferisce anche alla dichiarazione di Efron. È difficile capire cosa sia esattamente il contributo di chi.

In quell'articolo Fisher inizia a menzionare il problema dell'applicazione di termini come "media" e "varianza" sia al valore di distribuzione reale sia al valore stimato.

(Cercherò di evitare di mettere Fisher da qualche parte in una "scuola" come frequentista o bayesiano. Direi che era solo "sufficientemente" pratico per qualsiasi domanda fosse presente).

Concetti avanzati

Nel suo ulteriore lavoro, Fisher ha sviluppato i primi concetti di analisi lineare discriminante :

X=λ1X1+λ2X2+λ3X3+λ4X4

L'uso di misurazioni multiple in problemi tassonomici, 1936

e il concetto di stima per probabilità che Fisher ha esplorato ulteriormente, e ha due concetti che prendono il suo nome, informazioni Fisher e punteggio Fisher . Vedi Teoria della stima statistica, 1925 , Due nuove proprietà della probabilità matematica, 1934 , e La logica dell'inferenza induttiva, 1935 .

Più collegamenti:

  • RA Fisher Guide , di John Aldrich. Una fonte enorme, se non la più grande, con informazioni su Fisher, con molti altri riferimenti.
  • La risposta di Michael Hardy su Mathoverflow su una domanda sui più grandi matematici: /mathpro//a/173374

Scritto da StackExchangeStrike


Grazie @Martijn! Ho esaminato la tua risposta e fatto piccole modifiche qua e là, principalmente per rendere più chiara la formattazione e correggere alcuni errori di battitura. Spero non ti dispiaccia. Sono felice di assegnare la mia generosità a questa risposta; ottimo contributo. È particolarmente bello avere tutti questi riferimenti.
ameba dice di reintegrare Monica il

Niente affatto, grandi modifiche, ecco perché l'ho creato wiki della community. Questa è una grande domanda a cui rispondere. Anche se sono un grande fan di Fisher e ho esaminato molti dei suoi articoli, mi sentivo come se non avrei dovuto rispondere a questa (caricata) domanda.
Sesto Empirico,

Ho pubblicizzato la tua risposta nella nostra chat e ora vedo che è diventata la più votata in questa discussione. Penso che sia meritato.
ameba dice Ripristina Monica il

8

Alcuni concetti che ha inventato: Sufficienza, efficienza, ANOVA, accessibilità, valore p e probabilmente una miriade di altri (soprattutto design di esperimenti).

La funzione di verosimiglianza e quella di mle avevano precursori, ma fu resa popolare da lui.


9
+1 Mentre Fisher dovrebbe certamente ottenere credito in relazione ad esso, il concetto del valore p sembra essere esistito, almeno in modo informale, prima del lavoro di FIsher. Pearson sta chiaramente calcolando i valori p nel suo articolo del 1900 sulla bontà chi del test di adattamento e tratta ciò che calcola (se solo descritto di passaggio), come se fosse ovvio, cosa accettata da fare. Si ha l'impressione che non sia stato visto come un nuovo concetto introdotto in quel documento. Naturalmente si potrebbero dire cose simili di molti concetti ... sono spesso "in giro" per un po 'prima che qualcuno lo formalizzi.
Glen_b

8

Sir Ronald Aylmer Fisher è accreditato per numerosi aspetti del design sperimentale e della moderna teoria e pratica statistica. Alcuni dei suoi contributi più importanti includono test di significatività (Bandyopadhyay e Cherry 2011), stima della massima verosimiglianza (MLE), distribuzioni di permutazione (ricampionamento), sufficienza, teoria dell'ottimalità asintotica (Efron 1998) e componenti di progettazione sperimentale tra cui randomizzazione, replicazione, blocco, confondimento e analisi della varianza (ANOVA). Degna di nota è anche la sua tesi sull'esperimento di Pea Plant di Mendel. Ha affermato che era "troppo bello per essere vero".

Considera di leggere quel documento di Efron (1998), "RA Fisher nel 21 ° secolo". Vorrei citare l'abstract:

Fisher è il singolo personaggio più importante nelle statistiche del 20 ° secolo. Questo discorso esamina la sua influenza sul pensiero statistico moderno, cercando di prevedere come possiamo aspettarci i pescatori del 21 ° secolo. La filosofia di Fisher si caratterizza come una serie di accorti compromessi tra i punti di vista bayesiano e frequentista, arricchiti da alcune caratteristiche uniche che sono particolarmente utili nei problemi applicati. Numerosi argomenti di ricerca attuali vengono esaminati tenendo conto dell'influenza dei pescatori, o della sua mancanza, e di ciò che ciò presume per i futuri sviluppi statistici. Basato sulla conferenza di Fisher del 1996, l'articolo segue da vicino il testo di quel discorso.

Riferimenti

  • Bandyopadhyay, Prasanta S. e Steve Cherry. "Probabilità elementare e statistica: un primer." Philosophy of Statistics 7 (2011): 53.

  • Efron, Bradley. " RA Fisher nel 21 ° secolo ." Statistical Science (1998): 95-114.


1
La sua versione del test di significatività era l'inferenza fiduciaria che è stata controversa e non accettata come la teoria di Neyman-Pearson. Altri contributi furono monumentali e parte della fondazione delle statistiche.
Michael R. Chernick,

3
Bene, l'inferenza fiduciaria sembra trovare alcuni fan ora. Noto che nessuno ha ancora menzionato Fisher Information, né utili linee guida come "Analizzi come randomizza".
Björn,

Bjorn - sì, sicuramente ho perso la parte Informazioni Fisher. Probabilmente perché ho copiato questo testo da un documento che sto scrivendo riguardo a: informazioni sui pescatori. Ha!
Jessica Burnett,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.