Come descrivere le statistiche in una frase?


27

Quando ho iniziato a studiare le statistiche, procedure come il test t, ANOVA, il chi-quadrato e la regressione lineare sembravano essere creature molto diverse. Ma ora mi rendo conto che queste procedure fanno più o meno la stessa cosa. Allo stesso modo, valori come la varianza, i residui, l'errore standard e la media misurano anche più o meno la stessa cosa.

Quindi ritengo che tutte queste procedure e valori, e in effetti tutte le statistiche, possano essere descritte in una sola frase:

Qual è il valore atteso e qual è la variazione attorno a questo valore?

La parola attesa potrebbe essere sostituita da una di queste parole: ipotizzata, prevista o centrale.

Come descriverebbero le altre statistiche in una frase?


10
@Trynna Questa descrizione è di gran lunga troppo stretto: si caratterizza stima solo punto. È come descrivere la matematica come l'aggiunta e la moltiplicazione di numeri - che potrebbe benissimo essere la prospettiva di qualcuno che ha studiato l'aritmetica per alcuni anni a scuola - ma non è molto simile a ciò che il campo comprende.
whuber

Risposte:


26

Le statistiche forniscono il ragionamento e i metodi per produrre e comprendere i dati.

American Statistical Association


+1 Stavo cercando di trovare un'espressione di qualcosa di molto vicino a questa nozione. Avrei aggiunto qualcosa su come arrivare a conclusioni sulla base di dati, ma non è così sintetico.
Glen_b

3
@Glen Puoi dire che in questa caratterizzazione è stata posta molta riflessione. Mi piace averlo qui da qualche parte sul nostro sito. Questo, e una descrizione altrettanto concisa dell'apprendimento automatico, dovrebbero appartenere alle nostre pagine di aiuto.
whuber

2
Non sono sicuro di essere d'accordo con la citazione (anche se è una bella aspirazione). Come epidemiologo, so di sapere cose sulla progettazione di studi e sulla produzione di dati e inferenze causali intorno a loro, che è al di fuori del genio di molti dei migliori statistici intorno a me. In effetti la fantasia inferenza causale per i grafici causali ricorsivi ha avuto origine in tre campi non denominati statistica (epidemiologia, informatica e sociologia, per come la comprendo). Non sollevando questo in uno spirito bellicoso, ma perché la frase citata descrive gran parte della scienza e non inchioda statistiche di per sé .
Alexis,

3
La descrizione dell'ASA riguarda molto di più le statistiche in quanto dominio della conoscenza e delle attività umane, senza indicare chi potrebbe essere uno "statistico". Fino alla seconda guerra mondiale gli statistici professionisti erano una rarità, ma ciò non significa che le statistiche non fossero applicate in contesti commerciali e accademici. Non penso che una buona definizione delle statistiche possa essere limitata a ciò che fanno gli statistici professionisti.
Silverfish

1
@Alexis Forse c'è qualche difficoltà con il livello di comprensione implicito dalla parola "comprensione", che la definizione ASA lascia piuttosto ambigua nella sua brevità. Un'interpretazione più ampia potrebbe essere troppo complessa. Certamente se includiamo l'interpretazione fisica o sociale sostanziale e i meccanismi sottostanti come parte della "comprensione", allora va oltre le "semplici" statistiche. D'altra parte, non mi è chiaro perché l'inferenza dai dati, causali o meno, non possa rientrare nei domini delle attività scientifiche e statistiche.
Silverfish

13

Le statistiche riguardano fondamentalmente la comprensione della struttura dei dati.

Bill Venables e Brian Ripley, prima frase nel capitolo 1 di Modern Applied Statistics con S


1
Questa è un'interpretazione interessante delle statistiche, sebbene limitata. Le possibili ambiguità sono rivelatrici: uno scienziato informatico comprenderebbe la "struttura nei dati" in modo non statistico. (Venables e Ripley lavorano all'intersezione tra statistica e informatica.)
whuber

@whuber Sono d'accordo con te. Non c'è nulla che suggerisca che V&R intendesse che fosse una descrizione di una frase di tutte le statistiche, ma da quando l'ho letta per la prima volta, ho pensato che fosse una bella descrizione. Interpreto la "struttura nei dati" come "caratteristiche della popolazione da cui è stato prelevato il campione".
mark999

10

Le statistiche forniscono il ragionamento e i metodi per convertire i dati in informazioni significative.



5

Personalmente, mi piace la seguente citazione di Stephen Senn in Dicing with death. Chance, Risk and Health (Cambridge University Press, 2003). Ho messo in evidenza una frase (o due) che, credo, riassumono il suo punto principale, anche se vale la pena leggere l'intero paragrafo.

Le statistiche sono e le statistiche sono.
La statistica, singolare, contrariamente alla percezione popolare, non riguarda in realtà i fatti; si tratta di come sappiamo, o sospettiamo, o crediamo, che qualcosa sia un fatto. Perché conoscere le cose implica contare e misurarle, quindi, è vero, che le statistiche plurali fanno parte della preoccupazione delle statistiche singolari, che è la scienza del ragionamento quantitativo. Questa scienza ha molto più in comune con la filosofia (in particolare l'epistemologia) che non con la contabilità. Gli statistici sono filosofi applicati. I filosofi sostengono quanti angeli possono ballare sulla testa di un ago; gli statistici li contano . O meglio, conta quanti possono probabilmente ballare.La probabilità è il cuore della materia, il cuore di tutta la materia se si può credere ai fisici quantistici. Per quanto riguarda lo statistico, ciò è vero, sia che il mondo sia strettamente deterministico come credeva Einstein o che vi sia un'indeterminatezza residua ineluttabile. Non possiamo prevedere nulla con certezza, ma possiamo prevedere quanto incerti saranno i nostri pronostici, in media. La statistica è la scienza che ci dice come.


5

La statistica è la scienza dell'apprendimento dai dati e della misurazione, del controllo e della comunicazione dell'incertezza.

Marie Davidian e Thomas Louis

Continuano:

; e fornisce quindi la navigazione essenziale per controllare il corso dei progressi scientifici e sociali


Mi piace questa definizione perché individua l'aspetto di "incertezza". La seconda parte è bella perché afferma che le statistiche non esistono solo da sole, ma devono essere viste in un contesto più ampio. Per essere completamente soddisfatto, forse unirei quello con l'ASA a:
Momo

1
La statistica come scienza dell'apprendimento dai dati e misurazione, controllo e comunicazione dell'incertezza fornisce il ragionamento e i metodi per produrre e comprendere i dati.
Momo,

2

Le statistiche sono un kit di metodi e modalità di pensiero che aiutano le persone a trarre conclusioni chiare da informazioni rumorose.


2

Poiché non siamo una creatura divina onnisciente, dobbiamo affrontare l'incertezza e la statistica fornisce metodi per incorporare e riflettere tale incertezza.


2

la statistica è un sottocampo della filosofia che affronta la seguente domanda "come apprendiamo dalle osservazioni" usando rigorosi concetti matematici.

solo una nota a margine che puoi rendere 'una frase' molto lunga, c'è un libro scritto da B. Hrabal che consiste in una lunga frase, vedi: Lezioni di ballo per gli anziani nell'età


2

La statistica è sia la scienza dell'incertezza sia la tecnologia per estrarre informazioni dai dati

David J. Hand


2

La statistica è un insieme di principi logici e metodi matematici per riassumere informazioni quantificate in modi accurati e pertinenti.


1

A parole mie

Statistics is the science of what might be

Questa è una specie di ironia .


1
Se dovessi mascherare la prima parola e chiedere alle persone di riempire lo spazio vuoto, sospetto che le "statistiche" non sarebbero la prima cosa che escogitano - e forse nemmeno la seconda o la terza. "Futurologia", "speculazione", "fantascienza" e forse - avvicinarsi un po 'di più al tuo intento - "previsione" e "previsione" - sarebbero probabilmente scelte popolari. Anche "onirologia" e "apotropaismo" sarebbero possibilità. :-)
whuber

1

Fisher ( 1922 ) ha dato la sua opinione sull'essenza delle statistiche nella seguente citazione (grassetto aggiunto da me per il requisito di una frase ):

Per arrivare a una distinta formulazione di problemi statistici, è necessario definire il compito che lo statistico si pone: brevemente, e nella sua forma più concreta, l'oggetto dei metodi statistici è la riduzione dei dati . Una quantità di dati, che di solito per sua mole è incapace di entrare nella mente, deve essere sostituita da relativamente poche quantità che devono rappresentare adeguatamente il tutto, o che, in altre parole, deve contenere il più possibile, idealmente il tutto , delle informazioni pertinenti contenute nei dati originali.


0

Un one-liner orientato ai risultati (e quindi non proprio descrittivo ) sarebbe, per me,

La statistica è ciò che fa girare il mondo umano, indipendentemente da ciò che fa lo stesso per la Natura.


3
Stai confondendo le statistiche con la politica? O forse con amore?
whuber

@whuber (+1) No. Entrambi prendono la maggior parte delle loro decisioni in base alle statistiche, che se ne rendano conto o meno.
Alecos Papadopoulos,

2
Ora posso vederlo, in un film in uscita, quando il protagonista maschile si inginocchia per proporre: "Baby, sei la mia UMVUE, mi vuoi sposare?" :-) (Usiamo uno stimatore del restringimento e
uniamo i

@whuber (+2) ... questa è la parte "non accorgermene": questo è esattamente ciò che significa il protagonista maschile , anche se non usa la lingua! (Ammetto che qui posso essere colpevole di imperialismo filosofico).
Alecos Papadopoulos,

2
Il tuo background culturale profondamente rispettabile (nella misura in cui il tuo nome e la tua posizione consentono di inferirlo), che si può risalire almeno ai primi sofisti, ti consente un po 'di latitudine in questo senso. :-)
whuber

0

La statistica è uno strumento per modellare la generazione di dati mediante processi incerti e / o probabilistici.


-1

Le statistiche riguardano il torturare i dati abbastanza a lungo fino a quando non confessano qualsiasi cosa tu voglia mostrare.

Sto parafrasando Ronald Coase, vedi link


-1, era inteso come lingua nella guancia?
gung - Ripristina Monica

@gung sì e no, stavo citando Ronald Coase.
Vladislavs Dovgalecs,

3
Basato sulla versione qui , è nella migliore delle ipotesi una parafrasi negativa. Questo non è un buon riassunto di 1 frase di cosa sono le statistiche.
gung - Ripristina Monica

3
@gung bene, l'OP ha chiesto come le diverse persone lo descriverebbero. Sarà sempre il suo punto di vista o opinione. Sarà diverso per persone diverse. OP ha cercato di raccogliere opinioni diverse IMHO.
Vladislavs Dovgalecs,

2
xeon sarebbe una grande gentilezza per Coase modificare la tua risposta per citare e fonte correttamente l'attribuzione.
Alexis,

-2

La statistica è la scienza matematica che ti consente di capire se la differenza tra insiemi di osservazioni è casuale o no.


1
Descrive un sottoinsieme ristretto di ciò che il campo è.
rolando2

Lo vedo diversamente. Alla fine, sia che tu stia conducendo test di ipotesi, modelli di regressione o qualsiasi altra stima, devi sempre misurare se la differenza tra la tua stima rispetto a un modello ingenuo o la differenza di osservazioni sono statisticamente significative o meno. La mia frase cattura l'essenza del significato statistico rispetto alla casualità. Se altri sono d'accordo, puoi darmi qualche voto positivo, quindi il mio commento che è facilmente giustificabile non viene trattato come una semplice risposta sbagliata solo a causa dell'interpretazione soggettiva della ristrettezza di un individuo.
Sympa,

2
si prega di considerare questi tipi di domande a cui si cerca spesso di rispondere utilizzando le statistiche: Qual è la forma di questa distribuzione? Qual è la natura della relazione tra queste 2 variabili? Come possono essere raggruppate queste molte variabili in modo da poter vedere i problemi / temi / argomenti / dimensioni comuni? Come possono essere raggruppati questi molti casi in modo da poter vedere i tipi / profili comuni? Qual è il modo migliore per descrivere questa rete di relazioni con un occhio alla causalità? Cosa cattura l'andamento di questa variabile nel tempo? Qual è il modo migliore per prevedere i valori futuri?
rolando2,

In ognuno di questi casi, la risposta a queste domande ha un forte elemento di significato statistico e se ciò che si sta guardando in qualsiasi forma o forma è diverso rispetto a ciò che potrebbe accadere per pura casualità. Per molti di noi un voto negativo significa una risposta esplicitamente sbagliata. Non vedo come la mia risposta possa essere classificata come tale.
Sympa,

1
Il testo al passaggio del mouse sopra la freccia del downvote indica "questa risposta non è utile." Lo trovo interessante - e quindi non inutile - perché stimola la riflessione, ma non l'ho votato per diversi motivi. La prima è l'affermazione che le statistiche sono una "scienza matematica": ciò si avvicina in modo scomodo al malinteso (specialmente tra alcuni matematici) che le statistiche sono solo una branca della matematica. Il secondo è che sembra caratterizzare solo il test di ipotesi su due campioni, che è una parte molto stretta (sebbene pervasiva) delle statistiche.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.