Quando si insegnano le statistiche, utilizzare "normale" o "gaussiano"?


42

Uso principalmente la "distribuzione gaussiana" nel mio libro, ma qualcuno mi ha appena suggerito di passare alla "distribuzione normale". Qualche consenso su quale termine usare per i principianti?

Naturalmente i due termini sono sinonimi , quindi questa non è una domanda sulla sostanza, ma semplicemente una questione di quale termine è più comunemente usato. E ovviamente uso entrambi i termini. Ma quale dovrebbe essere usato principalmente?


1
C'è una sezione di anteprima / capitolo di esempio del tuo libro disponibile da qualche parte? Ne sento parlare bene.
Glen_b,

2
@Glen_b La funzione "Cerca dentro" di amazon.com ti consente di visualizzare l'anteprima del libro. Inoltre, tre capitoli sono disponibili qui: intuitivebiostatistics.com/excerpts
Harvey Motulsky

6
Il problema di "quale termine è più comunemente usato" può essere facilmente risolto, sebbene grossolanamente: una ricerca su Google della distribuzione "gaussiana" ha circa i 2/3 dei risultati di una ricerca di "distribuzione normale". Il rapporto è leggermente diverso su Google Scholar, dove ora la "distribuzione gaussiana" ha la metà dei successi della "distribuzione normale" (ma solo un quarto quando viene escluso "inverso"). Questi risultati suggeriscono che (1) "normale" è più popolare ma (2) "gaussiano" è ampiamente riconosciuto. L'esame dei risultati suggerisce che frasi come "asintoticamente normali" potrebbero richiedere molto tempo per essere sostituite, se mai.
whuber

2
Nell'estensione di @whuber, penso che ci sia anche una differenza tra i campi: "gaussiano" sembra relativamente più predominante nella scienza, mentre "normale" sembra essere il termine normale nelle scienze sociali ...
abaumann

1
Prova "anormale": P
Mehrdad,

Risposte:


47

Anche se tendo a dire "normale" più spesso (dato che è quello che mi è stato insegnato al primo apprendimento), penso che "gaussiano" sia una scelta migliore, a condizione che studenti / lettori abbiano una buona conoscenza di entrambi i termini:

  • Il normale non è particolarmente tipico, quindi il nome stesso è fuorviante. Sicuramente svolge un ruolo importante (non da ultimo a causa del CLT), ma i dati osservati sono molto meno spesso particolarmente vicino a Gaussian di quanto talvolta sia suggerito.

  • La parola (e le parole associate come "normalizzare") hanno diversi significati che possono essere rilevanti nelle statistiche (si consideri ad esempio "base ortonormale"). Se qualcuno dice "Ho normalizzato il mio campione" non posso dire con certezza se si sono trasformati in normalità, calcolati z-score, ridimensionato il vettore in unità di lunghezza, in lunghezza o in un numero di altre possibilità. Se tendiamo a chiamare la distribuzione "gaussiana", almeno la prima opzione viene eliminata e qualcosa di più descrittivo la sostituisce.n

  • Gauss ha almeno un ragionevole grado di reclamo per la distribuzione.


3
+1 per il bit "purché studenti / lettori abbiano una buona conoscenza di entrambi i termini". Penso che sarebbe un disservizio per gli studenti insegnare solo "gaussiano", solo perché "normale" è così diffuso.
Patrick Coulombe,

6
Sono d'accordo che dobbiamo insegnare entrambi. Se iniziassimo da zero e sapessimo ciò che sappiamo ora, non permetteremmo mai che emerga "normale", perché (1) il termine è sovraccarico in alcun modo (2) il normale (gaussiano) non è normale (normale o previsto) di dati. "Gaussian" è l'alternativa più comune, anche se c'è una storia prima di Gauss. ET Jaynes ha suggerito "centrale", che è un'idea sciocca, ma non ha preso piede. (Riconosco gli argomenti che si basano sul teorema del limite centrale.)
Nick Cox,

Per quanto riguarda il punto n. 2, quando si parla di scienza e matematica nel suo insieme, non è necessariamente chiaro se " normale " o " Gauss " siano più comuni. ;-)
cardinale

@cardinal - Sono abbastanza d'accordo con il suggerimento che tende a inclinarsi molto più verso il "gaussiano" in quelle aree - e aggiungerei anche l'ingegneria.
Glen_b,

1
@Glen_b: concordato. (Nel mio modello mentale, includo l'ingegneria sotto l'ombrello generale della scienza, sebbene ciò sia, forse, un po 'al di fuori della norma, ahem,). :-)
cardinale

36

Vorrei usare il gaussiano.

Un problema che le persone devono apprendere dalle statistiche è che usiamo le parole inglesi di tutti i giorni per indicare cose diverse (potenza, significato, distribuzione, ecc.). Nella misura in cui possiamo minimizzare questo, dovremmo. "Normale" ha già un sacco di significati.


2
Peter: sono d'accordo. Ecco perché ho sempre usato "gaussiano". Ma un commento di un recensore sulla nuova (concisa) edizione, ha spinto fortemente "normale".
Harvey Motulsky,

25

N(μ,σ2)NG(μ,σ2)


1
GΓGaussGaussianBernoullibinomialbinomN

N

8
GN(μ,σ2)

1
N(μ,σ2)

10

In tedesco è spesso chiamato Gaußsche Normalverteilung, quindi è quasi impossibile entrare in conflitto facilmente.

Sarebbe appropriato per te combinare gaussiano e normale ?


8
Forse gnormalfunzionerà in inglese!
Dilip Sarwate,

2
@DilipSarwate 𝅘𝅥𝅮 Sono un anormale, un altro anormale 𝅘𝅥𝅮 (mi scuso con i signori. Fiandre e Swann)
Hobbs

9

Secondo l' enciclopedia Wolfram :

Mentre statistici e matematici usano uniformemente il termine "distribuzione normale" per questa distribuzione, i fisici a volte la definiscono una distribuzione gaussiana e, a causa della sua forma svasata curva, gli scienziati sociali lo chiamano "curva a campana".

Concordo sul fatto che "normale" sia più facile da confondere, tuttavia sospetto che i libri statistici di solito utilizzino "normale".


+1 per una risposta descrittiva piuttosto che prescrittiva. In realtà sono d'accordo con le altre risposte che Gaussian è preferibile, non importa quale campo, ma è istruttivo partire dal contesto di ciò che è diffuso nell'uso esistente.
R ..

Per quanto riguarda la frase "curva a campana", la eviterei del tutto in qualsiasi contesto di insegnamento. Ha delle sfumature altamente razziste a causa del famigerato libro con lo stesso nome, e tutti i tuoi studenti che ne sono consapevoli sono probabilmente distratti da esso e associano tutto ciò che stai dicendo con teorie senza senso sulla superiorità razziale piuttosto che avere il soggetto sta da solo.
R ..

@R .. Descrittivo, sì, ma quella descrizione è direttamente contraddetta dalle risposte qui, che indicano che una parte significativa di statistici e matematici usa effettivamente il termine "gaussiano".
David Richerby,

Un altro motivo per non usare il termine "curva a campana" per indicare la (funzione densità della) distribuzione gaussiana / normale è che ci sono molte distribuzioni la cui funzione di densità di probabilità (pdf) assomiglia a una curva a campana. Anche il pdf di una distribuzione di Cauchy sembra una curva a campana!
Mico,

+1 per la spiegazione dei termini relativi in ​​diverse discipline. Grazie!
Entusiasta il

7

Vorrei sottolineare che S. Stigler utilizza la distribuzione Normal / Gauss / Laplace-Gauss per dimostrare la "legge dell'eponimia di Stigler" pubblicata in Statistics on the Table (alcune pagine sono disponibili su books.google ).

Particolarmente interessante e pertinente a questa domanda è che a pag. 287-288 ci sono tabelle sull'uso storico di 'Normal' vs 'Gauss' vs 'Laplace' e sembra che nel corso degli anni l'uso sia passato da 2:15 a favore di normale nel 1816-1884 alle 8:14 (1888-1917) alle 5:17 (1919-1939) alle 9:10 (1947-1976).

Quindi, secondo questo, l'uso di "normale" vs "Gauss" sta diventando più uguale. O se ritieni che la tendenza continuerà, allora "Gauss" batterà "normale" tra 50-100 anni.


5

Una risposta che non ho ancora visto tra tutte le buone risposte:

Uso principalmente "normale" per motivi di familiarità precedente, ma mi piace capitalizzarlo per enfatizzarne il significato tecnico: "... se i dati sono normalmente distribuiti ..." (Non so se ho copiato questa pratica da da qualche altra parte o (ri) inventato me stesso)


5

Quale usare dipende dal livello di statistiche insegnate. Sfortunatamente, la mia esperienza di insegnamento indica che la maggior parte degli studenti universitari non afferra mai completamente il concetto di distribuzione di probabilità. Tuttavia, tutti devono in qualche modo confrontarsi con il CLT e modi di pensare all'incertezza. Per una classe universitaria, Normale è preferibile perché non aggiunge l'ansia di una nuova parola sconosciuta. Per gli studenti laureati il ​​gaussiano è preferito a causa della confusione sopra menzionata sulla normalizzazione e sul contesto storico che essa fornisce. Insegno a una classe di ricerca universitaria che richiede due lezioni di statistica prerequisiti e tutti i libri di laurea che ho visto usato negli ultimi 30 anni hanno usato Normal.


1
"la maggior parte degli studenti universitari non afferra mai completamente il concetto di distribuzione di probabilità" +1
Code-Guru

4

Il nome normalderiva da alcune delle osservazioni secondo cui gli errori si comportano normalmente. Troverai maggiori dettagli qui . Se questo è il motivo per chiamare questa distribuzione una distribuzione normale, può creare nuova confusione come la distribuzione normale per il conteggio degli incidenti poisson. Credo che dovremmo andare avanti e iniziare a chiamarlo Gaussianinvece.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.