Può essere inutile combattere i mutamenti del linguaggio. Ma
parametro non significa variabile
Nelle statistiche classiche, che in questo caso inizia proprio con RA Fisher, che per primo ha usato il termine con questo significato, un parametro è una costante sconosciuta da stimare, diciamo una media o correlazione della popolazione. In matematica, ci sono significati correlati ma non identici, come quando una curva è data in modo parametrico. In molte scienze, parametro è solo un'altra parola per una misura (essa stessa un termine denso di significato matematico), proprietà o variabile, diciamo lunghezza o conduttività o porosità o virtù, a seconda dei casi. Naturalmente, la lunghezza o la virtù di un individuo è sconosciuta prima che venga misurata. ma le persone con mentalità statistica possono essere confuse dal suo uso per una serie di tali misurazioni. Nel linguaggio ordinario o volgare, i parametri(quasi sempre plurale) spesso significano i limiti di qualcosa, diciamo una relazione personale o una politica politica, forse derivante da una confusione originale con il perimetro . Con un'alta probabilità precedente si presume che i bayesiani parleranno da soli con i propri usi (cenno di ringraziamento a @conjugateprior).
inclinato non significa distorto
Per un secolo o più, l'asimmetria ha avuto uno specifico senso statistico di riferirsi all'asimmetria delle distribuzioni, sia valutata graficamente, misurata numericamente o presunta teoricamente come una questione di fede o di speranza. Per molto più tempo, o almeno così si può immaginare, la distorsione ha significato in media sbagliare, che - fintanto che conosciamo la verità, che significa un valore vero o corretto - può essere quantificato come errore sistematico. Inclinato nel linguaggio ordinario ha il senso comune di essere deformato o distorto, e quindi di essere scorretto, sbagliato e quindi anche di parte. Quel senso (per quanto ho notato, solo di recente) ha iniziato a filtrare di nuovo in discussioni statistiche, in modo che il significato originale di asimmetria rischia di essere offuscato o sommerso.
correlazione non significa accordo
La correlazione ha attratto diversi sensi precisi nelle statistiche, che hanno in comune un'idea di una relazione bivariata perfetta in un certo senso preciso: i casi principali sono relazioni lineari e monotone. Spesso è diluito, anche nelle discussioni statistiche, per significare quasi ogni tipo di relazione o associazione. Ciò che la correlazione non significa, necessariamente, è accordo: quindi y= a + b x implica la correlazione di Pearson di 1 o - 1 fintanto che b ≠ 0 , ma l'accordo y= x richiede la condizione molto rigorosa a = 0 , b = 1 .
unico non significa distinto
È abbastanza comune parlare dei valori distinti dei dati come unici , ma unico è idealmente ancora meglio conservato poiché il significato si presenta una sola volta. La mia ipotesi è che parte della colpa derivi dall'utilità Unix [sic] uniq
e dai suoi imitatori, che riducono i possibili valori ripetuti a un insieme in cui ogni valore è davvero unico. L'utilizzo, in questa ipotesi, unisce l'input e l'output di un programma. (Al contrario, se parliamo di duplicati nei dati, raramente ci limitiamo a doppietti che si verificano esattamente due volte. Il termine si replicaavrebbe più senso dal punto di vista linguistico ma è stato prevenuto per la deliberata replica dei controlli negli esperimenti; i valori di risposta risultanti di solito non sono affatto identici, il che è molto importante.)
i campioni vengono ripetuti raramente
In statistica, un campione include diversi valori e il campionamento ripetuto è un'alta virtù teorica, ma uno raramente praticato, tranne che per simulazione, che è il nostro termine abituale per qualsiasi tipo di falsificazione in silico . In molte scienze, un campione è un singolo oggetto, costituito da un nodulo, un pezzo o un ciuffo di acqua, suolo, sedimenti, roccia, sangue, tessuti o altre sostanze che variano dall'attraente al benigno al disgustoso; lungi dall'essere eccezionale, prelevare molti campioni può essere essenziale per qualsiasi analisi seria. Qui la terminologia di ogni campo ha perfettamente senso per la sua gente, ma a volte è necessaria la traduzione.
l'errore di solito non significa errore; come ha sottolineato Harold Jeffreys, il senso primario è irregolare, non errato.
Tuttavia, dovremmo diffidare dei nostri peccati o stranezze della terminologia:
la regressione non sta andando indietro
stazionario non significa immobile o fisso
la fiducia non ha nulla a che fare con lo stato mentale o psicologico di nessuno
il significato ha solo qualche volta il suo significato quotidiano
esatto è spesso un termine onorifico, riferito a una soluzione o calcolo convenientemente trattabile piuttosto che a uno appropriato al problema
le distribuzioni distorte a destra sembrano distorte a sinistra e viceversa
il lognormale è così chiamato perché è una normale esponenziale
ma il lognormale è più normale del normale
il gaussiano fu scoperto da De Moivre
Poisson non scoprì il Poisson , e tanto meno la regressione di Poisson
il bootstrap non ti aiuterà con le tue calzature
il coltellino non taglia
la curtosi non è una condizione medica
le trame stelo-foglia non si riferiscono alle piante
una variabile fittizia è utile, non inutile o stupida
chi sulla Terra (o altrove) pensa che l' eteroscedasticità sia davvero un termine preferibile rispetto alla variabilità disuguale ?
robusto ora ha almeno due importanti significati tecnici per diversi gruppi, nessuno dei quali ne impedisce l'uso frequente, anche nelle discussioni tecniche, per indicare semplicemente qualcosa come "asserito di comportarsi bene"
IV ora ha almeno due significati principali per diversi gruppi
Il fattore ora ha almeno due significati principali per diversi gruppi
normalizzare e standardizzare hanno innumerevoli significati (abbiamo davvero bisogno di standardizzare lì)
rispetto a descrivere un grafico significa variabile verticale contro variabile orizzontale , a meno che non significhi il contrario
e (ultimo ma non meno importante, coniare una frase) le statistiche hanno almeno tre significati principali.
Appunti:
Nonostante le apparenze contrarie, penso che questa sia una domanda buona e seria.
Spostamento delle mode. Ben nel ventesimo secolo, sembra che molte persone (nessun nome, nessun trapano, ma Karl Pearson potesse essere menzionato) non potevano che inventare termini raggiungendo i loro dizionari greci e latini. (Sarebbe ingiusto non dargli credito per il diagramma a dispersione .) Ma RA Fisher ha dirottato molte parole inglesi preesistenti, tra cui varianza , sufficienza , efficienza e probabilità . Più di recente, JW Tukey è stato un maestro nell'uso di termini casalinghi, ma pochi dovrebbero provare angoscia per il fatto che gli schizzi e i malumori non prendano piede .
Un commento si basa sul ricordo di "La vita è [...] moltiplicativa anziché additiva: la distribuzione normale del registro è più normale della normale." Anon. 1962. Regole di lavoro di Bloggins. In Good, IJ (Ed.) Lo scienziato ipotizza: un'antologia di idee parzialmente cotte. Londra: Heinemann, 212-213 (citazione a p.213).