Perché vengono sempre utilizzate le distribuzioni della media 0 e della deviazione standard 1?


15

Le mie statistiche sono state autodidatta, ma molto materiale che leggo indica un set di dati con 0 medio e deviazione standard di 1.

In tal caso, allora:

  1. Perché media 0 e SD 1 sono una bella proprietà da avere?

  2. Perché una variabile casuale ricavata da questo campione equivale a 0,5? La possibilità di disegnare 0,001 è uguale a 0,5, quindi questa dovrebbe essere una distribuzione piatta ...

  3. Quando le persone parlano di punteggi Z cosa significano realmente qui?

Risposte:


11
  1. All'inizio la risposta più utile è probabilmente che la media di 0 e sd di 1 sono matematicamente convenienti. Se riesci a calcolare le probabilità per una distribuzione con una media di 0 e la deviazione standard di 1, puoi elaborarle per qualsiasi distribuzione simile di punteggi con un'equazione molto semplice.

  2. Non sto seguendo questa domanda. La media di 0 e la deviazione standard di 1 si applicano di solito alla distribuzione normale standard, spesso chiamata curva a campana. Il valore più probabile è la media e diminuisce man mano che ci si allontana. Se hai una distribuzione veramente piatta, allora non c'è valore più probabile di un altro. La tua domanda qui è scarsamente formata. Stavi forse facendo domande sulle lancette delle monete? Cerca la distribuzione binomiale e il teorema del limite centrale.

  3. "significa qui"? Dove? La semplice risposta per i punteggi z è che sono i tuoi punteggi ridimensionati come se la tua media fosse 0 e la deviazione standard fosse 1. Un altro modo di pensarci è che prende un punteggio individuale poiché il numero di deviazioni standard che il punteggio è dal significare. L'equazione sta calcolando la (punteggio - media) / deviazione standard. Le ragioni per cui lo faresti sono abbastanza varie, ma una è che nei corsi di statistica introduttiva hai tabelle di probabilità per diversi punteggi z (vedi risposta 1).

Se avessi cercato prima il punteggio z, anche su Wikipedia, avresti ottenuto risposte piuttosto buone.


Su 2) Credo che la confusione sia ciò che p (X = .01) significa quando X è una variabile casuale continua. Intuitivamente, la probabilità sembra essere zero ovunque perché non vi è alcuna possibilità che X sia esattamente .01. L'interrogante dovrebbe rivedere la definizione di una funzione di densità nel caso continuo, che è definita come la derivata della funzione di densità cumulativa.
Tristan,

7

Per iniziare con ciò di cui stiamo parlando qui è la distribuzione normale standard, una distribuzione normale con una media di 0 e una deviazione standard di 1. La scorciatoia per una variabile che viene distribuita come distribuzione normale standard è Z.

Ecco le mie risposte alle tue domande.

(1) Penso che ci siano due ragioni principali per cui le distribuzioni normali standard sono interessanti. In primo luogo, qualsiasi variabile normalmente distribuita può essere convertita o trasformata in una normale standard sottraendo la sua media da ciascuna osservazione prima di dividere ciascuna osservazione per la deviazione standard. Questa è chiamata trasformazione Z o creazione di punteggi Z. Questo è molto utile soprattutto nei giorni precedenti ai computer.

(Xio-X¯)σX=Z(75-65,6)10.2=0,9215

Il secondo motivo per cui la distribuzione normale standard viene utilizzata frequentemente è dovuto all'interpretazione fornita in termini di punteggi Z. Ogni "osservazione" in una variabile trasformata in Z è il numero di deviazioni standard che l'osservazione originale non trasformata era dalla media. Ciò è particolarmente utile per i test standardizzati in cui le prestazioni grezze o assolute sono meno importanti delle prestazioni relative.

(2) Non ti seguo qui. Penso che potresti essere confuso su cosa intendiamo per funzione di distribuzione cumulativa. Si noti che il valore atteso di una distribuzione normale standard è 0 e questo valore corrisponde al valore di 0,5 sulla funzione di distribuzione cumulativa associata.

(Xio-X¯)σX=Z(75-65,6)10.2=0,9215

1

Dato che hai ricevuto eccellenti spiegazioni da Graham e John, risponderò solo alla tua ultima domanda:

Quando le persone parlano di punteggi Z cosa significano realmente qui?

μσ

Quindi: (65-80) / 5 = -3

Puoi dire che il punteggio z per il voto 65 è -3 ; o in altre parole 3 deviazione standard a sinistra.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.