Come posso valutare la deviazione standard?


15

Ho raccolto risposte da 85 persone sulla loro capacità di svolgere determinati compiti.

Le risposte sono su una scala Likert a cinque punti:

5 = Molto buono, 4 = Buono, 3 = Medio, 2 = Scarso, 1 = Molto scarso,

Il punteggio medio è 2,8 e la deviazione standard è 0,54.

Capisco cosa significano la deviazione media e standard.

La mia domanda è: quanto è buona (o cattiva) questa deviazione standard?

In altre parole, ci sono delle linee guida che possono aiutare nella valutazione della deviazione standard.


Cosa significherebbe per la SD essere buono o cattivo qui?
gung - Ripristina Monica

7
È piuttosto difficile ottenere una SD così piccola con dati come questo: per una media di 2.8, la SD deve essere almeno . (Anche se 2.8 rappresenta un valore arrotondato, la DS deve comunque superare 0,357.) Una SD di 0,54 implica che non più di due persone avrebbero potuto rispondere con un 5 (con 21 2 e 62 3) e non più di sei avrebbero potuto rispondere con un 1 (con 5 2 e 74 3). Ciò suggerisce che la domanda può fornire informazioni eccezionalmente scarse poiché la scala non discrimina in modo efficace. 0.2×0.8=0.4
whuber

@whuber eccellente dati forsensici! Ma potevo anche immaginare che o avesse una media su domande diverse o che avesse fatto qualcosa di sbagliato nei suoi calcoli. Sembra difficile immaginare che le persone abbiano davvero risposto in modo così uniforme, soprattutto quando si parla delle loro presunte capacità.
Erik,

Risposte:


17

Le deviazioni standard non sono "buone" o "cattive". Sono indicatori della diffusione dei dati. A volte, nelle scale di valutazione, vogliamo un'ampia diffusione perché indica che le nostre domande / valutazioni coprono la gamma del gruppo che stiamo valutando. Altre volte, vogliamo un piccolo sd perché vogliamo che tutti siano "alti".

3+2 . Ma supponiamo che tu abbia dato un test di collocamento più serio per il calcolo (cioè, gli studenti che sono passati andrebbero nel Calcolo I, quelli che non hanno seguito prima i corsi di livello inferiore). Potresti aspettarti un sd più basso (e una media più alta) tra le matricole al MIT che al South Podunk State, dato lo stesso test.

Così. Qual è lo scopo del tuo test? Chi sono nel campione?


2
(+1) Solo per aggiungere un po 'all'osservazione "Le deviazioni standard non sono' buone 'o' cattive '" - avere un predittore con una grande deviazione standard può essere "buono" perché, nella regressione, è inversamente correlato allo standard errore di una stima del coefficiente di regressione. D'altra parte, se ti preoccupi della precisione di una misurazione, una grande deviazione standard è "cattiva". Immagino che l'interesse del poster originale sia più vicino al primo ma non è chiaro.
Macro

10

Risposta breve, va bene e un po 'più in basso di quanto mi sarei aspettato dai dati del sondaggio. Ma probabilmente la storia della tua attività è più nella media o nella top-2-box.

Per le scale discrete della ricerca nelle scienze sociali, in pratica la deviazione standard è una funzione diretta della media. In particolare, ho scoperto, attraverso l'analisi empirica di molti di questi studi, che l'attuale deviazione standard nei sondaggi su scale a 5 punti è del 40% -60% della massima variazione possibile (purtroppo non documentata qui).

Al livello più semplice, considera gli estremi, immagina che la media fosse 5.0. La deviazione standard deve essere zero, poiché l'unico modo per ottenere una media di 5 è che tutti rispondano a 5. Al contrario, se la media era 1,0, anche l'errore standard deve essere 0. Quindi la deviazione standard è definita con precisione in base alla media.

Ora nel mezzo c'è più area grigia. Immagina che le persone possano rispondere a 5.0 o 1.0, ma nulla in mezzo. Quindi la deviazione standard è una funzione precisa della media:

stdev = sqrt ((5-mean) * (mean-1))

La deviazione standard massima per le risposte su qualsiasi scala limitata è metà della larghezza della scala. Qui è sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Ora ovviamente le persone possono rispondere a valori intermedi. Dalle metastudie dei dati dell'indagine nella nostra azienda, trovo che la deviazione standard per le scale numeriche nella pratica sia del 40% -60% del massimo. In particolare

  • 40% per scale di punti al 100%,
  • 50% per scale a 10 punti e
  • 60% per scale a 5 punti e
  • 100% per bilance binarie

Quindi, per il tuo set di dati, mi aspetto una deviazione standard del 60% x 2,0 = 1,2. Hai ottenuto 0,54, che è circa la metà di quanto mi sarei aspettato se i risultati fossero valutazioni autoesplicative. I risultati delle valutazioni delle competenze di batterie di test più complicate sono medie e quindi avrebbero una varianza inferiore?

La vera storia, tuttavia, è probabilmente che l'abilità è così bassa o così alta rispetto ad altri compiti. Riporta le medie o le percentuali top-box tra le competenze e focalizza la tua analisi su questo.


-1

Se i dati sono normalmente distribuiti, è possibile vedere come si trova la popolazione.

  • Il 68% di tutte le persone si trova all'interno di 1 deviazione standard della media ( 2.26 - 3.34):

inserisci qui la descrizione dell'immagine

  • Il 95% di tutte le persone si trova entro 2 deviazioni standard della media ( 1.72 - 3.88):

inserisci qui la descrizione dell'immagine

Ti dice quanto sono "sparsi" i tuoi numeri.


1
Questa risposta non è stata votata perché non è corretta: utilizza una regola empirica approssimativa (come se fosse esatta) nel caso in cui non sia applicabile. La risposta sarebbe vera se sostituita dalle conclusioni della disuguaglianza di Chebyshev (che afferma che almeno il 75% delle osservazioni si trova all'interno di due SD dell'osservazione media; cioè, almeno il 75% delle risposte sono 2 o 3), ma questo non fornirà molte informazioni.
whuber

Inoltre, è vero solo per le popolazioni veramente normalmente distribuite. Da lì, puoi calcolare i numeri in modo arbitrario esattamente valutando l'integrale rispetto al normale pdf con i limiti dati dalla sd intorno alla media. Davvero non utile qui.
Douba,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.