Come interpretare l'altezza della trama della densità


12

Come dovrei interpretare l'altezza dei grafici della densità:

inserisci qui la descrizione dell'immagine

Ad esempio nel grafico sopra, il picco è a circa 0,07 a x = 18. Posso dedurre che circa il 7% dei valori sono circa 18? Posso essere più specifico di così? C'è anche un secondo picco a x = 30 con altezza di 0,02. Ciò significherebbe che circa il 2% dei valori sono circa 30?

Modifica: la domanda su Può un valore di distribuzione della probabilità superiore a 1 essere OK?discute il valore di probabilità di> 1 che non è affatto un problema qui. Ne discute anche in relazione all'ingegnoso classificatore di Bayes che non è nemmeno il punto qui. Voglio avere, in un linguaggio semplice, le inferenze numeriche che possiamo trarre da tali curve di densità. Viene discusso il ruolo dell'area sotto la curva, ma la mia domanda è in particolare quale inferenza possiamo trarre riguardo una particolare combinazione xey che esiste sulla curva. Ad esempio, come possiamo mettere in relazione x = 30 e y = 0,02 su questo grafico. Quale affermazione possiamo scrivere riguardo alla relazione tra 30 e 0,02 qui. Poiché le densità sono per un valore unitario, possiamo dire che il 2% dei valori si verifica tra 29,5 e 30,5? In tal caso, come interpretiamo se i valori variano solo da 0 a 1, come nel seguente diagramma:

inserisci qui la descrizione dell'immagine

Se il 100% dei valori si verifica tra 0 e 1, perché esiste una curva al di fuori di 0 e 1?

C'è una parte piatta qui da x = 0,1 a x = 0,2 dove y è uguale a 0,8. Forma un rettangolo. Come possiamo scoprire quale percentuale di valori si verifica tra x = 0,1 e x = 0,2

(PS: se trovi questa domanda interessante / importante, ti preghiamo di votarla;)



4
Il primo thread citato come duplicato è rilevante, nonostante la formulazione precisa nel suo titolo, in quanto sottolinea che, come calcolato per variabili continue, una densità di probabilità non è una probabilità. (Una versione più sottile definirebbe la densità rigorosamente e includerebbe la possibilità che la densità sia definita contando la misura.)
Nick Cox,

Sono d'accordo con @NickCox, sebbene con le modifiche extra, c'è più attenzione all'area (che è come la terza domanda) e all'altezza (che è più simile alla seconda domanda) nella lista molto buona di domande strettamente correlate di Tim.
Silverfish,

3
C'è anche un problema separato che non viene sollevato in quelle domande, motivo per cui non penso che questo sia nel complesso un duplicato di nessuna di quelle domande individualmente: perché nei diagrammi empirici rispetto a quelli teorici della densità, può esserci "densità" al di fuori il supporto (o i valori osservati) della distribuzione? Ciò richiede ulteriori discussioni sulla larghezza di banda e sulla costruzione e interpretazione dei grafici della densità del kernel. Forse questa domanda trarrebbe beneficio da una modifica e da una rifocalizzazione su quelle questioni che non duplicano le domande esistenti.
Silverfish,

Risposte:


6

Devi stare attento con le tue parole qui. Supponendo che x sia una variabile continua, la probabilità di ogni singolo valore è precisamente zero. Parlare, come hai fatto tu, della probabilità che un valore si trovi attorno ad un certo punto va bene, anche se potresti voler essere un po 'più preciso. La tua seconda affermazione, in cui hai fornito l'intervallo insieme alla probabilità, è qualcosa che avrei cercato.

In sostanza, un integrale della funzione di densità rispetto a x ti parlerà della probabilità stessa (ecco perché si chiama densità ). Ovviamente, l'intervallo nel quale ti integrerai può essere arbitrariamente piccolo, quindi puoi avvicinarti ad un punto in modo arbitrario. Detto questo, quando la funzione di densità varia molto lentamente in quell'intervallo, è possibile approssimare l'integrale mediante una tecnica numerica, come la regola trapezoidale .

Riassumendo: l'altezza della funzione di densità è proprio questa, la sua altezza. Qualunque cosa tu voglia concludere sulla probabilità dovrà includere l'integrazione di una forma o di un'altra.


l'area sotto la curva si somma sempre a 1,0 in questo tipo di trama?
ecologo1234

1
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.