Qualcuno può spiegare come ho 5 anni su questo problema dal libro ESL di Hastie?


9

Sto lavorando al libro ESL di Hastie e sto attraversando un periodo difficile con la domanda 2.3. La domanda è la seguente:

inserisci qui la descrizione dell'immagine

Stiamo considerando una stima del vicino più vicino all'origine e questa distanza equivale alla distanza mediana dall'origine al punto dati più vicino. Non ho idea di dove cominciare in termini di tentativi di derivazione.

So che la maggior parte dei punti di dati sono più vicini al limite dello spazio di campionamento, piuttosto che a qualsiasi altro punto di dati (maledizione della dimensionalità), ma ho problemi a tradurlo nel senso di algebra lineare / probabilità.

Grazie!


4
Cosa significa "ELI5" nel titolo? Se vuoi derivare quell'equazione dovrai iniziare con un modello di probabilità per i punti nella palla: che cos'è quel modello? (Per favore, non richiedere ai tuoi lettori di fare riferimento a un libro o qualche altro sito per capire la tua domanda.)
whuber

3
@whuber Sono d'accordo - Gli acronimi sono un terribile schema di hashing.
Sycorax dice di reintegrare Monica il

14
Hai cinque anni. Tutto merito a te per voler capire ESL, ma dovrai aspettare fino a quando non hai sei anni. È un libro per grandi ragazzi e ragazze.
Nick Cox,

4
Un bambino di cinque anni potrebbe iniziare osservando il caso unidimensionale (p = 1). E una volta che è in mano, prendilo da lì.
Mark L. Stone,

3
Se avremo ELI5 spiegato cosa dire di ESL?
mdewey,

Risposte:


15

Sia distanza dall'origine e sia V 0 [ p ] il volume dell'ipersfera dell'unità in dimensioni p . Quindi il volume contenuto in un'ipersfera di raggio r èrV0[p]pr

V[r]=V0[p]rp

Se lasciamo denotiamo la frazione del volume contenuto in questa ipersfera e definiamo R = r p , alloraP=V[r]/V0[p]R=rp

P[R]=R

Se i punti di dati sono uniformemente distribuiti all'interno della palla unitaria, poi per la formula è una funzione di distribuzione cumulativa (CDF) per R . Ciò equivale a una densità di probabilità uniforme per R nell'intervallo unitario, ovvero p [ R ] = P [ R ] = 1 . Quindi, come suggerito da Mark Stone nei commenti, possiamo ridurre il caso p dimensionale a un problema 1D equivalente.0R1RRp[R]=P'[R]=1p

Ora se abbiamo un singolo punto , allora per definizione di un CDF abbiamo Pr [ R ρ ] = P [ ρ ] e Pr [ R ρ ] = 1 - P [ ρ ] . Se R min è il valore più piccolo tra n punti e tutti i punti sono indipendenti, il CDF per è dato da Pr [ R minρ ] = Pr [ R ρ ]RPr[Rρ]=P[ρ]Pr[Rρ]=1-P[ρ]Rminn (questo è un risultato standard dellateoriaunivariata delvalore estremo).

Pr[Rminρ]=Pr[Rρ]n=(1-ρ)n

Per definizione della mediana, abbiamo che possiamo riscrivere come (1-dp)n=1

12=Pr[(Rmin)medR]=(1-R)n
che equivale al risultato desiderato.
(1-dp)n=12

EDIT: Tentativo di risposta in stile " ELI5 ", in tre parti.

  1. [0,1]12

  2. nn

  3. prrp


1
Ah ah, ho dato il commento che un bambino di 5 anni potrebbe iniziare guardando il caso p = 1. Ho pensato di aggiungere un commento sul fatto che un bambino di 4 anni potrebbe non solo iniziare con il caso p = 1, ma anche n = 1. Ma ho pensato di lasciarlo capire al bambino di 5 anni.
Mark L. Stone,

1
L2p
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.