I commenti nel codice sembrano finire per definire i due essenzialmente in modo identico (a parte una differenza relativamente piccola nella costante).
c A n- 1 / 5UNc
3.49 s n- 1 / 3nclass.scott
Il 1.059 in quello che il codice chiama la "stima di Scott" si trova nel (precedente) libro di Silverman (vedi p45 del riferimento Silverman al tuo link - la sua derivazione di Scott è a p130-131 del libro a cui si riferiscono). Viene da una stima della teoria normale.
La larghezza di banda ottimale (in termini di errore quadratico medio integrato integrato) è una funzione della derivata del secondo quadrato integrato e 1.059 σ
UNσ
Per ragioni simili a quelle che ho suggerito prima, Silverman continua a suggerire di ridurre 1.059 (in realtà usa 1.06 in tutto, non 1.059 - come fa Scott nel suo libro). Sceglie un valore ridotto che perde normalmente non più del 10% di efficienza su IMSE, da cui proviene lo 0.9.
Quindi entrambe le binwidth si basano sulla binwidth ottimale dell'IMSE al normale, una al massimo, l'altra (circa il 15% più piccola, per ottenere entro il 90% dell'efficienza dell'ottimale al normale). [Chiamerei entrambe le stime "Silverman". Non ho idea del perché chiamino 1.059 quello per Scott.]
Secondo me, entrambi sono troppo grandi. Non utilizzo gli istogrammi per ottenere stime della densità ottimali per IMSE. Se questo (ottenere stime della densità ottimali in senso IMSE) fosse quello che volevo fare, non avrei voluto usare gli istogrammi per quello scopo.
Gli istogrammi dovrebbero presentare errori sul lato più rumoroso (lasciare che l'occhio esegua il necessario smussamento). Quasi sempre raddoppio (o più) il numero predefinito di bin che questi tipi di regole danno. Quindi non userei 1.06 o 0.9, tenderei a usare qualcosa di circa 0,5, forse meno con campioni di dimensioni molto grandi.
C'è davvero molto poco da scegliere tra loro, dal momento che entrambi danno troppi pochi contenitori per essere molto utili per trovare cosa sta succedendo nei dati (su cui, almeno a piccole dimensioni di campione, vedi qui .
[1]: Scott, DW (1979), "Su istogrammi ottimali e basati su dati" , Biometrika , 66 , 605-610.