Introduzione alle statistiche non parametriche


11

Ho studiato statistiche negli ultimi due anni. Quasi tutto quello che ho imparato riguarda le statistiche parametriche. Ora vorrei saperne di più sulle statistiche non parametriche. Qualcuno può suggerire qualche introduzione concisa (forse anche leggibile) in quest'area?

Risposte:


12

Dipende da cosa intendi per "conciso", che tipo di trattamento stai cercando (compresi concetti matematici vs concetti e intuizione), quali tecniche vuoi includere.

Consiglio vivamente di iniziare con i libri e di leggere più di un libro .

Le " Statistiche pratiche non parametriche " di Conover sono buone, e mi piacerebbe sicuramente includerle in qualsiasi elenco.

Le " statistiche non parametriche applicate " di Daniel sono ottime, ragionevolmente complete per le sue dimensioni.

Ho trovato i " test senza distribuzione " di Neave e Worthington molto leggibili quando è uscito per la prima volta (e per molti versi lo sono ancora). Al giorno d'oggi il codice sembra un po 'datato, ma d'altra parte è generalmente abbastanza leggibile da tradurre. Se riesci a trovarlo è una buona introduzione; vale la pena prendere la seconda mano se non la compri nuova.

Ci sono dozzine di buoni libri, alcuni più vecchi dei tre che ho menzionato, altri più recenti; alcuni potrebbero adattarti meglio di tutti quelli che ho menzionato. Vorrei iniziare con una biblioteca universitaria e navigare nelle ricerche con termini come nei titoli sopra e, se possibile, vedere cosa c'è nelle vicinanze.

Leggi alcuni di essi e trova quelli che ti piacciono.

Quando ho fatto la nonparametrica come studente universitario, c'erano qualcosa come otto libri nella lettura consigliata, forse di più. Ognuno di loro aveva qualcosa che mancava alla maggior parte degli altri. Sono contento di aver dato un'occhiata a tutti loro.


4

Se il tuo campo di studio è quello delle scienze leggere (ad es. Psicologia, sociologia, educazione), consiglierei Statistica non parametrica per le scienze comportamentali di Siegel e Castellan (McGraw-Hill Book Company). (Ho la seconda edizione dal 1988). Dalla prefazione:

Una caratteristica distintiva [è] la struttura dettagliata dell'applicazione di ciascuna procedura ai dati effettivi.


2

Ho trovato "Regressione semiparametrica" ​​di Carroll, Wand et al. essere abbastanza leggibile. È obsoleto, ma è una buona cosa iniziare prima di passare al libro conciso, ma denso, di Simon Wood sui GAM.

Entrambi questi libri si concentrano su modelli di regressione spline penalizzati, che non è tutto nelle statistiche non parametriche. Ma probabilmente più utile per le persone applicate.


1
20826: a titolo di spiegazione, nel caso in cui trovi questa risposta un po 'confusa - "non parametrico" può riferirsi non solo alla forma funzionale non specificata (potenzialmente infinita parametrica) per la distribuzione (cioè non specifichi una forma parametrica per ), ma anche per la relazione tra variabili ( ). La risposta di ACD qui si riferisce alla seconda cosa piuttosto che alla prima. In realtà è possibile che il termine "non parametrico" in relazione ai modelli di regressione si applichi a entrambi i problemi, o anche entrambi allo stesso tempo (che tendo a chiamare "doppiamente non parametrico"). E ( Y ) = g ( x )FY(y)E(Y)=g(x)
Glen_b

destra. solo curioso, quali sono alcuni esempi di istanze nel lavoro applicato in cui la prima delle due forme di lavoro non parametrico potrebbe essere utile? o immagino che il bootstrap sia un esempio, giusto?
generic_user

1
ACD, ti consiglio di dare un'occhiata a uno qualsiasi dei libri citati nelle mie risposte. Posso indicare - letteralmente - a molte migliaia di articoli che li applicano a problemi reali, tra cui test di Wilcoxon-Mann-Whitney, test di bontà come il Kolmogorov-Smirnov, misure di correlazione come Kendall e Spearman, regressione di Theil-Sen , Curve di sopravvivenza Kaplan-Meier (e test log-rank), permutazione / randomizzazione (+ altri metodi di ricampionamento) e molte altre cose del genere. Nel complesso, direi che in realtà potrebbe essere applicato un po 'più spesso del senso in cui lo usi. Sì, il bootstrap è incluso.
Glen_b

1
(ctd) ... l'area è abbastanza grande; se lo restringi un po ', probabilmente ti troverò alcune applicazioni particolari.
Glen_b

1
Bene, quindi i suoi test generalmente non si basano su ipotesi distributive. Immagino di chiedermi se si può stimare una distribuzione non parametrica per un modello contemporaneamente alla stima delle relazioni tra variabili (probabilmente con molti dati). Ma, come fai notare, c'è molto da leggere.
generic_user

2

Sono stato sorpreso di non aver menzionato tutte le statistiche non parametriche di Larry Wasserman .

Penso che sia un grande libro di dimensioni relativamente concise. Soprattutto se qualcuno ha già una certa conoscenza delle statistiche parametriche, questo libro offre uno sguardo molto nuovo su " metodi statistici che mirano a mantenere il numero di ipotesi sottostanti il ​​più debole possibile ". L'ho trovato meno prolisso di altri libri introduttivi; questo può essere positivo o negativo a seconda delle preferenze. L'unico "delta" di questo libro è che in realtà non copre i test di rango.


(+1) Sembra che il libro di Wasserman "All of Statistics" contenga anche un trattamento, seppur più breve, delle statistiche non parametriche. Entrambi questi libri, così come molti altri, sono carini, ma IMHO è in qualche modo eccessivo per ricercatori / scienziati applicati. Certo, non farà male conoscere tutti i teoremi e le prove, ma è un "bello avere" piuttosto che un "must have", considerando i limiti di tempo e portata. Devo ancora trovare libri statistici equilibrati per gli scienziati applicati (cioè abbastanza rigorosi senza entrare nei dettagli troppo profondi e utili dal punto di vista dell'applicazione).
Aleksandr Blekh,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.