So che non è parametrico si basa sulla mediana invece che sulla media
Quasi nessun test non parametrico in realtà "si basa su" mediane in questo senso. Posso solo pensare a una coppia ... e l'unico che mi aspetto che tu abbia mai sentito parlare sarebbe il test dei segni.
per confrontare ... qualcosa.
Se si affidassero alle mediane, presumibilmente sarebbe confrontare le mediane. Ma - nonostante ciò che un certo numero di fonti tenta di dirti - test come il test di rango firmato, o il Wilcoxon-Mann-Whitney o il Kruskal-Wallis non sono affatto un test delle mediane; se fai alcune ipotesi aggiuntive, puoi considerare il Wilcoxon-Mann-Whitney e il Kruskal-Wallis come test di mediana, ma sotto gli stessi presupposti (purché esistano i mezzi distributivi) potresti considerarli ugualmente come un test di mezzi .
La stima della posizione effettiva rilevante per il test del Rank firmato è la mediana delle medie a coppie all'interno del campione, quella per Wilcoxon-Mann-Whitney (e, di conseguenza, nel Kruskal-Wallis) è la mediana delle differenze a coppie tra i campioni .
Credo anche che si basi su "gradi di libertà?" invece di deviazione standard. Correggimi se sbaglio però.
La maggior parte dei test non parametrici non ha "gradi di libertà", sebbene la distribuzione di molti cambi con la dimensione del campione e si potrebbe considerare che è simile ai gradi di libertà nel senso che le tabelle cambiano con la dimensione del campione. I campioni ovviamente mantengono le loro proprietà e hanno n gradi di libertà in questo senso, ma i gradi di libertà nella distribuzione di una statistica test non sono in genere qualcosa di cui ci occupiamo. Può succedere che tu abbia qualcosa di più simile ai gradi di libertà - per esempio, potresti certamente argomentare che il Kruskal-Wallis ha gradi di libertà sostanzialmente nello stesso senso di un chi-quadrato, ma di solito non viene guardato in quel modo (per esempio, se qualcuno parla dei gradi di libertà di un Kruskal-Wallis, quasi sempre significherà il df
Una buona discussione sui gradi di libertà può essere trovata qui /
Ho fatto delle ricerche abbastanza buone, o almeno così ho pensato, cercando di capire il concetto, quali sono i meccanismi alla base, cosa significano davvero i risultati dei test e / o cosa fare anche con i risultati dei test; tuttavia nessuno sembra mai avventurarsi in quella zona.
Non sono sicuro di cosa intendi con questo.
Potrei suggerire alcuni libri, come Practical Nonparametric Statistics di Conover , e se riesci a ottenerlo, il libro di Neave e Worthington ( Test senza distribuzione ), ma ce ne sono molti altri - Marascuilo & McSweeney, Hollander & Wolfe, o il libro di Daniel per esempio. Ti suggerisco di leggere almeno 3 o 4 di quelli che ti parlano meglio, preferibilmente quelli che spiegano le cose nel modo più diverso possibile (ciò significherebbe almeno leggere un po 'di forse 6 o 7 libri per trovare il 3 adatto).
Per semplicità, atteniamoci al test di Mann Whitney U, che ho notato molto popolare
Lo è, ed è quello che mi ha lasciato perplesso sulla tua affermazione "nessuno sembra mai avventurarsi in quella zona" - molte persone che usano questi test si "avventurano nell'area" di cui stavi parlando.
- e anche apparentemente abusato e abusato
Direi che i test non parametrici sono generalmente sottoutilizzati se non altro (incluso Wilcoxon-Mann-Whitney) - soprattutto i test di permutazione / randomizzazione, anche se non avrei mai contestato che sono frequentemente utilizzati in modo improprio (ma lo sono anche i test parametrici, anche di più).
Diciamo che eseguo un test non parametrico con i miei dati e ottengo questo risultato:
[Omissis]
Conosco altri metodi, ma cosa c'è di diverso qui?
Quali altri metodi intendi? Con cosa vuoi che lo paragoni?
Modifica: menzionerai la regressione più tardi; Presumo quindi che tu abbia familiarità con un test t a due campioni (dal momento che è davvero un caso speciale di regressione).
Secondo le ipotesi per il normale test t a due campioni, l'ipotesi nulla ha che le due popolazioni siano identiche, contro l'alternativa che una delle distribuzioni si è spostata. Se osservi la prima delle due serie di ipotesi per il Wilcoxon-Mann-Whitney qui sotto, la cosa di base che viene testata è quasi identica; è solo che il test t si basa sull'ipotesi che i campioni provengano da identiche distribuzioni normali (a parte il possibile spostamento di posizione). Se l'ipotesi nulla è vera e le ipotesi di accompagnamento sono vere, la statistica test ha una distribuzione t. Se l'ipotesi alternativa è vera, allora la statistica test diventa più probabile che prenda valori che non sembrano coerenti con l'ipotesi nulla ma sembrano coerenti con l'alternativa: ci concentriamo sul più insolito,
La situazione è molto simile con Wilcoxon-Mann-Whitney, ma misura la deviazione dal nulla in modo leggermente diverso. In effetti, quando i presupposti del test t sono veri *, è quasi buono quanto il miglior test possibile (che è il test t).
* (che in pratica non lo è mai, anche se non è tanto un problema come sembra)
In effetti, è possibile considerare Wilcoxon-Mann-Whitney come efficacemente un "test t" eseguito sui ranghi dei dati, sebbene non abbia una distribuzione t; la statistica è una funzione monotonica di una statistica t a due campioni calcolata sui ranghi dei dati, quindi induce lo stesso ordinamento ** sullo spazio campione (ovvero un "test t" sui ranghi - eseguito in modo appropriato - genererebbe gli stessi valori di p di un Wilcoxon-Mann-Whitney), quindi rifiuta esattamente gli stessi casi.
** (rigorosamente, ordinazione parziale, ma lasciamolo da parte)
[Penseresti che il solo utilizzo dei gradi significherebbe gettare via molte informazioni, ma quando i dati sono estratti da popolazioni normali con la stessa varianza, quasi tutte le informazioni sul cambio di posizione sono negli schemi dei ranghi. I valori dei dati effettivi (a seconda del loro grado) aggiungono pochissime informazioni aggiuntive a questo. Se vai più pesante del normale, non passa molto tempo prima che il test Wilcoxon-Mann-Whitney abbia un potere migliore, oltre a mantenere il suo livello di significatività nominale, in modo che le informazioni "extra" sopra i ranghi alla fine diventino non solo non informative ma in alcuni senso, fuorviante. Tuttavia, la coda pesante quasi simmetrica è una situazione rara; ciò che vedi spesso in pratica è l'asimmetria.]
Le idee di base sono abbastanza simili, i valori di p hanno la stessa interpretazione (la probabilità di un risultato come, o più estrema, se l'ipotesi nulla fosse vera) - fino all'interpretazione di uno spostamento di posizione, se si effettua i presupposti necessari (vedere la discussione delle ipotesi verso la fine di questo post).
Se avessi fatto la stessa simulazione dei grafici sopra per il test t, i grafici sarebbero molto simili: la scala sugli assi X e Y sarebbe diversa, ma l'aspetto di base sarebbe simile.
Dovremmo desiderare che il valore p sia inferiore a 0,05?
Non dovresti "volere" nulla lì. L'idea è di scoprire se i campioni sono più diversi (in un senso della posizione) di quanto possa essere spiegato per caso, non "desiderare" un risultato particolare.
Se dico "Puoi andare a vedere che macchina di colore del Raj è per favore?", Se voglio una valutazione imparziale di esso io non voglio che si reca "L'uomo, davvero, davvero spero è blu! E 'solo deve essere blu". Meglio vedere qual è la situazione, piuttosto che entrare in qualche "ho bisogno che sia qualcosa".
Se il livello di significatività scelto è 0,05, respingerai l'ipotesi nulla quando il valore p è inferiore a 0,05. Ma l'incapacità di rifiutare quando si ha una dimensione del campione abbastanza grande da rilevare quasi sempre le dimensioni degli effetti rilevanti è almeno altrettanto interessante, perché afferma che le differenze esistenti sono piccole.
Cosa significa il numero "mann whitley"?
La statistica di Mann-Whitney .
È davvero significativo solo se paragonato alla distribuzione dei valori che può assumere quando l'ipotesi nulla è vera (vedere il diagramma sopra) e ciò dipende da quale delle diverse definizioni particolari potrebbe essere utilizzata da un determinato programma.
C'è qualche utilità per questo?
Di solito non ti interessa il valore esatto in quanto tale, ma dove si trova nella distribuzione nulla (se è più o meno tipico dei valori che dovresti vedere quando l'ipotesi nulla è vera o se è più estrema)
P( X< Y)
Questi dati qui verificano o non verificano che una determinata fonte di dati che ho dovrebbe o non debba essere utilizzata?
Questo test non dice nulla su "una particolare fonte di dati che dovrei o non dovrei usare".
Vedi la mia discussione sui due modi di vedere le ipotesi WMW di seguito.
Ho una discreta esperienza con la regressione e le basi, ma sono molto curioso di questa roba "speciale" non parametrica
Non c'è nulla di particolarmente speciale nei test non parametrici (direi che quelli "standard" sono per molti versi anche più basilari dei test parametrici tipici) - a condizione che tu capisca effettivamente il test delle ipotesi.
Questo è probabilmente un argomento per un'altra domanda, tuttavia.
Esistono due modi principali per esaminare il test di ipotesi di Wilcoxon-Mann-Whitney.
i) Uno è di dire "Sono interessato allo spostamento di posizione - cioè che sotto l'ipotesi nulla, le due popolazioni hanno la stessa distribuzione (continua) , contro l'alternativa che si è" spostati "verso l'alto o verso il basso rispetto al altro"
Wilcoxon-Mann-Whitney funziona molto bene se fai questo assunto (che la tua alternativa è solo un cambio di posizione)
In questo caso, il Wilcoxon-Mann-Whitney in realtà è un test per i mediani ... ma allo stesso modo è un test per i mezzi, o in effetti qualsiasi altra statistica equivalente all'ubicazione (90 ° percentili, per esempio, o mezzi tagliati, o qualsiasi numero di altre cose), poiché sono tutti influenzati allo stesso modo dal cambio di posizione.
La cosa bella di questo è che è molto facilmente interpretabile - ed è facile generare un intervallo di confidenza per questo spostamento di posizione.
Tuttavia, il test di Wilcoxon-Mann-Whitney è sensibile ad altri tipi di differenza rispetto a un cambiamento di posizione.
1212