Qual è la distanza di Mahalanobis e come viene utilizzata nel riconoscimento dei pattern?


11

Qualcuno può spiegarmi il concetto di distanza di Mahalanobis? Ad esempio, qual è la distanza di Mahalanobis tra due punti xey, e soprattutto, come viene interpretata per il riconoscimento di schemi?


3
Che cosa capisci adesso? Hai provato Wikipedia?
gung - Ripristina Monica

2
Molto strettamente correlati: stats.stackexchange.com/questions/62092/… .
whuber

Puoi usare questo link. descrive bene people.revoledu.com/kardi/tutorial/Similarity/…
Zohreh,

Risposte:


13

La distanza di Mahalanobis fornisce un modo per misurare quanto una serie di condizioni sia simile a una serie nota di condizioni. Rappresenta la covarianza tra le variabili.

Viene calcolato come: dove: D 2

D2=(xm)TC1(xm)
D2=Mahalanobis distancex=Vector of datam=Vector of mean values of independent variablesC1=Inverse Covariance matrix of independent variablesT=Indicates vector should be transposed

Questa pagina fornisce una spiegazione dettagliata (con esempi tratti dall'analisi del paesaggio).


1
grazie, la fonte mi ha dato una buona spiegazione per iniziare
ayariga il

5

La distanza di Mahalanobis viene utilizzata per trovare valori anomali in un set di dati. Non so in quale campo ti trovi, ma in psicologia viene utilizzato per identificare casi che non si "adattano" a ciò che è previsto, date le norme per il set di dati. Ad esempio, se il tuo campione è composto da individui con bassi livelli di depressione e hai uno o due individui con livelli molto alti di depressione, avrebbero distanze Mahalanobis che sono maggiori del valore critico atteso. Probabilmente vorrai rimuovere questi casi se sono molto estremi E se ritieni che non si adattino al tuo set di dati. (Utilizzando l'esempio fornito, il campione è composto da individui con bassi livelli di depressione, quindi quelli uno o due individui con alti livelli di depressione non si adattano al resto). L'identificazione dei valori anomali è molto importante perché molte analisi statistiche hanno un "presupposto di normalità", vale a dire un'aspettativa che i tuoi dati siano normalmente distribuiti. I valori anomali possono anche contribuire a dati distorti e per questo motivo dovrebbero essere rimossi. (A meno che non si trasformi l'intera variabile e questo corregga l'inclinazione). Molti programmi statistici come SPSS consentono di calcolare le distanze M e la probabilità associata a ciascun punteggio per identificare i valori anomali. Posso fornirti le istruzioni SPSS, ma non so se stai usando SPSS. (A meno che non si trasformi l'intera variabile e questo corregga l'inclinazione). Molti programmi statistici come SPSS consentono di calcolare le distanze M e la probabilità associata a ciascun punteggio per identificare i valori anomali. Posso fornirti le istruzioni SPSS, ma non so se stai usando SPSS. (A meno che non si trasformi l'intera variabile e questo corregga l'inclinazione). Molti programmi statistici come SPSS consentono di calcolare le distanze M e la probabilità associata a ciascun punteggio per identificare i valori anomali. Posso fornirti le istruzioni SPSS, ma non so se stai usando SPSS.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.