Qual è il ruolo dell'MDS nelle statistiche moderne?


18

Di recente mi sono imbattuto in un ridimensionamento multidimensionale. Sto cercando di capire meglio questo strumento e il suo ruolo nelle statistiche moderne. Quindi, ecco alcune domande guida:

  • A quali domande risponde?
  • Quali ricercatori sono spesso interessati a usarlo?
  • Esistono altre tecniche statistiche che svolgono funzioni simili?
  • Quale teoria si sviluppa attorno ad essa?
  • In che modo "MDS" si riferisce a "SSA"?

Mi scuso in anticipo per aver posto una domanda così mista / non organizzata, ma lo è anche la natura della mia fase attuale in questo campo.


7
Le illustrazioni altrove su SE si rivolgono ai primi due punti elenco : gis.stackexchange.com/a/20428 ; gis.stackexchange.com/a/15567
whuber

Risposte:


24

Nel caso accetti una risposta concisa ...

A quali domande risponde? Mappatura visiva delle differenze di coppia nello spazio euclideo (principalmente) di bassa dimensionalità.

Quali ricercatori sono spesso interessati a usarlo? Tutti coloro che mirano a mostrare gruppi di punti o ad avere una visione delle possibili dimensioni latenti lungo le quali i punti si differenziano. O chi vuole semplicemente trasformare una matrice di prossimità in dati variabili con punti X.

Esistono altre tecniche statistiche che svolgono funzioni simili? PCA (lineare, non lineare), analisi delle corrispondenze, spiegamento multidimensionale (una versione di MDS per matrici rettangolari). Sono correlati in diversi modi all'MDS ma raramente sono visti come sostituti di esso. (PCA e CA lineari sono operazioni di riduzione dello spazio di algebra lineare strettamente correlate rispettivamente su matrici quadrate e rettangolari. MDS e MDU sono algoritmi iterativi simili generalmente non lineari di adattamento dello spazio su matrici quadrate e rettangolari, rispettivamente.)

Quale teoria si sviluppa attorno ad essa? Matrice di differenze rilevate si trasforma in disparità in modo tale da minimizzare l'errore di mappare le disparità mediante distanze euclidee in spazio dimensionale: . La trasformazione può essere richiesta lineare (MDS metrico) o monotonica (MDS non metrico). potrebbe essere un errore assoluto o un errore al quadrato o un'altra funzione di sollecitazione . È possibile ottenere una mappa per una singola matriceT E D m S T = m D + E E SSTEDmST=mD+EES(MDS classico o semplice) o una mappa per più matrici contemporaneamente con mappa dei pesi aggiuntiva (differenze individuali o MDS ponderato). Esistono anche altre forme come MDS ripetute e MDS generalizzate. Quindi, MDS è una tecnica diversificata.

In che modo "MDS" si riferisce a "SSA"? Informazioni al riguardo sono disponibili sulla pagina Wikipedia di MDS.

Aggiornamento per l'ultimo punto. Questo technote di SPSS lascia l'impressione che SSA sia un caso di dispiegamento multidimensionale (procedura PREFSCAL in SPSS). Quest'ultimo, come ho notato sopra, è l'algo MDS applicato alle matrici rettangolari (anziché quadrate simmetriche).


3
(+1) Bel riassunto! Forrest Young (già citato da @whuber nel suo commento), Yoshio Takane e Jan de Leeuw hanno degli ottimi documenti su MDS.
chl

@chl, grazie: utili articoli sulla pagina di Takane a bizzeffe
ttnphns,

6

@ttnphns ha fornito una buona panoramica. Voglio solo aggiungere un paio di piccole cose. Greenacre ha lavorato molto con l'analisi delle corrispondenze e in che modo è correlato ad altre tecniche statistiche (come MDS, ma anche PCA e altri), potresti dare un'occhiata alle sue cose (ad esempio, questa presentazione potrebbe essere utile). Inoltre, MDS viene in genere utilizzato per creare una trama (sebbene sia possibile estrarre solo alcune informazioni numeriche), e ha scritto un libro di questo tipo generale di trama e lo mette gratuitamente sul web qui(anche se solo un capitolo riguarda i grafici MDS di per sé). Infine, in termini di un uso tipico, viene utilizzato molto comunemente nelle ricerche di mercato e nel posizionamento dei prodotti, dove i ricercatori lo usano in modo descrittivo per capire come i consumatori pensano alle somiglianze tra i diversi prodotti concorrenti; non vuoi che il tuo prodotto sia scarsamente differenziato dal resto.


1
(+1) Comprensione dei biplot , di Gower e coll. è anche un ottimo libro (viene fornito con un pacchetto binario R , solo per Windows), con circa 50 pagine su MDS e biplot non lineari.
chl

2
@chl, grazie per il suggerimento, quel libro sembra interessante.
gung - Ripristina Monica

1

Un ulteriore punto di forza è che puoi utilizzare MDS per analizzare dati per i quali non conosci le variabili o le dimensioni importanti. La procedura standard per questo sarebbe: 1) far classificare, ordinare o identificare direttamente le somiglianze tra gli oggetti; 2) convertire le risposte in matrice di dissomiglianza; 3) applicare MDS e, idealmente, trovare un modello 2 o 3D; 4) sviluppare ipotesi sulle dimensioni che strutturano la mappa.

La mia opinione personale è che ci sono altri strumenti di riduzione della dimensione che di solito sono più adatti a tale obiettivo, ma che ciò che MDS offre è l'opportunità di sviluppare teorie sulle dimensioni che vengono utilizzate per organizzare i giudizi. È importante tenere presente anche il grado di stress (distorsione che deriva dalla riduzione dimensionale) e incorporarlo nel tuo pensiero.

Penso che uno dei migliori libri su MDS sia "Applied Multidimensional Scaling" di Borg, Groenen e Mair (2013).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.