Qual è la logica, se esiste, per usare Discriminant Analysis (DA) sui risultati di un algoritmo di clustering come k-medie, come lo vedo di volta in volta in letteratura (essenzialmente sul sottotipo clinico dei disturbi mentali)?
Non è generalmente consigliabile verificare le differenze di gruppo sulle variabili utilizzate durante la costruzione del cluster poiché supportano la massimizzazione (risp. Minimizzazione) dell'inerzia tra le classi (resp. All'interno della classe). Quindi, non sono sicuro di apprezzare appieno il valore aggiunto della DA predittiva, a meno che non cerchiamo di incorporare gli individui in uno spazio fattoriale di dimensione inferiore e avere un'idea della "generalizzabilità" di una tale partizione. Ma anche in questo caso, l'analisi dei cluster rimane fondamentalmente uno strumento esplorativo, quindi l'utilizzo dell'appartenenza alla classe calcolata in questo modo per derivare ulteriormente una regola di punteggio sembra strano a prima vista.
Qualche consiglio, idea o puntatore a documenti pertinenti?
R
: cran.r-project.org/web/packages/adegenet/vignettes/…