Sto esaminando l'uso del test di significatività statistica (SST) per convalidare i risultati dell'analisi dei cluster. Ho trovato diversi articoli su questo argomento, come ad esempio
- " Significato statistico del clustering per dati di dimensioni elevate, dimensioni ridotte del campione " di Liu, Yufeng et al. (2008)
- " Su alcuni test di significatività nell'analisi dei cluster ", di Bock (1985)
Ma sono interessato a trovare alcune pubblicazioni che sostengano che SST NON è appropriato per convalidare i risultati dell'analisi dei cluster. L'unica fonte che ho trovato affermando che questa è una pagina web di un fornitore di software
Chiarire:
Sono interessato a verificare se è stata trovata una struttura di cluster significativa a seguito dell'analisi dei cluster, quindi mi piacerebbe conoscere documenti che supportano o confutano la preoccupazione "sulla possibilità di test post-hoc dei risultati dei dati esplorativi analisi utilizzata per trovare i cluster ".
Ho appena trovato un documento del 2003, " Metodi di clustering e classificazione " di Milligan e Hirtle che affermano, ad esempio, che l'uso di ANOVA sarebbe un'analisi non valida poiché i dati non hanno assegnazioni casuali ai gruppi.