La notifica dopo la tabella ANOVA dopo l'analisi dei mezzi K indica che i livelli di significatività non devono essere considerati come test di mezzi uguali, poiché la soluzione del cluster è stata derivata in base alla distanza euclidea per massimizzare la distanza. Quale test devo usare per mostrare se i mezzi delle variabili di clustering differiscono tra i cluster? Ho visto questo avviso nella tabella ANOVA fornita dagli output di k-mean, ma in alcuni riferimenti vedo che vengono eseguiti test ANOVA post-hoc. Devo ignorare le uscite ANOVA k-mean ed eseguire ANOVA unidirezionale con test post-hoc e interpretarli in modo tradizionale? Oppure posso solo implicare la grandezza del valore F e quali variabili hanno contribuito maggiormente alla differenza? Un'altra confusione è che le variabili di clustering non sono normalmente distribuite in violazione dell'assunzione di ANOVA, allora potrei usare il test non parametrico di Kruskal-Wallis, ma ha ipotesi circa le stesse distribuzioni. Le distribuzioni inter-cluster per le variabili specifiche non sembrano le stesse, alcune sono distorte positivamente, alcune sono negativamente ... Ho 1275 campioni di grandi dimensioni, 5 cluster, 10 variabili di clustering misurate in punteggi PCA.