Esiste una grande varietà di metodi di clustering, che sono esplorativi per natura, e non credo che nessuno di essi, sia esso gerarchico o basato su partizioni, si basi sul tipo di ipotesi che si devono soddisfare per analizzare la varianza.
Guardando la documentazione [MV] in Stata per rispondere alla tua domanda, ho trovato questa citazione divertente a pagina 85:
Sebbene alcuni abbiano affermato che esistono tanti metodi di analisi dei cluster quante sono le persone che eseguono l'analisi dei cluster. Questo è un eufemismo grave! Esistono infiniti modi per eseguire un'analisi dei cluster rispetto alle persone che li eseguono.
In tale contesto, dubito che vi siano ipotesi applicabili al metodo di clustering. Il resto del testo stabilisce semplicemente come regola generale che sia necessaria una qualche forma di "misura di dissomiglianza", che non deve nemmeno essere una distanza metrica, per creare cluster.
C'è un'eccezione, tuttavia, che si verifica quando si raggruppano le osservazioni come parte di un'analisi post-stima. In Stata, il vcecomando viene fornito con il seguente avviso, a pagina 86 della stessa fonte:
Se hai familiarità con la vasta gamma di comandi di stima di Stata, fai attenzione a distinguere tra l'analisi del cluster (il comando del cluster) e l'opzione vce (cluster clustvar) consentita con molti comandi di stima. L'analisi del cluster trova gruppi nei dati. L'opzione vce (cluster clustvar) consentita con vari comandi di stima indica che le osservazioni sono indipendenti tra i gruppi definiti dall'opzione ma non sono necessariamente indipendenti all'interno di tali gruppi. Una variabile di raggruppamento prodotta dal comando cluster raramente soddisfa il presupposto dietro l'uso dell'opzione vce (cluster clustvar).
Sulla base di ciò, suppongo che non siano necessarie osservazioni indipendenti al di fuori di quel caso particolare. Intuitivamente, aggiungerei che l'analisi dei cluster potrebbe persino essere utilizzata allo scopo preciso di esplorare la misura in cui le osservazioni sono indipendenti o meno.
Concluderò menzionando che, a pagina 356 di Statistics with Stata , Lawrence Hamilton menziona le variabili standardizzate come un aspetto "essenziale" dell'analisi dei cluster, sebbene non approfondisca la questione.