Non c'è davvero una risposta. È da qualche parte tra 1 e N.
Tuttavia, puoi pensarci dal punto di vista del profitto.
Ad esempio, nel marketing si usa la segmentazione, che è molto simile al clustering.
Un messaggio (un annuncio o una lettera, diciamo) che è su misura per ogni individuo avrà il più alto tasso di risposta. Un messaggio generico adattato alla media avrà il tasso di risposta più basso. Dire tre messaggi su misura per tre segmenti sarà da qualche parte nel mezzo. Questo è il lato delle entrate.
Un messaggio su misura per ogni individuo avrà il costo più alto. Un messaggio generico adattato alla media avrà il costo più basso. Tre messaggi su misura per tre segmenti saranno da qualche parte nel mezzo.
Supponiamo che pagare uno scrittore per scrivere un messaggio personalizzato costa 1000, due costano 2000 e così via.
Ad esempio, utilizzando un messaggio, le entrate saranno pari a 5000. Se hai segmentato i tuoi clienti in 2 segmenti e hai scritto messaggi su misura per ciascun segmento, il tasso di risposta sarà più elevato. Supponiamo che i ricavi siano ora 7500. Con tre segmenti, un tasso di risposta leggermente superiore e i tuoi ricavi sono 9000. Un altro segmento e sei a 9500.
Per massimizzare il profitto, continua a segmentare fino a quando le entrate marginali della segmentazione non equivalgono al costo marginale della segmentazione. In questo esempio, useresti tre segmenti per massimizzare il profitto.
Segments Revenue Cost Profit
1 5000 1000 4000
2 7500 2000 5500
3 9000 3000 6000
4 9500 4000 5500
hopack
(e altri) che possono stimare il numero di cluster, ma questo non risponde alla tua domanda.