Ignora le altre risposte qui. Questo in realtà non è affatto un paradosso. Il vero problema qui a portata di mano che tutti sembrano ignorare è che stai sbagliando quale probabilità stai effettivamente osservando. Ci sono infatti due medie e statistiche completamente diverse in gioco qui che hanno entrambe usi e interpretazioni propri nell'esempio proposto (marketing)!
Prima di tutto c'è il numero medio di prodotti acquistati per cliente. Quindi, in media, un cliente acquista 1,6 articoli. Naturalmente, un cliente non può che 0.6 del prodotto (supponendo che non sia qualcosa come riso o grano a cui sia associata una misurazione continua).
In secondo luogo, c'è il numero medio di clienti che acquistano un determinato prodotto. Sembra strano vero? Quindi in media un prodotto ha 5.33333333 ... clienti che lo acquistano. Questo è diverso comunque. Quello che stiamo descrivendo qui non è il numero di prodotti acquistati (ce ne sono solo tre!) Ma piuttosto il numero di persone che acquistano effettivamente quel prodotto.
Pensa ai due valori in questo modo: cosa rappresenterebbero questi due valori se ci fosse un solo cliente o un solo prodotto? Dopo tutto, la media di un singolo punto dati è proprio quel dato punto dati.
O meglio ancora, pensa al grafico come se ti stesse dando importi in dollari spesi per acquistare il prodotto. Ovviamente l'importo medio speso da un singolo cliente sarà di gran lunga inferiore alla quantità di denaro guadagnata in media da un prodotto fornito da una grande azienda (o anche solo una piccola impresa). Sono sicuro che puoi pensare a buoni modi per utilizzare entrambi i valori quando parli del benessere dell'azienda.
Quando vai a spiegare questo al personale di marketing, spiegalo proprio come ho detto. Non è un paradosso. È solo una statistica completamente diversa. L'unico problema qui era notare che in realtà c'erano due modi diversi di leggere il grafico (cioè il numero di persone che acquistano per prodotto rispetto al numero di prodotti acquistati per persona).
tl; dr la prima cosa che hai descritto è l'importo medio che un singolo cliente è disposto a spendere per acquistare i tuoi prodotti. Il secondo è la domanda media di un determinato prodotto da parte del pubblico. Sono sicuro che ora puoi capire perché entrambi non sono certamente la stessa cosa. Il loro confronto in quanto tale ti darà solo informazioni inutili.
MODIFICARE
Sembrerebbe che la domanda si stia effettivamente ponendo sul denaro medio speso dai clienti che acquistano alcuni prodotti a, b o c. Tutto apposto. Questo è in realtà solo un errore nei calcoli. Non lo definirei un paradosso. È davvero solo un filo sottile.
Guarda le tue colonne. Ci sono persone condivise tra le colonne. Supponiamo che tu abbia fatto una media ponderata adeguata . Stai ancora sommando due persone. Ciò significa che la media conterrà persone extra con un valore maggiore o uguale a 2. Ora qual è stata la tua media? Era 1.6! In sostanza la tua media si presenta così:
Σni = 0v a l u e O fPe r s o nioA v a l u e O fPe r s o nion
Questa non è sicuramente la formula giusta. È una media ponderata, pur assumendo l'esclusività reciproca, è così che ti adatteresti per ottenere una media reale nella tua situazione.
Σni = 0n u m b e r O fPe o p l e B u yi n gio∗ a v e r a ge Sp e n t B yPe r s o n B u yi n gion
Ad ogni modo otterrai una media incasinata. Un errore è stato ignorare la necessità di una media ponderata in quanto una categoria ha un "peso" maggiore in termini di media. È come la densità. Un valore è più denso nelle persone rappresenta. L'altro problema è l'aggiunta duplicata che distorcerà la media. Non chiamo nessuno di questi "paradossi" però. Una volta che ho visto cosa stavi facendo, mi è sembrato ovvio perché non avrebbe funzionato. La media ponderata è in qualche modo autoesplicativa per le sue necessità e penso ora che vedi che hai aggiunto valori più volte ... che non può funzionare. Praticamente hai preso la media dei quadrati dei loro valori.