Come è stato sottolineato, le aspettative si aggiungono semplicemente.
Tuttavia, sapendo che l'aspettativa non è molto utile, è anche necessario avere un'idea della probabile variazione che lo circonda.
Ci sono tre cose di cui devi preoccuparti:
variazione delle persone intorno alle loro aspettative (una persona con il 60% di probabilità di venire non raggiunge effettivamente le proprie aspettative; sono sempre al di sopra o al di sotto di essa)
dipendenza tra le persone. Le coppie che potrebbero venire entrambe tenderanno a frequentare entrambe o nessuna delle due. I bambini piccoli non parteciperanno senza i loro genitori. In alcuni casi, alcune persone potrebbero evitare di venire se sanno che ci sarà un'altra persona.
errore nella stima delle probabilità. Quelle probabilità sono solo ipotesi; potresti voler considerare l'effetto di ipotesi alquanto diverse (forse le valutazioni di qualcun altro su quei numeri)
Il primo è suscettibile di calcolo, mediante approssimazione normale o tramite simulazione. Il secondo potrebbe essere simulato in base a vari presupposti, specifici per le persone, o considerando una certa distribuzione delle dipendenze. (Il terzo elemento è più difficile.)
Modificato per rispondere alle domande di follow-up nei commenti:
Se capisco correttamente il tuo fraseggio, per la famiglia di 4 persone, hai una probabilità del 50% su ognuna di 4 persone o nessuna. Questo è un numero atteso di 2, certamente, ma vorresti avere un'idea della variabilità anche attorno alle aspettative, nel qual caso probabilmente vorrai mantenere la situazione attuale del 50% dello 0/50% di 4.
Se riesci a partizionare tutti in gruppi indipendenti, una buona prima approssimazione (con molti di questi gruppi) sarebbe quindi quella di aggiungere i mezzi e le varianze tra i gruppi indipendenti e quindi trattare la somma come normale (forse con correzione della continuità). Un approccio più accurato sarebbe quello di simulare il processo o calcolare la distribuzione esattamente tramite convoluzione numerica; mentre entrambi gli approcci sono semplici, questo è un livello di precisione non necessario per questa particolare applicazione, dato che ci sono già così tanti strati di approssimazione - è come dire le dimensioni di una stanza al piede più vicino e quindi calcolare quanta vernice avrai bisogno al millilitro più vicino: la precisione aggiuntiva è inutile.
Quindi immagina (per semplicità) che avevamo quattro gruppi:
1) gruppo A (1 persona) - 70% di possibilità di partecipazione
2) gruppo B (1 persona) - 60% di possibilità di partecipazione
3) gruppo C (famiglia di 4) - 0: 0,5 4: 0,5 (se qualcuno rimane a casa, nessuno verrà)
4) gruppo D (coppia di 2) - 0: 0,4 1: 0,1 2: 0,5 (ovvero 50% di probabilità di entrambi, più 10% di probabilità esattamente uno verrà, ad esempio se l'altro ha impegni di lavoro o è malato)
Quindi otteniamo i seguenti mezzi e varianze:
mean variance
A 0.7 0.21
B 0.6 0.24
C 2.0 4.0
D 1.1 0.89
Tot 4.4 5.34
Quindi un'approssimazione normale sarà piuttosto approssimativa in questo caso, ma suggerirebbe che più di 7 persone sarebbero piuttosto improbabili (nell'ordine del 5%) e che 6 o meno si verificherebbero circa il 75-80% delle volte.
[Un approccio più accurato sarebbe simulare il processo, ma sul problema completo piuttosto che sull'esempio ridotto questo probabilmente non è necessario poiché ci sono già così tanti strati di approssimazione.]
Una volta che hai la tua distribuzione combinata che incorpora tali dipendenze di gruppo, potresti voler applicare qualsiasi fonte di dipendenza articolare complessiva (come il maltempo) o potresti semplicemente assicurarti o addirittura ignorare tali eventualità, a seconda delle circostanze .