Come può il numero di connessioni essere gaussiano se non può essere negativo?


14

Sto analizzando i social network (non virtuali) e sto osservando le connessioni tra le persone. Se una persona scegliesse un'altra persona con cui connettersi in modo casuale, il numero di connessioni all'interno di un gruppo di persone verrebbe distribuito normalmente, almeno secondo il libro che sto leggendo.

Come possiamo sapere se la distribuzione è gaussiana (normale)? Esistono altre distribuzioni come Poisson, Rice, Rayliegh, ecc. Il problema con la distribuzione gaussiana in teoria è che i valori vanno da a + (anche se le probabilità vanno verso lo zero) e il numero di connessioni non può essere negativo.+

Qualcuno sa quale distribuzione ci si può aspettare nel caso in cui ogni persona in modo indipendente (casualmente) raccolga un'altra persona con cui connettersi?


1
Chiarimento: è la domanda sul "numero totale di connessioni per l'intero gruppo" o "il numero totale di connessioni per una persona"? La mia risposta presuppone implicitamente quest'ultima.

1
Distribuzione Riley ? Questo è nuovo per me. Hai un riferimento o un link?
onestop,

3
"Rayleigh" forse?
whuber

Risposte:


6

Quando ci sono persone e il numero di connessioni effettuate dalla persona i , 1 i n , è X i , il numero totale di connessioni è S n = nni,1in,Xi. Ora, se consideriamoXicome variabili casuali, supponiamo che siano indipendenti e le loro varianze non siano "troppo diseguali" poiché sempre più persone vengono aggiunte al mix, quindi siapplica ilTeorema del limite centrale di Lindeberg-Levy. Afferma che lafunzione di distribuzione cumulativaSn=i=1nXi/2Xidella somma standardizzata converge nel cdf della distribuzione normale. Ciò significa approssimativamente che un istogramma della somma assomiglierà sempre più a un gaussiano (una "curva a campana") man mano che cresce.n

Rivediamo cosa non dice questo:

  • Non afferma che la distribuzione di sia mai esattamente normale. Non può essere, per le ragioni che fai notare.Sn

  • Non implica il numero previsto di connessioni convergenti. In realtà, deve divergere (andare all'infinito). La standardizzazione è un aggiornamento e riscalamento della distribuzione; la quantità di riscalamento sta crescendo senza limiti.

  • Non dice nulla quando la non è indipendente o quando le loro variazioni cambiano troppo man mano che n cresce. (Tuttavia, ci sono generalizzazioni del CLT per serie di variabili "leggermente" dipendenti.)Xin


Si noti che non interpreto la domanda per affermare che ognuno sceglie esattamente un'altra persona a cui connettersi - ciò porterebbe a una teoria sterile perché il numero di connessioni sarebbe determinato, non casuale. Invece l'ho interpretato per affermare che tutti quando entrano nella rete scelgono le connessioni casualmente tra le altre n, finendo con un numero compreso tra 0 e n totale delle connessioni. L'assunzione delle variazioni è garantita quando esiste un limite al numero di connessioni che qualsiasi nuovo arrivato farà e quel numero ha una casualità "minima".
whuber

Xi

1
@Andy Not people: il numero di connessioni effettuate. L'importante è che ci siano buone probabilità che il numero di connessioni effettuate dagli individui in realtà vari e non si stabilizzi su una costante. Quando ciò accade, la distribuzione limitante (del numero di connessioni) è determinata dal numero finito di connessioni iniziali che variano, quindi non è possibile avvicinarsi asintoticamente a una distribuzione normale.
whuber

1

La risposta dipende dalle ipotesi che sei disposto a fare. Un social network si evolve costantemente nel tempo e quindi non è un'entità statica. Pertanto, è necessario formulare alcune ipotesi su come la rete si evolve nel tempo.

n

Prob(No of connections for any individual=n1)=1

Se una persona seleziona un'altra persona a caso per connettersi, alla fine tutti saranno connessi.

Tuttavia, le reti della vita reale non si comportano in questo modo. Le persone differiscono per diversi aspetti.

  1. In qualsiasi momento una persona ha una dimensione di rete fissa e la probabilità che venga stabilita un'altra connessione dipende dalla sua dimensione di rete (quando le persone introducono altre persone, ecc.).

  2. Una persona ha la sua intrinseca tendenza a formare una connessione (poiché alcuni sono introversi / estroversi, ecc.).

Queste probabilità cambiano nel tempo, nel contesto, ecc. Non sono sicuro che esista una risposta semplice a meno che non facciamo alcune ipotesi sulla struttura della rete (ad es. Densità della rete, comportamento delle persone, ecc.).


@Srikant Potresti spiegare come si ottiene la "banale risposta"? (Ci devono essere alcune ipotesi non dichiarate dietro di esso.) E a quale teorema fai riferimento quando concludi che "alla fine tutti saranno collegati"? Questo non è affatto ovvio!
whuber

@whuber Suppongo che le dimensioni della rete siano fisse. La domanda afferma: una persona sceglie un'altra persona a caso per stabilire una connessione e presumibilmente si tratta di un processo in corso. Quindi, col passare del tempo all'infinito, tutti dovrebbero essere connessi. Nessun teorema, solo intuizione. Forse sto usando un linguaggio impreciso.

@Srikant Sono ancora confuso, perché dopo molto tempo "Prob (No of connections = n)" è uguale a 1 quando n = 3 e altrimenti è sempre zero. Dopotutto, quando "tutti dovrebbero essere connessi" il numero di connessioni è uguale a n (n-1) / 2. Sospetto che potresti avere in mente diversi processi casuali contemporaneamente. Potrebbe aiutare a rivelare le ipotesi che stai formando ed essere un po 'più preciso.
whuber
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.