Costruire un camper discreto avendo come supporto tutte le razionali in


19

Questo è il seguito costruttivista di questa domanda .

Se non possiamo avere una variabile casuale uniforme discreta avente come supporto tutte le razionali nell'intervallo , allora la cosa migliore è: [0,1]

Costruisci una variabile casuale che ha questo supporto, Q \ in \ mathbb {Q} \ cap [0,1] e che segue una certa distribuzione. E l'artigiano in me richiede che questa variabile casuale sia costruita da distribuzioni esistenti, piuttosto che creata definendo astrattamente ciò che desideriamo ottenere.QQQ[0,1]

Quindi ho pensato a quanto segue:

Sia X una variabile casuale discreta che segue la Geometric Distribution-Variant II con il parametro 0<p<1 , ovvero

X{0,1,2,...},P(X=k)=(1p)kp,FX(X)=1(1p)k+1

Sia anche Y una variabile casuale discreta che segue la variante di distribuzione geometrica I con identico parametro p , vale a dire

Y{1,2,...},P(Y=k)=(1p)k1p,FY(Y)=1(1p)k

X e Y sono indipendenti. Definisci ora la variabile casuale

Q=XY

e considera la distribuzione condizionale

P(Qq{XY})

In parole sciolte " Q condizionale Qè il rapporto di X su Y condizione che X sia minore o uguale a Y ". Il supporto di questa distribuzione condizionata è {0,1,1/2,1/3,...,1/k,1/(k+1),...,2/3,2/4,...}=Q[0,1] .

La "domanda" è: qualcuno può fornire la funzione di massa della probabilità condizionata associata?

Un commento ha chiesto "dovrebbe essere in forma chiusa"? Dal momento che ciò che costituisce una forma chiusa al giorno d'oggi non è così ben definito, lasciatemi dire così: stiamo cercando una forma funzionale in cui possiamo inserire un numero razionale da [0,1] e ottenere la probabilità (per alcuni valore specificato del parametro p ovviamente), portando ad un grafico indicativo del pmf. E quindi variare p per vedere come cambia il grafico.

Se aiuta, allora possiamo rendere aperti uno o entrambi i limiti del supporto, sebbene queste varianti ci privino della possibilità di rappresentare graficamente i valori superiore e / o inferiore di pmf . Inoltre, se apriamo il limite superiore, dovremmo considerare l'evento di condizionamento .{X<Y}

In alternativa, accolgo con favore anche altri camper che hanno questo supporto / i, purché si incontrino con il loro pmf .

Ho usato la distribuzione geometrica perché ha prontamente disponibili due varianti con quella che non include zero nel supporto (in modo da evitare la divisione per zero). Ovviamente, si possono usare altri camper discreti, usando un troncamento.

Sicuramente darò una taglia a questa domanda, ma il sistema non lo consente immediatamente.


1
Intendi ? (definire una variabile casuale in modo condizionale su qualcosa non ha senso, puoi solo definirne la distribuzione in questo modo)Q=XY1{XY}
Stéphane Laurent,

1
La tua Q è numerabile: sai che esiste una corrispondenza 1-1 tra N = {1, 2, ...} e Q. Se riuscissi a trovare una tale corrispondenza, la soluzione sarebbe quella di scegliere qualsiasi distribuzione su N e usarla scegliere l'elemento corrispondente di Q.
Adrian,

comunque devi calcolare per ogni frazione irriducibile e questo è . Pr(X/Y=p/q)p/qPr(X=p,X=2p,)×Pr(Y=q,Y=2q,)
Stéphane Laurent,

1
Il requisito di fornire il pmf significa che è richiesto un modulo chiuso? O, per esempio, la somma infinita di @ StéphaneLaurent è sufficiente per soddisfare la condizione?
Juho Kokkala,

1
Lascia che e Y il camper nel tuo post. P r [ Q = q ] = P r [ Y = f - 1 ( q ) ]f:NQ[0,1]Pr[Q=q]=Pr[Y=f1(q)]
Adrian

Risposte:


19

Considera la distribuzione discreta con supporto sull'insieme con masse di probabilità{ ( p , q )F{(p,q)|qp1}N2

F(p,q)=321+p+q.

Questo è facilmente riassumibile (tutte le serie coinvolte sono geometriche) per dimostrare che è davvero una distribuzione (la probabilità totale è unità).

Per qualsiasi numero razionale diverso da zero supponga che sia la sua rappresentazione nei termini più bassi: ovvero, e .a / b = x b > 0 gcd ( a , b ) = 1xa/b=xb>0gcd(a,b)=1

G [ 0 , 1 ] QF induce una distribuzione discreta su tramite le regoleG[0,1]Q

G(x)=G(ab)=n=1F(an,bn)=321+a+b2.

(e ). Ogni numero razionale in ha una probabilità diversa da zero (se devi includere tra i valori con probabilità positiva, togli una parte della probabilità da un altro numero - come - e assegnalo a ).( 0 , 1 ] 0 1 0G(0)=0(0,1]010

Per capire questa costruzione, guarda questa rappresentazione di :F

[Figura di F]

p , q F p / q p q 0 1 G G G ( 1 ) 1 F ( 1 , 1 ) + F ( 2 , 2 ) + F ( 3 , 3 ) + 3 / 8 + 3 / 32 + 3 / 128 + = 1 / 2F fornisce masse di probabilità in tutti i punti con coordinate integrali positive. I valori di sono rappresentati dalle aree colorate di simboli circolari. Le linee hanno pendenze per tutte le possibili combinazioni di coordinate e appaiono nel grafico. Sono colorati allo stesso modo dei simboli circolari: secondo le loro pendenze. Pertanto, la pendenza (che varia chiaramente da a ) e il colore corrispondono all'argomento di e i valori di si ottengono sommando le aree di tutti i cerchi che giacciono su ciascuna linea. Ad esempio,p,qFp/qpq01GGG(1)si ottiene sommando le aree di tutti i cerchi (rossi) lungo la diagonale principale della pendenza , data da = .1F(1,1)+F(2,2)+F(3,3)+3/8+3/32+3/128+=1/2

figura

Questa figura mostra un'approssimazione a ottenuta limitando : traccia i suoi valori a numeri razionali che vanno da a . Le masse di probabilità più grandi sono .q 100 3044 1 / 100 1 1Gq10030441/100112,314,110,362,362,142,

Ecco il CDF completo di (preciso per la risoluzione dell'immagine). I sei numeri appena elencati danno le dimensioni dei salti visibili, ma ogni parte del CDF è costituita da salti, senza eccezioni:G

figura 2


1
Grazie! Sono in procinto di comprendere la costruzione. Solo due domande: a) è bivariato, ma nell'espressione che lo collega a appare come univariato. Mi sto perdendo qualcosa? e b) Dato che è univariato, suppongo che tutti i punti nel primo grafico dall'aspetto impressionante rappresentino un valore diverso sull'asse orizzontale (anche se ovviamente questo non può essere rappresentato fedelmente in tale scala), ho ragione? G GFGG
Alecos Papadopoulos,

Stavo solo completando un dato che potrebbe rispondere al tuo commento, Alecos, e l'ho aggiunto alla risposta. Nota che avrei potuto iniziare con qualsiasi distribuzione discreta e costruire allo stesso modo; questa particolare distribuzione è stata scelta per facilitare i calcoli. GFG
whuber

È sempre meglio, come per la mia prima domanda nel commento precedente, dovrebbe essere invece di ? Vale a dire che e ? F(aF(ab,n)p=a/bq=nF(abn)p=a/bq=n
Alecos Papadopoulos,

Questa è una risposta migliore della mia! Ho notato due piccole cose: penso che la tua F (p, q) sia pari a 4 come scritto. Anche nell'equazione sotto "F induce una distribuzione discreta G" dovresti avere F (na, nb) no?
Adrian,

@Adrian, Alecos Grazie per aver colto quei refusi: l' dovrebbe essere un e la notazione per ovviamente non è corretta. Li riparerò subito. - 1 F.11F
whuber

8

Metterò insieme i miei commenti e li posterò come risposta solo per chiarezza. Mi aspetto che non sarai molto soddisfatto, poiché tutto ciò che faccio è ridurre il tuo problema a un altro.

La mia notazione:

Q[ 0 , 1 ] Q Q XQ è un camper il cui supporto è - la mia non è la stessa l'OP costruisce dal suo . Definiremo questa usando e , che presento di seguito.Q[0,1]QQ QYfXYQYf

N{ 1 , 2 , } YY è qualsiasi camper il cui supporto è - la fornita dall'OP funzionerebbe, per esempio.N{1,2,}Y

f : NQ[ 0 , 1 ] f - 1f è una corrispondenza uno a uno e è il suo inverso. Sappiamo che esistono.f:NQ[0,1]f1

Ora sostengo che posso ridurre il tuo problema semplicemente trovando una e la sua :f - 1ff1

Basta lasciare e il gioco è fatto. Il PMF di è . Q Pr [ Q = q ] = Pr [ Y = f - 1 ( q ) ]Q=f(Y)QPr[Q=q]=Pr[Y=f1(q)]

Modificare:

Ecco una funzione g che svolge il ruolo di , nonostante non sia una corrispondenza uno a uno (a causa dei duplicati):f

g <- function(y) {
    y <- as.integer(y)
    stopifnot(y >= 1)
    b <- 0
    a <- 0
    for (unused_index in seq(1, y)) {
        if (a >= b) {
            b <- b+1
            a <- 0
        } else {
            a <- a+1
        }
    }
    return(sprintf("q = %s / %s", a, b))
    ## return(a / b)
}

(+1) No, considero il tuo approccio un eccellente esempio di come si possa pensare e usare l'approccio astratto per arrivare a risultati e algoritmi molto applicabili . Il punto principale, come ora lo capisco, è che si può ottenere la costruzione desiderata usando come forma funzionale il pmf di qualsiasi distribuzione discreta con supporto . Naturalmente resta da trovare e . Dato che hai una migliore comprensione di questo approccio rispetto a me, la frase "sappiamo che esistono" è un modo educato per dire "ma non abbiamo idea di come siano"? :) f f - 1N{1,2,}ff1
Alecos Papadopoulos,

Vedi jcu.edu/math/vignettes/infinity.htm : potresti usare uno "schema diagonale" simile. La parte difficile è ottenere un'espressione per . Non sono sicuro di come farlo, ma potresti chiedere su math.stackexchange.com (o fare prima qualche altro googling). f1
Adrian,

Nel link che hai fornito dice ad un certo punto: "Nota che non è necessario trovare una formula per la corrispondenza; tutto ciò che è necessario è la certezza che tale corrispondenza esiste. Ci sono molti altri casi in matematica che sono così - dove il punto è mostrare che qualcosa deve accadere o che qualcosa esiste, piuttosto che esibire effettivamente una formula ". Bene, il punto nella mia domanda è in realtà esibire una formula : ho chiamato questa domanda "costruttivista" per una ragione.
Alecos Papadopoulos,

1
Penso di poter fornire un algoritmo che funzioni - ci penserò un po 'di più.
Adrian,

Ho pubblicato qualcosa: ti consente di simulare Q, ma non risolve il problema PMF.
Adrian,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.