Questa quantità relativa all'indipendenza ha un nome?


18

Ovviamente gli eventi A e B sono indipendenti se Pr = Pr Pr . Definiamo una quantità correlata Q:( A ) ( B )(UNB)(UN)(B)

QPr(UNB)Pr(UN)Pr(B)

Quindi A e B sono indipendenti se Q = 1 (supponendo che il denominatore sia diverso da zero). Q ha davvero un nome però? Sento che si riferisce a qualche concetto elementare che mi sta sfuggendo proprio ora e che mi sentirò abbastanza sciocco anche solo per averlo chiesto.


1
Penso che dipenda dal contesto. Nota che modo che \ Pr (A | B) = Q \ Pr (A) e \ Pr (B | A) = Q \ Pr (B) . Questa forma ha più un sapore di inferenza bayesiana.
Q=Pr(UN|B)Pr(UN)=Pr(B|UN)Pr(B)
Pr(UN|B)=QPr(UN)Pr(B|A)=QPr(B)
vqv

Questo SE potrebbe fare con alcune domande più "piuttosto stupide". È molto intimidatorio, anche per qualcuno a cui sono piaciute le statistiche di base di livello universitario. +1 per stupidità
nullo101

2
Questa domanda è stata posta in Matematica: sulla probabilità congiunta divisa per il prodotto delle probabilità .

1
Scegli "Probabilità Migdal";)
Bitwise il

1
@PiotrMigdal Grazie per la gentile offerta. Io preferirei vedere la vostra propria risposta. Forse includendo come ti è venuta questa domanda e come quella quantità può essere utile.

Risposte:


14

È rispettato il rapporto previsto (abbreviazione: o / e ).

Citando una risposta a Informazioni sulla probabilità congiunta divisa per il prodotto delle probabilità su Math.SE (indicato da Procrastinator ):

Quindi, almeno nella letteratura sulle scienze ambientali, mediche e della vita, P (A∩B) / (P (A) P (B)) è chiamato rapporto osservato / atteso (abbreviazione o / e). L'idea è che il numeratore sia l'effettiva probabilità di A∩B mentre il denominatore è quello che sarebbe se A e B fossero indipendenti.


11

Penso che tu stia cercando Lift(o migliorando). L'elevazione è il rapporto della probabilità che A e B si verifichino insieme al multiplo delle due probabilità individuali per A e B. Viene utilizzato per interpretare l'importanza di una regola nel mining di regole di associazione . L'ascensore è un modo per misurare quanto un modello è molto meglio rispetto al benchmark ed è definito come la fiducia divisa per il benchmark, in cui qualsiasi valore maggiore di quello suggerisce che vi sia una certa utilità per la regola. Vedi questa pagina anche come altro esempio.


(+1) Bella risposta. I arules Vignette inoltre hanno alcune buone referenze circa ascensore .
chl

Grazie, probabilmente è lì che l'ho visto prima. Penso di aver già visto l'ascensore con una definizione leggermente diversa nel contesto dell'apprendimento automatico prima ... Tuttavia, odio il fatto che a volte vi sia una mancanza di consenso su una definizione, mentre altre volte ci sono molti termini per lo stesso concetto.
Michael McGowan,

8

La gente dell'analisi della corrispondenza definisce una di queste quantità un rapporto di contingenza , nel contesto di conteggi incrociati. Le distanze di più di tali rapporti da 1 sono ciò che i biplot visualizzano. Vedi ad esempio Greenacre (1993) ch.13.

La selezione di funzionalità di apprendimento automatico della vecchia scuola chiama il registro di questa quantità informazioni reciproche in senso puntuale . Vedi ad esempio Manning e Schütze (1999) p.66.


Grazie per aver sottolineato "contingency ratio" e "pointwise mutual information".
Piotr Migdal,


Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.