Supponiamo di avere un campione dalla distribuzione congiunta di X e Y . Come testare l'ipotesi che X e Y siano indipendenti ?
Non viene fatta alcuna ipotesi sulle leggi di distribuzione congiunte o marginali di e Y (almeno di tutta la normalità congiunta, poiché in tal caso l'indipendenza è identica alla correlazione essendo 0 ).
Non si ipotizza la natura di una possibile relazione tra e Y ; può essere non lineare, quindi le variabili sono non correlate ( r = 0 ) ma altamente co-dipendenti ( I = H ).
Vedo due approcci:
Raccogli entrambe le variabili e usa il test esatto o il test G di Fisher .
- Pro: utilizzare test statistici consolidati
- Contro: dipende dal binning
Stimare la dipendenza di e Y : I ( X ; Y ) (questo èperXeYindipendentie1quando si determinano completamente a vicenda).
- Pro: produce un numero con un chiaro significato teorico
- Contro: dipende dal calcolo approssimativo dell'entropia (cioè, binning di nuovo)
Questi approcci hanno senso?
Quali altri metodi usano le persone?