Non esiste una soluzione unica
Non credo che la vera distribuzione discreta della probabilità possa essere recuperata, a meno che non si facciano ulteriori ipotesi. La tua situazione è fondamentalmente un problema di recupero della distribuzione congiunta dai marginali. A volte viene risolto utilizzando copule nel settore, ad esempio la gestione dei rischi finanziari, ma di solito per distribuzioni continue.
Presenza, indipendente, AS 205
In presenza del problema non è consentita più di una bomba in una cella. Ancora una volta, per il caso speciale di indipendenza, esiste una soluzione computazionale relativamente efficiente.
Se conosci FORTRAN, puoi utilizzare questo codice che implementa l'algoritmo AS 205: Ian Saunders, algoritmo AS 205: enumerazione delle tabelle R x C con totali di riga ripetuti, statistiche applicate, volume 33, numero 3, 1984, pagine 340-352. È legato all'algo di Panefield a cui fa riferimento @Glen_B.
Questo algo elenca tutte le tabelle di presenza, vale a dire passa attraverso tutte le tabelle possibili in cui è presente una sola bomba in un campo. Calcola anche la molteplicità, ovvero più tabelle che sembrano uguali e calcola alcune probabilità (non quelle a cui sei interessato). Con questo algoritmo potresti essere in grado di eseguire l'enumerazione completa più velocemente di prima.
Presenza, non indipendente
L'algoritmo AS 205 può essere applicato a un caso in cui le righe e le colonne non sono indipendenti. In questo caso dovresti applicare pesi diversi a ciascuna tabella generata dalla logica di enumerazione. Il peso dipenderà dal processo di posizionamento delle bombe.
Conta, indipendenza
Il problema del conteggio consente ovviamente più di una bomba piazzata in una cella. Il caso speciale del problema di conteggio di righe e colonne indipendenti è semplice:
dove e sono marginali di righe e colonne. Ad esempio, la riga e la colonna , quindi la probabilità che una bomba sia nella riga 6 e la colonna 3 è . In realtà hai prodotto questa distribuzione nella tua prima tabella.Pji=Pi×PjPiPjP6=3/15=0.2P3=3/15=0.2P36=0.04
Conta, non indipendente, copie discrete
Al fine di risolvere il problema dei conteggi in cui righe e colonne non sono indipendenti, è possibile applicare copule discrete. Hanno problemi: non sono unici. Non li rende inutili però. Quindi, proverei ad applicare copule discrete. Potete trovarne una buona panoramica in Genest, C. e J. Nešlehová (2007). Un primer sulle copule per i dati di conteggio Astin Bull. 37 (2), 475-515.
Le copule possono essere particolarmente utili, poiché di solito consentono di indurre esplicitamente la dipendenza o di stimarla dai dati quando i dati sono disponibili. Intendo la dipendenza di righe e colonne quando si posizionano le bombe. Ad esempio, potrebbe essere il caso in cui se la bomba è la prima fila, è più probabile che sia anche la prima colonna.
Esempio
Appliciamo la copula di Kimeldorf e Sampson ai tuoi dati, supponendo ancora che più di una bomba possa essere piazzata in una cella. La copula per un parametro di dipendenza è definita come:
Puoi pensare a come analogo del coefficiente di correlazione.θC(u,v)=(u−θ+u−θ−1)−1/θ
θ
Indipendente
Cominciamo con il caso della dipendenza debole, , dove abbiamo le seguenti probabilità (PMF) e i PDF marginali sono mostrati anche sui pannelli a destra e in basso:θ=0.000001
Puoi vedere come nella colonna 5 la probabilità della seconda riga abbia una probabilità doppia rispetto alla prima riga. Questo non è sbagliato in contrasto con ciò che sembra implicare nella tua domanda. Tutte le probabilità si sommano fino al 100%, ovviamente, così come i margini sui pannelli corrispondono alle frequenze. Ad esempio, la colonna 5 nel pannello inferiore mostra 1/3 che corrisponde a 5 bombe dichiarate su un totale di 15 come previsto.
Correlazione positiva
Per una dipendenza più forte (correlazione positiva) con abbiamo quanto segue:θ=10
Correlazione negativa
Lo stesso per una correlazione più forte ma negativa (dipendenza) :θ=−0.2
Puoi vedere che tutte le probabilità aggiungono fino al 100%, ovviamente. Inoltre, puoi vedere come la dipendenza influisce sulla forma del PMF. Per la dipendenza positiva (correlazione) si ottiene il PMF più elevato concentrato sulla diagonale, mentre per la dipendenza negativa è fuori diagonale