È risaputo che le formule CNF possono essere suddivise approssimativamente in 2 grandi classi: casuale e strutturato. Le formule CNF strutturate, in contrapposizione alle formule casuali CNF, mostrano una sorta di ordine, mostrando modelli che è improbabile che accadano per caso. Tuttavia, si possono trovare formule strutturate che mostrano un certo grado di casualità (cioè alcuni gruppi specifici di clausole sembrano molto meno strutturati di altri), così come formule casuali con qualche forma debole di struttura (cioè alcuni gruppi specifici di clausole sembrano meno casuali di altri ). Quindi sembra che la casualità di una formula non sia solo un fatto sì / no.
Sia una funzione che, data una formula CNF F ∈ F , restituisce un valore reale compreso tra 0 e 1 compreso: 0 indica una formula strutturata pura, mentre 1 indica una formula casuale pura.
Mi chiedo se qualcuno abbia mai provato a inventare un tale . Naturalmente il valore restituito da r sarebbe (almeno questo è il mio intento) solo una misurazione pratica secondo alcuni criteri ragionevoli, piuttosto che una solida verità teorica.
Sono anche interessato a sapere se qualcuno ha mai definito e studiato alcun indicatore statistico che può essere utilizzato nella definizione di o nel determinare altre utili proprietà complessive di una formula. Per indicatore statistico intendo qualcosa del genere:
- HCV (numero di passaggi Variance)
Sia una funzione che, data una variabile v j ∈ N , restituisce il numero di volte v j appare in F . Lasciate V l'insieme di variabili utilizzate in F . Lascia ˉ h F = 1essere l'AHC (conteggio dei colpi medi). L'HCV è definito come segue: HVC=1
In casi casuali, l'HCV è molto basso (tutte le variabili sono menzionate quasi lo stesso numero di volte), mentre in istanze strutturate non lo è (alcune variabili sono usati molto frequentemente e altri no, cioè ci sono "gruppi di utilizzo").
- AID (Grado di impurità medio)
Sia il numero di volte in cui v j si presenta positivo, e sia h - F ( v j ) il numero di volte in cui si presenta negativo. Sia i : N → [ 0 , 1 ] una funzione che, data una variabile v j ∈ V , restituisce il suo ID (Grado di impurità). La funzione i ( v j ) è definita come segue: i ( . Quelle variabili che si verificano metà del tempo positivo e metà del tempo negativo hanno il massimo grado di impurità, mentre quelle variabili che si presentano sempre positive o sempre negative (cioè letterali puri) hanno un grado di impurità minimo. L'AID è semplicemente definito come segue: AID=1
In casi casuali (almeno in quelli generati negando variabili con probabilità0,5), l'AID è quasi uguale a1, mentre in istanze strutturate è generalmente lontano da1.
- IDV (Impiance Degree Variance)
L'IDV è un indicatore più robusto del solo AID, poiché tiene conto di istanze casuali generate negando variabili con probabilità diversa da . È definito come: I D V = 1
motivazioni
- Per capire meglio come funzionano le formule CNF, come potrebbe essere misurata la loro casualità / struttura, se si potessero dedurre altre utili proprietà complessive osservando i loro indicatori statistici, se e come tali indicatori possano essere usati per accelerare la ricerca.
- Mi chiedo se la soddisfacibilità (o anche il numero di soluzioni) di una formula CNF possa essere dedotta semplicemente manipolando abilmente i suoi indicatori statistici.
Domande
- Qualcuno ha mai proposto un modo per misurare la casualità di una formula CNF?
- Qualcuno ha mai proposto un indicatore statistico che può essere utilizzato per studiare o addirittura per inferire meccanicamente le proprietà complessive utili di una formula CNF?