Java (n = 8)
import java.util.*;
import java.util.concurrent.*;
public class HankelCombinatorics {
public static final int NUM_THREADS = 8;
private static final int[] FACT = new int[13];
static {
FACT[0] = 1;
for (int i = 1; i < FACT.length; i++) FACT[i] = i * FACT[i-1];
}
public static void main(String[] args) {
long prevElapsed = 0, start = System.nanoTime();
for (int i = 1; i < 12; i++) {
long count = count(i), elapsed = System.nanoTime() - start;
System.out.format("%d in %dms, total elapsed %dms\n", count, (elapsed - prevElapsed) / 1000000, elapsed / 1000000);
prevElapsed = elapsed;
}
}
@SuppressWarnings("unchecked")
private static long count(int n) {
int[][] perms = new int[FACT[n]][];
genPermsInner(0, 0, new int[n], perms, 0);
// We partition by canonical representation of the row sum multiset, discarding any with a density > 50%.
Map<CanonicalMatrix, Map<CanonicalMatrix, Integer>> part = new HashMap<CanonicalMatrix, Map<CanonicalMatrix, Integer>>();
for (int m = 0; m < 1 << (2*n-1); m++) {
int density = 0;
int[] key = new int[n];
for (int i = 0; i < n; i++) {
key[i] = Integer.bitCount((m >> i) & ((1 << n) - 1));
density += key[i];
}
if (2 * density <= n * n) {
CanonicalMatrix _key = new CanonicalMatrix(key);
Map<CanonicalMatrix, Integer> map = part.get(_key);
if (map == null) part.put(_key, map = new HashMap<CanonicalMatrix, Integer>());
map.put(new CanonicalMatrix(m, perms[0]), m);
}
}
List<Job> jobs = new ArrayList<Job>();
ExecutorService pool = Executors.newFixedThreadPool(NUM_THREADS);
for (Map.Entry<CanonicalMatrix, Map<CanonicalMatrix, Integer>> e : part.entrySet()) {
Job job = new Job(n, perms, e.getKey().sum() << 1 == n * n ? 0 : 1, e.getValue());
jobs.add(job);
pool.execute(job);
}
pool.shutdown();
try {
pool.awaitTermination(1, TimeUnit.DAYS); // i.e. until it's finished - inaccurate results are useless
}
catch (InterruptedException ie) {
throw new IllegalStateException(ie);
}
long total = 0;
for (Job job : jobs) total += job.subtotal;
return total;
}
private static int genPermsInner(int idx, int usedMask, int[] a, int[][] perms, int off) {
if (idx == a.length) perms[off++] = a.clone();
else for (int i = 0; i < a.length; i++) {
int m = 1 << (a[idx] = i);
if ((usedMask & m) == 0) off = genPermsInner(idx+1, usedMask | m, a, perms, off);
}
return off;
}
static class Job implements Runnable {
private volatile long subtotal = 0;
private final int n;
private final int[][] perms;
private final int shift;
private final Map<CanonicalMatrix, Integer> unseen;
public Job(int n, int[][] perms, int shift, Map<CanonicalMatrix, Integer> unseen) {
this.n = n;
this.perms = perms;
this.shift = shift;
this.unseen = unseen;
}
public void run() {
long result = 0;
int[][] perms = this.perms;
Map<CanonicalMatrix, Integer> unseen = this.unseen;
while (!unseen.isEmpty()) {
int m = unseen.values().iterator().next();
Set<CanonicalMatrix> equiv = new HashSet<CanonicalMatrix>();
for (int[] perm : perms) {
CanonicalMatrix canonical = new CanonicalMatrix(m, perm);
if (equiv.add(canonical)) {
result += canonical.weight() << shift;
unseen.remove(canonical);
}
}
}
subtotal = result;
}
}
static class CanonicalMatrix {
private final int[] a;
private final int hash;
public CanonicalMatrix(int m, int[] r) {
this(permuteRows(m, r));
}
public CanonicalMatrix(int[] a) {
this.a = a;
Arrays.sort(a);
int h = 0;
for (int i : a) h = h * 37 + i;
hash = h;
}
private static int[] permuteRows(int m, int[] perm) {
int[] cols = new int[perm.length];
for (int i = 0; i < perm.length; i++) {
for (int j = 0; j < cols.length; j++) cols[j] |= ((m >> (perm[i] + j)) & 1L) << i;
}
return cols;
}
public int sum() {
int sum = 0;
for (int i : a) sum += i;
return sum;
}
public int weight() {
int prev = -1, count = 0, weight = FACT[a.length];
for (int col : a) {
if (col == prev) weight /= ++count;
else {
prev = col;
count = 1;
}
}
return weight;
}
@Override public boolean equals(Object obj) {
// Deliberately unsuitable for general-purpose use, but helps catch bugs faster.
CanonicalMatrix that = (CanonicalMatrix)obj;
for (int i = 0; i < a.length; i++) {
if (a[i] != that.a[i]) return false;
}
return true;
}
@Override public int hashCode() {
return hash;
}
}
}
Salva come HankelCombinatorics.java
, compila come javac HankelCombinatorics.java
, esegui come java -Xmx2G HankelCombinatorics
.
Con NUM_THREADS = 4
sulla mia macchina quad-core si ottiene 20420819767436
per n=8
a 50 a 55 secondi trascorsi, con una buona dose di variabilità tra le esecuzioni; Mi aspetto che dovrebbe gestire facilmente lo stesso sulla tua macchina octa-core ma ci vorranno un'ora o più per ottenerlo n=9
.
Come funziona
Dato n
, ci sono matrici 2^(2n-1)
binarie n
x di n
Hankel. Le righe possono essere permutate in n!
modi e le colonne in n!
modi. Tutto quello che dobbiamo fare è evitare il doppio conteggio ...
Se si calcola la somma di ogni riga, quindi né permutando le righe né permutando le colonne si cambia il multiset di somme. Per esempio
0 1 1 0 1
1 1 0 1 0
1 0 1 0 0
0 1 0 0 1
1 0 0 1 0
ha un multiset di somma delle righe {3, 3, 2, 2, 2}
, così come tutte le matrici di Hankelable derivate da esso. Ciò significa che possiamo raggruppare le matrici di Hankel in base a questi multiset di somma delle righe e quindi gestire ogni gruppo in modo indipendente, sfruttando più core del processore.
C'è anche una simmetria sfruttabile: le matrici con più zero di quelle sono in biiezione con le matrici con più di zero.
Doppio conteggio si verifica quando Matrice di Hankel M_1
con la fila permutazione r_1
e colonna permutazione c_1
corrisponde Matrice di Hankel M_2
con la fila permutazione r_2
e colonna permutazione c_2
(con un massimo di due, ma non tutti e tre M_1 = M_2
, r_1 = r_2
, c_1 = c_2
). Le permutazioni di riga e colonna sono indipendenti, quindi se applichiamo fila permutazione r_1
di M_1
riga e permutazione r_2
per M_2
le colonne come multinsiemi devono essere uguali. Quindi per ogni gruppo, calcolo tutti i multiset di colonna ottenuti applicando una permutazione di riga a una matrice nel gruppo. Il modo più semplice per ottenere una rappresentazione canonica dei multiset è ordinare le colonne, e ciò è utile anche nel passaggio successivo.
Avendo ottenuto i distinti set di colonne, dobbiamo scoprire quante delle n!
permutazioni di ciascuna sono uniche. A questo punto, il doppio conteggio può avvenire solo se un determinato multiset di colonna ha colonne duplicate: ciò che dobbiamo fare è contare il numero di occorrenze di ciascuna colonna distinta nel multiset e quindi calcolare il corrispondente coefficiente multinomiale. Poiché le colonne sono ordinate, è facile fare il conteggio.
Alla fine li sommiamo tutti.
La complessità asintotica non è banale da calcolare con la massima precisione, perché dobbiamo fare alcune ipotesi sugli insiemi. Valutiamo l'ordine dei 2^(2n-2) n!
multiset di colonna, prendendo n^2 ln n
tempo per ciascuno (incluso l'ordinamento); se il raggruppamento non richiede più di un ln n
fattore, abbiamo una complessità temporale Theta(4^n n! n^2 ln n)
. Ma poiché i fattori esponenziali dominano completamente quelli polinomiali, lo è Theta(4^n n!) = Theta((4n/e)^n)
.