Di recente ho appreso della congettura avida per il problema delle superstringhe più corte .
In questo problema, ci viene data una serie di stringhe e vogliamo trovare la superstringa più corta ovvero tale che ogni appaia come una sottostringa di .
Questo problema è NP-difficile e dopo una lunga sequenza di documenti l'algoritmo di approssimazione più noto per questo problema ha un rapporto [Paluch '14].
In pratica, i biologi usano il seguente algoritmo Greedy:
Ad ogni passaggio, unire due stringhe che hanno la massima sovrapposizione su tutte le coppie (il suffisso massimo che è il prefisso di un'altra stringa) e ripetere su questa nuova istanza fino a quando rimane una sola stringa (che è una superstringa di tutte le stringhe di input )
Un limite inferiore di nel rapporto di approssimazione di questo algoritmo goloso può essere ottenuto dall'ingresso .
Ci sono intuizioni, fatti, osservazioni, esempi che suggeriscono perché questa domanda sia così impegnativa?