Modi per ricostruire pixel mescolati di un file video?


8

Supponiamo di avere un file video in cui l'ordine dei pixel è stato mischiato una volta. Cioè, un ordine casuale è stato definito una volta e applicato a tutti i frame.

Esiste un approccio noto per il recupero dell'ordine iniziale dei pixel?

Ho alcune idee sul recupero della topologia iniziale posizionando i pixel i cui valori sono correlati nello spazio e nel tempo più vicini. Mi chiedo se questo è stato studiato e se sono stati pubblicati algoritmi efficienti.

Anche questo problema può essere pensato come un modo per proiettare su una matrice 2D un insieme di valori che variano nel tempo per poter applicare le tecniche di visione artificiale (come la CNN), con il presupposto che questi valori siano in qualche modo correlati.


1
Sembra un problema con i giocattoli o una sfida di hacking? Almeno sembra non correlato alla crittografia video del mondo reale, perché sarebbe terribile per la larghezza di banda e non molto sicura, mentre crittografare il flusso di byte usando ad esempio AES è veloce e affidabile. Suppongo che una domanda immediata sia: hai dati reali e un problema da risolvere, o stai chiedendo in astratto, solo per interesse?
Neil Slater,

Bene, le potenziali applicazioni non sono correlate alla decrittazione / hacking, ma mirano davvero ad applicare tecniche di visione artificiale a qualsiasi dominio in cui i dati non sono organizzati come immagini ... organizzando comunque i dati come immagini. Quindi, se il problema del giocattolo può essere risolto sui video, credo che potrebbero avere interessanti sviluppi applicati ai dati non nativamente 2D.
Denis Dollfus,

Sembra interessante, anche se penso molto in un modo "provalo e vedi se funziona, scopri in seguito qualsiasi teoria". Non ho motivo di sospettare che la correlazione tra funzionalità in un set di dati arbitrario dovrebbe consentire la costruzione di un grafico a griglia. Sebbene per i set di dati in cui è stato eseguito, posso vedere il ragionamento in cui potrebbe essere utile utilizzare l'analisi delle immagini sui dati riorganizzati. Il fatto che qualcuno abbia o meno osservato questo riordinamento dei pixel dipende dal fatto che si riferirebbe a un problema utile o interessante: non riesco a pensare a uno di questi, ma non sono un ricercatore. . .
Neil Slater,

Ho appena riscontrato
Dilawar,

Risposte:


3

Questo è un affascinante problema combinatorio. Vorrei caratterizzare ogni pixel usando la sua traiettoria temporale completa, quindi incorporarli in una griglia usando i k vicini più vicini. Il vero obiettivo è massimizzare la probabilità che il video sia una sequenza di immagini naturali (della vita reale), che puoi testare con un classificatore, ma potresti riuscire a cavartela con un semplice costo; ad esempio, la somma delle differenze tra i pixel adiacenti. Una volta che hai iniziato a riempire la griglia, i vincoli di scorrevolezza ridurranno lo spazio di ricerca (poiché un pixel dovrà essere vicino a più altri pixel), accelerando così le cose, supponendo che tu stia utilizzando una struttura dati efficiente per interrogare i vicini più vicini; vedi ad esempio http://www.itu.dk/people/pagh/SSS/ann-benchmarks/


4

Non esiste una soluzione generale a ciò, anche se aggiungiamo alcune ipotesi sulla distribuzione, ad esempio, di colori e forme nelle immagini o di accoppiamento temporale, come ad esempio i fotogrammi consecutivi simili.

Problema

Permettere F1,,Fi essere il n cornici originali, ognuna con mpixel. PermetterePessere la permutazione che viene applicata ai pixel di ciascun fotogramma prima di ottenerli. Puoi pensareP come libro di codice del nemico.

Ora, come input stiamo ricevendo P(F1),,P(Fn). L'obiettivo è trovare la permutazione inversaQper ripristinare le immagini. cosìQP=I è la mappa dell'identità e per esempio Q(P(F1))=F1. Nota che non conosciamo nessuno dei frame correttiFi.

Permettere Q1,...,Qm! essere il m! possibili funzioni di permutazione del m pixel.

L'obiettivo è selezionare l'unico j{1,,m!} così che QjP=I.

Nessuna soluzione generale

Sotto il nostro modello statistico questo significa selezionare il Qj che massimizza la probabilità che Qj(P(Fi)) è tratto dalla stessa distribuzione delle statistiche di riferimento per le immagini e delle statistiche temporali tra frame consecutivi Qj(P(Fi) e Qj(P(Fi+1) quale è la nostra conoscenza precedente.

C'è un contro-esempio canonico in cui il nemico ti regala un film confuso con due fotogrammi in cui tutti i pixel sono dello stesso colore, quindin=2, F1=F2 e Qj(F1)=Qj(F2)=F1=F2 per ogni j. Quindi, per tuttij, le statistiche in-frame e inter-frame sono equiprobabili per ciascuna j e non ci fornisce informazioni per selezionare la permutazione della massima verosimiglianza Qj (tranne nel caso degenerato in cui m!=1).

Pertanto, non possiamo garantire l'unicità e il problema è irrisolvibile senza ulteriori ipotesi.

Ulteriori ipotesi

È interessante vedere se siamo in grado di risolvere il problema aggiungendo ulteriori vincoli.

Se limitiamo il nemico a inviarci solo film "reali" e supponendo che ci siano abbastanza pixel e frame diversi da rendere unico Qj con la massima probabilità esiste, dovremmo comunque calcolare le statistiche per O(m!×n) frame permutati per trovare il massimo.

Questa è la rottura del codice della forza bruta.

Per beneficiare delle reti neurali, e in particolare della retro-propagazione, avremmo bisogno di una funzione di perdita differenziabile rispetto all'input (che è una codifica di j o la nostra permutazione Qj). La domanda quindi sarebbe vedere se tale funzione può essere trovata.

Altrimenti il ​​problema è più simile alla crittoanalisi nel caso speciale in cui sappiamo che il libro dei codici del nemico è una permutazione del testo in chiaro (o immagine in chiaro).


La menzione del nemico mi ha fatto domandare se si potesse creare un film confuso che avrebbe due soluzioni che sembrerebbero entrambi film reali.
Denis Dollfus,

Questo è il nocciolo del problema che sto affrontando in questo momento: dsp.stackexchange.com/questions/59808/… . Anche se posso presumere che l'attività (nel video collegato a questo post) sia di riserva e raggruppata.
Dilawar,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.