Comprensione dei componenti Cb e Cr dello spazio colore YCbCr


11

Ho familiarità con gli spazi cromatici additivi (RGB), sottrattivi (CMYK) e simili a quelli di HSV, ma un articolo che sto cercando di capire opera sullo spazio colore YCbCr per la segmentazione delle immagini / definizione dell'oggetto.

Ho trascorso gran parte della mattinata a cercare qualcosa che spiegasse l'YCbCr naturalmente, ma non capisco. Ho avuto una spiegazione piacevole e intuitiva dell'idea generale dietro questo spazio colore qui e una spiegazione di come viene utilizzato per la codifica / compressione delle immagini da questi ragazzi (tutto su foto.SE).

Le formule per il calcolo di YCbCr da RGB sono facilmente accessibili su Wikipedia .

Ho avuto la motivazione per questa rappresentazione, ho capito che il componente Y contiene le informazioni più importanti (per l'occhio umano) in scala di grigi sull'immagine.

Ho capito che Cb e Cr contengono informazioni sui colori e che (a causa della sensibilità dell'occhio umano (in)), possono essere compressi senza una perdita di qualità visibile. Ma cosa rappresentano effettivamente ciascuna delle componenti di crominanza?

Poiché gli autori dell'articolo menzionano che "le informazioni sulla crominanza sono fondamentali nella definizione degli oggetti" nel loro approccio, e non riesco a comprendere appieno cosa sto leggendo con il mio attuale "Y è intensità, Cb e Cr portano in qualche modo informazioni sul colore" di capire YCbCr.

Sto cercando una risposta lungo le linee "Cb è ..., mentre Cr è ..." o "Se immagini di guardare attraverso / con XY, stai effettivamente guardando il componente Cb ...", o alcuni altro modo che mi aiuterebbe a comprendere le informazioni trasportate separatamente da ciascuno dei componenti, non solo il fatto che, insieme, trasportano informazioni sul colore.

MODIFICARE

Consentitemi di fornire esempi di spiegazioni intuitive per altri spazi colore del tipo che sto cercando:

RGB : come brillare una torcia colorata su una parete nera: se brilli con una torcia blu, vedi un riflesso blu. Se aggiungi una torcia rossa, mostrerà un riflesso magenta, che è una miscela di blu e rosso.

CMYK : Come mescolando gli acquerelli, "aggiungi ai colori che la superficie riflette", (cioè sottrae il colore dallo sfondo) quindi se mescoli uno giallo con uno ciano, se rifletti il ​​verde e quindi otterrai un colore verde.

HSV : I bambini piccoli sono attratti da oggetti altamente saturi, non luminosi (valore). Il componente Tonalità è ciò che "dà il colore", mentre una bassa saturazione significa che il colore è "diluito" dal bianco. Il cambiamento di valore rende il tutto più luminoso o più scuro.

Con queste definizioni, sono stato in grado di avere un'idea intuitiva di cosa significhi una rappresentazione di colore in ogni spazio colore, senza memorizzare grafici per ciascuno di essi.

Risposte:


7

YUV (o YCbCr) è come HSV, ma con coordinate diverse. (La differenza tra YUV e YCbCr è marginale, principalmente correlata a formule esatte).

V(S,H)(U,V)HS

U=Scos(H)

V=Ssin(H)

Puoi vedere questo link per maggiori informazioni.

Un'altra cosa da aggiungere al tuo elenco di intuizioni:

La saturazione è quanto sia puro il colore dal punto di vista spettrale . Ad esempio, un laser ha uno spettro molto stretto, il che implica un'elevata saturazione.


puoi aggiungere la spiegazione della differenza tra YUV e YCbCr, per completezza?
penelope,

@Andrey Rubshtein, Se un laser ha un'elevata saturazione, è vero il contrario? In altre parole, se misuro RGB e converto in HSV, l'alta saturazione implica che deve provenire da una sorgente laser coerente? Grazie.
Frank,

@Frank, non necessariamente un laser. Ma è difficile avere un colore saturo con un ampio spettro, poiché più è largo, più è difficile avere una risposta elevata in un solo componente.
Andrey Rubshtein,

@Andrey Rubshtein, grazie per la risposta. Le unità mks di Intensità di saturazione sono energia per unità di tempo per unità di area. . Le unità mks di fluenza energetica di saturazione sono energia per unità di area. dove gli impulsi laser a stato solido sono lunghi, da 10 a 50 ns (nanosecondi). Un'alta saturazione con uno spettro molto stretto implica che deve provenire da una sorgente laser coerente?
Frank,

@Andrey Rubshein. Hai perfettamente ragione ... Ho appena scoperto che i LED emettono una luce praticamente monocromatica, così come le luci al sodio a bassa pressione. Ci sono caratteristiche distintive di puntatori laser coerenti che si potrebbero usare per distinguere i raggi del puntatore laser dall'immagine complessiva osservata attraverso una finestra del cockpit della compagnia aerea Boeing 737?
Frank,

2

Non sono sicuro di cosa significhi "effettivamente" rappresentare, in quanto né RGB né YUV rappresentano né la frequenza dei fotoni né le tipiche risposte dell'asta / cono degli occhi umani. Ma puoi vedere come ti sembrano sintetizzando alcune patch di colore YCrCb, come (1,1,0), (1, -1,0), (1,0,1), (1,0, - 1), ecc.

Ecco una pagina di Wikipedia che include un grafico:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

AGGIUNTO: RGB, e simili, sono stati quasi progettati (o evoluti) per abbinare una possibile comprensione intuitiva umana della percezione (e i nomi dei colori risultano essere appresi culturalmente). YUV è l'opposto, progettato in modo tale che il rumore nell'area UV (aggiunto a un sottosuolo NTSC rumoroso) sia difficile da vedere e quindi più difficile da descrivere. YCrCb è una variazione sulla stessa mappatura dei colori. Quindi non cercare un'intuizione "intuitiva" esistente, che potrebbe non esistere. Forse crearne uno tuo "imparando" il grafico e costruendo alcune nuove connessioni neurali che potrebbero non esistere attualmente nel tuo cervello (o qualcosa del genere).


Ho aggiunto esempi per altri spazi colore del tipo che vorrei ottenere per YCbCr. Spero che questo renda più chiaro il tipo di spiegazione che sto cercando.
penelope,

0

Quando capisci HSV / HSB non dovrebbe essere difficile capire YCbCr. Il canale B in HSB corrisponde al chroma (chroma = saturazione http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/). Potresti prendere l'immagine rgb e convertirla in scala di grigi o puoi convertire tutti i canali dell'RGB in scala di grigi e li uniscono in un canale. Per semplificazione, abbiamo pixel con 100% rosso, 100% verde e 70% blu. Calcolerai la media ... (100 + 100 + 70) / 3 e otterrai un valore del 90%, che significa 90% di luminosità. Quindi in scala di grigi è di colore grigio molto chiaro. Ora, se vogliamo esprimere i colori originali verso il canale della scala di grigi, avremmo bisogno di 3 formule per ogni colore (rosso, verde, blu). Si calcolerebbe la differenza di valore R vs scala di grigi, G vs scala di grigi e B vs scala di grigi. Ciò richiederebbe 4 canali (RGB + chroma). Ma possiamo fare lo stesso con 3 canali. Possiamo fare una piccola correzione al canale verde. Calcoliamo la differenza con il canale verde. Il verde originale è al 100%, il nuovo valore del verde convertito in grigio è del 90%. La differenza è -10%. Quindi cambiamo i canali R e B di questo pixel di questa differenza. Abbiamo appena eseguito la correzione gamma o tutti i canali. I valori del canale verde saranno gli stessi dell'immagine in scala di grigi. Quindi non calcoliamo più con il canale verde. Il verde è "codificato" nel canale Y ... chroma. Anche il resto dei colori (R, B) viene regolato. R` = 90% dell'originale o 100% di Y perché R e B sono uguali in questo esempio. Il composto B ha una differenza + 20% rispetto all'originale, ma dopo essere stato modificato con correzione gamma ha una differenza + 30% verso Y. Per semplificare ancora di più, è come una formula in cui è necessario aggiungere tutti e tre i composti. Le differenze che ottieni per rosso e blu sono Cb e Cr. I personaggi dicono solo che hai confrontato il canale blu con il canale chroma e il canale rosso con il canale Chromma. Quindi Cb e Cr.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.