Perché una maggiore larghezza di banda significa un bit rate più elevato nella trasmissione digitale?

Comprendo che domande simili come questa sono state poste in precedenza su questo sito, elencate di seguito. Tuttavia, sono confuso riguardo alle risposte. Se spiego ciò che penso di capire, qualcuno può indicare dove sbaglio?

Inizierò con quello che so:

La legge di Shannon dà il limite superiore teorico

C_{n o i s y} = B * l o g_{2} (1 + \frac{S}{N})

$C_{noisy}=B*log_{2}(1+\frac{S}{N})$

se S = N, quindi C = B

Come N → ∞, C → 0

Come N → 0, C → ∞

La formula di Nyquist indica approssimativamente quanti livelli sono necessari per raggiungere questo limite

C_{n o i s e l e s s} = 2 * B * l o g_{2} M

$C_{noiseless}=2*B*log_{2}M$

(Se non usi abbastanza livelli logici non puoi avvicinarti al limite di Shannon, ma usando sempre più livelli non supererai il limite di Shannon)

Il mio problema è che non riesco a capire perché la larghezza di banda sia correlata al bit rate. Per me sembra che il limite superiore della frequenza che può essere inviato lungo il canale sia il fattore importante.

Ecco un esempio molto semplificato: nessun rumore, 2 livelli logici (0 V e 5 V), nessuna modulazione e una larghezza di banda di 300 Hz (30 Hz - 330 Hz). Avrà un limite di Shannon di ∞ e un limite di Nyquist di 600 bps. Supponi anche che il canale sia un filtro perfetto, quindi qualsiasi cosa al di fuori della larghezza di banda viene completamente dissipata. Quando raddoppio la larghezza di banda, raddoppio il bit rate ecc.

Ma perché è questo? Per la trasmissione digitale a due livelli Con una larghezza di banda di 300 Hz (30 Hz - 330 Hz), il segnale digitale di "0 V" e "5 V" sarà un'onda (approssimativamente) quadrata. Questa onda quadra avrà dissipate le armoniche inferiori a 30 Hz e superiori a 330 Hz, quindi non sarà perfettamente quadrata. Se ha una frequenza fondamentale al minimo di 30 Hz, (quindi "0V" e "5V" cambiano 30 volte al secondo), allora ci sarà una buona quantità di armoniche e una bella onda quadra. Se ha una frequenza fondamentale al massimo 330 Hz, il segnale sarà un'onda sinusoidale pura in quanto non esistono armoniche di ordine superiore per renderlo quadrato. Tuttavia, poiché non vi è alcun rumore, il ricevitore sarà comunque in grado di discriminare gli zeri da quelli. Nel primo caso il bit rate sarà di 60 bps, come gli "0V" e "5V" cambiano 30 volte al secondo. Nel secondo caso la velocità in bit sarà un massimo di 660 bps (se la tensione di commutazione della soglia del ricevitore è esattamente 2,5 V) e leggermente inferiore se la tensione di soglia è diversa.

Tuttavia, ciò differisce dalla risposta prevista di 600 bps per il limite superiore. Nella mia spiegazione è il limite superiore della frequenza del canale che conta, non la differenza tra il limite superiore e inferiore (larghezza di banda). Qualcuno può spiegare cosa ho capito male?

Anche quando la mia logica viene applicata allo stesso esempio ma usando la modulazione FSK (key shift di frequenza), ottengo lo stesso problema.

Se uno zero viene espresso come frequenza portante di 30 Hz, uno viene espresso come frequenza portante di 330 Hz e il segnale di modulazione è 330 Hz, quindi la velocità di bit massima è 660 bps.

Ancora una volta, qualcuno può chiarire il mio malinteso?

Inoltre, perché usare un'onda quadrata in primo luogo? Perché non possiamo semplicemente inviare onde sinusoidali e progettare che i ricevitori abbiano una tensione di soglia di commutazione esattamente nel mezzo tra il valore massimo e minimo dell'onda sin? In questo modo il segnale occuperebbe molta meno larghezza di banda.

Grazie per aver letto!

— Blue7
fonte

Ci scusiamo per la pessima formattazione, non ho visualizzato l'anteprima prima di pubblicare. L'ho risolto ora.

— Blue7,

@Ignacio Vazquez-Abrams, oh ok, mi sorprende; Ho pensato che avrebbe semplificato il mio esempio. 5 o giù di lì Le armoniche di solito generano un'onda quadra abbastanza decente, quindi perché dovresti avere bisogno di frequenze al di fuori della larghezza di banda per evitare distorsioni?

— Blue7,

Invece di pensare a ciò che accade con una banda passante di 30-300 Hz, immagina cosa accadrebbe se la tua banda passante fosse compresa tra 1,0 e 1,3 kHz, ad esempio.

— Il fotone

@ThePhoton: suppongo che in questo caso non sarai in grado di avere armoniche di ordine superiore, perché quando la frequenza fondamentale è 1kHz, la prima armonica è 3KHz, che è molto al di fuori della banda passante. Ma questo mi lascia ancora confuso. Quale sarebbe il danno nella sola trasmissione della frequenza fondamentale?

— Blue7,

prima un po 'di terminologia. Il fondamentale è la stessa cosa della prima armonica. Se il fondamentale è 1 kHz, allora 3 kHz è la terza armonica.

— Il fotone

Risposte:

È un punto sottile, ma il tuo pensiero si sta smarrendo quando pensi a un tono di 330 Hz che in qualche modo trasmette 660 bit / secondo di informazioni. Non lo fa - e in effetti, un tono puro non trasmette alcuna informazione se non la sua presenza o assenza.

Per poter trasmettere informazioni attraverso un canale, è necessario essere in grado di specificare una sequenza arbitraria di stati di segnalazione che devono essere trasmessi e - questo è il punto chiave - essere in grado di distinguere tali stati dall'altra parte.

Con il tuo canale 30-330 Hz, puoi specificare 660 stati al secondo, ma si scoprirà che il 9% di quelle sequenze di stati violerà i limiti di larghezza di banda del canale e sarà indistinguibile dalle altre sequenze di stati all'estremità, quindi non puoi usarli. Questo è il motivo per cui la larghezza di banda delle informazioni risulta essere di 600 b / s.

— Dave Tweed
fonte

In realtà, inviando solo 30 simboli di 2 stati al secondo, la velocità dei dati è di 30 bps. Nyquist ci parla del limite massimo di velocità dati data una larghezza di banda e un numero di stati per simbolo. La codifica FSK scelta non si avvicina a questo limite poiché le frequenze scelte non sono ottimali. Nyquist afferma che possiamo scegliere frequenze migliori.

— le_top,

@le_top: Giusto per essere chiari, non stavo parlando della modulazione di FSK, anche se l'OP lo ha menzionato nella sua domanda. Sto parlando di segnalazione diretta in banda base (ad esempio, due livelli di tensione). Non credo che qualcosa che ho scritto sia valso un voto negativo. Puoi spiegare cosa pensi sia sbagliato in ciò che ho scritto?

— Dave Tweed,

* La presenza o l'assenza del tono 330Hz trasmette informazioni in quanto la sua presenza può essere interpretata come 1 e la sua assenza come 0. La modulazione è attivata / disattivata. * Quindi i 330Hz potrebbero trasmettere informazioni a 660bps in assenza del tono di 30Hz. Quale sarebbe il rumore nella formula di Shannon. * La confusione esisteva ancora dopo aver letto questo. * Non è spiegato che la perdita del 9% sia spiegata dal teorema di campionamento di Nyquist che indica che il segnale è perfettamente ricostruito da esattamente 2B campioni al secondo.

— le_top,

* Se provi a fare di più, hai effetti di aliasing, quindi i simboli di limitazione 2B equivalgono al numero di campioni. * I simboli 2B di ogni 1 bit (2 stati) sono 600 bps con B = 300. * 660 stati sono possibili se i simboli rappresentano almeno 2,2 stati.

— le_top,

@le_top: davvero non capisco dove stai andando con questo. Non abbiamo affatto parlato di sistemi campionati (tempo discreto), quindi la questione dell'aliasing non si pone mai. Qual è il tuo punto rispetto alla domanda in corso?

— Dave Tweed,

Questa è solo una risposta parziale, ma speriamo che arrivi ai punti principali che hai frainteso.

Il mio problema è che non riesco a capire perché la larghezza di banda sia correlata al bit rate. ...

Se uno zero viene espresso come frequenza portante di 30 Hz, uno viene espresso come frequenza portante di 330 Hz e il segnale di modulazione è 330 Hz, quindi la velocità di bit massima è 660 bps.

Se si passa a 30 Hz per uno zero, è necessario disporre di circa 1/60 s circa per sapere davvero che si ha 30 Hz e non 20 Hz o 50 Hz o qualcosa del genere. Davvero in questo caso stai solo digitando il tuo portatore a 300 Hz e il segnale a 30 Hz che viene inviato per 1/660 s durante gli zeri è solo fonte di confusione.

$1/2\Delta{}f$

Quindi in questo esempio la velocità in bit che puoi inviare è di circa 20 kHz, corrispondente a 2 volte la differenza tra le tue frequenze 1 e 0, proprio come la formula di Nyquist ti porta ad aspettarti un codice a 2 livelli.

— Il fotone
fonte

Le tue domande sono valide e il percorso per una corretta comprensione del significato della teoria ;-).

Alla domanda su come più larghezza di banda significhi un bit rate più elevato, la spiegazione può sembrare semplice ma allo stesso tempo essere cattiva.

Ecco una spiegazione "cattiva" che sembra ok. È un inizio per capire perché una banda più grande contiene più dati. Supponiamo che io abbia un primo canale WiFi numero 1 in esecuzione a 1 Mb / s date le condizioni di potenza e codifica. Quindi prendo un altro canale WiFi numero 2 che ha le stesse condizioni di larghezza di banda, potenza e codifica. Funziona anche a 1 Mb / s. Quando sommo i due insieme, ho raddoppiato la larghezza di banda (due canali diversi) e raddoppiato la velocità di trasmissione dei dati (2x1 Mb / s).

Se pensi che questa sembri una spiegazione perfetta, dimentichi che abbiamo anche raddoppiato il potere. Lo stesso vale per il doppio throughput dei dati dovuto alla doppia potenza o alla doppia larghezza di banda. In realtà è un po 'di entrambi.

Se mantengo la stessa potenza totale raddoppiando la larghezza di banda, devo confrontare un primo canale WiFi in esecuzione a 1 Mb / s con la somma di altri due canali WiFi in esecuzione ciascuno alla metà della potenza ricevuta. Non ho intenzione di controllare i fogli dati dei modem WiFi, ma questo sarebbe un esercizio interessante da confrontare con il seguente approccio teorico. Shannon ci aiuta a prevedere cosa accadrà più o meno se la codifica si adatta ai livelli di potenza (come nel caso del WiFi). Se la codifica non si adatta, la velocità dei dati rimane costante fino a quando il livello di ricezione è troppo basso, a quel punto scende a 0.

Quindi Shannon dice: C = B ∗ log2 (1 + S / N). Quando si mantiene la potenza totale, ma raddoppiando la larghezza di banda, C2 = 2 * B * log2 (1+ (S / 2) / N) dove C2 è la velocità dati potenziale. Compilando i numeri reali potremmo supporre che S = 2xN in modo che log2 (1 + 2) = 1.58 e log2 (1 + 1) = 1. Quindi C = B * 1,58 e C2 = B * 2. In altre parole, quando il livello del mio segnale alla massima larghezza di banda è uguale al livello di rumore, la potenziale velocità dei dati è del 26% superiore alla stessa potenza totale emessa in metà della larghezza di banda. Quindi, in teoria, la banda ultra stretta non può essere più efficiente della banda ultrawide basata sul teorema di Shannon. E raddoppiare la larghezza di banda con lo stesso livello di potenza totale non raddoppia la larghezza di banda suggerita dal nostro esempio WiFi. Ma la larghezza di banda è maggiore. Se possiamo trascurare il termine "1" nel log2 dell'espressione di Shannon,

Tuttavia, come ho già detto, la codifica deve adattarsi, deve essere ottimizzata per l'effettiva potenza e larghezza di banda disponibili. Se la codifica rimane la stessa, vado semplicemente da operativo a disfunzionale.

Passando alla tua seconda domanda, se ho un segnale FSK che cambia a 30Hz con due frequenze, allora posso emettere solo a 30bps perché sto emettendo 30 simboli al secondo ciascuno corrispondente a un bit di 1 o 0. Se introduco 4 stati ( = 4 frequenze) introducendo due frequenze tra quelle precedenti perché il mio livello di rumore lo consente, quindi emetto a 4x30 bps = 120 bps. Con FSK, non penso che la larghezza di banda rimanga costante quando si aumenta il numero di stati in questo modo, ma si può sicuramente trovare un modo per mantenerlo più o meno costante (considerando i limiti di 3dB perché lo spettro di frequenza teorico è illimitato).

Perché usare un'onda quadra per il segnale "modulante"? Questa è una scelta in questa codifica che rende "più facile" la decodifica poiché sul lato ricevitore devi semplicemente avere un filtro passa-banda per ogni frequenza. Stai ancora emettendo "onde sinusoidali" - se stai emettendo solo valori "1", hai solo una frequenza. Tuttavia, i cambiamenti di frequenza implicano la presenza di "armoniche" che consentono / accompagnano questi spostamenti di frequenza. Altre codifiche presentano altri vantaggi e svantaggi. Ad esempio, lo spettro di diffusione della sequenza diretta consente di avere un segnale al di sotto del livello di rumore (e quindi avere requisiti di potenza dell'antenna inferiori per un bitrate simile in molte altre codifiche), ma è più difficile decodificare (e quindi richiedere più potenza (di calcolo) e complessità nel circuito di decodifica).

Qualunque sia la codifica scelta, deve rispettare il teorema di Shannon che fissa il limite superiore. Non si può semplicemente applicare Shannon a una codifica come FSK se non si regola il livello di potenza, il numero di stati e altri parametri del segnale FSK quando il livello di rumore o il livello del segnale (distanza) cambia. Shannon ti consente di controllare la potenza minima assoluta per una data larghezza di banda e velocità dati. Il metodo di codifica aumenterà il limite di potenza minima. E quando i livelli di potenza superano questo limite, il bit rate rimarrà semplicemente costante. L'applicazione di Shannon è semplicemente errata se si desidera spiegare che una maggiore larghezza di banda significa un bitrate più elevato. L'esempio WiFi potrebbe benissimo applicarsi in pratica per una spiegazione lì, ma non è la risposta generale basata sul teorema di Shannon.

Modifica: rileggere la domanda "Nel secondo caso la velocità in bit sarà di un massimo di 660 bps". In realtà non capisco fino in fondo come si arriva a 660 bps poiché la frequenza cambia solo 30 volte al secondo e si codifica su due frequenze che sono 1 bit. Da qui i miei 30 bps sopra. Questa codifica consente un periodo completo a 30Hz e 22 periodi completi a 660Hz per ciascun simbolo. Ma 22 periodi non cambiano il fatto che esiste un solo simbolo. Sembra che manchi qualcosa o che il ragionamento sia sbagliato.

Edit2: Ho capito - stai confrontando con il limite di nyquist. Questo limite di nyquist indica il limite superiore della velocità dei dati data una larghezza di banda e il numero di stati per simbolo. Qui, la codifica FSK selezionata non è ottimale. Stai usando 30Hz e 660Hz. Il limite di Nyquist afferma che 30bps = 2 * B * log2 (2), pertanto, la larghezza di banda deve essere almeno B = 15Hz. Senza controllare nei dettagli, si dice più o meno che impostare le frequenze FSK su 645Hz e 660Hz sarebbe una buona ottimizzazione della larghezza di banda (se FSK è altrimenti una codifica ottimale e senza controllare la larghezza di banda precisa dovuta alle armoniche - anche i 15Hz potrebbero essere basso per FSK).

Modifica 3: spiegazione che segue dopo ulteriori analisi per spiegare ulteriormente la fonte di confusione con altre domande e domanda originale.

La formula di Nyquist si basa sul teorema del campionamento che indica che un segnale con una larghezza di banda B è perfettamente ricostruito da esattamente 2B campioni al secondo.
Quindi i campioni 2B possono rappresentare ciascuno un simbolo (l'intensità può determinare quale simbolo).
Un segnale con una larghezza di banda di 300Hz può essere ricostruito con 600 simboli - non più né meno.
Questo è il motivo per cui esiste un "aliasing": la limitazione della larghezza di banda può far sembrare due segnali diversi uguali dopo il campionamento.
Se ogni simbolo rappresenta solo 2 stati, è possibile solo 600 bps.
L'FSK da 30Hz a 330Hz può rappresentare più di 600 bps, ma è necessario considerare più di 2 stati per simbolo. Ma non è più una demodulazione di FSK perché non si può solo considerare la frequenza.

— le_top
fonte