Perché i riflessi della famiglia non possono diagonalizzare una matrice?


16

Quando si calcola in pratica la fattorizzazione QR, si usano i riflessi della famiglia per azzerare la parte inferiore di una matrice. So che per il calcolo degli autovalori delle matrici simmetriche, il meglio che puoi fare con le riflessioni delle famiglie è portarlo in forma tridiagonale. C'è un modo ovvio per capire perché non può essere completamente diagonale in questo modo? Sto cercando di spiegarlo semplicemente, ma non riesco a trovare una presentazione chiara.

Risposte:


12

Quando si calcolano gli autovalori della matrice simmetrica MRn×n il meglio che si può fare con il riflettore Householder è guidare M in una forma tridiagonale. Come è stato detto nella risposta precedente perché M è simmetrica v'è una somiglianza trasformazione ortogonale che si traduce in una matrice diagonale, cioè, D=STMS . Sarebbe conveniente se potessimo trovare l'azione della matrice ortogonale sconosciuta usando rigorosamente i riflettori Householder calcolando una sequenza di riflettori e applicando da sinistra a eH T M HSHTMHda destra a . Tuttavia, ciò non è possibile a causa del modo in cui il riflettore Householder è progettato per azzerare le colonne. Se dovessimo calcolare il riflettore Householder per azzerare tutti i numeri sotto troviamo \\ \ end {array}} \! \! \ right). Ma ora le voci sono state modificate dal riflettore applicato a sinistra. Pertanto, quando applichiamoM 11 M = (MM11M 12 - M 1 n H T 1 H 1

M=(******)H1TM=(**'*'*'*'0*'*'*'*'0*'*'*'*'0*'*'*'*'0*'*'*'*').
M12-M1nH1TH1a destra non azzererà più la prima riga di lasciando solo . invece * '' \\ * '& *' '& *' '& *' '& *' '\\ \ end {array}} \! \! \ right). Dove non solo non abbiamo azzerato la fila ma potremmo distruggere la struttura zero che abbiamo appena introdotto con il riflettore H ^ T_1 .M 11 H T 1 M = (MM11H T 1
H1TM=(0000)H1TMH1=().
H1T

Tuttavia, quando scegli di guidare su una struttura tridiagonale, la prima riga non verrà toccata dall'azione di , quindi Quindi quando applichiamo lo stesso riflettore da destra otteniamo MH1T

M=()H1TM=(000).
H1TM=(000)H1TMH1=(000000).

Applicata ricorsivamente questo permette di guidare ad un tridiagonale matrice . Puoi completare la diagonalizzazione di efficiente, come menzionato in precedenza, usando le rotazioni di Jacobi o Givens, entrambe trovate nel libro Matub Computations di Golub e Van Loan . Le azioni accumulate della sequenza dei riflettori di Householder e delle rotazioni di Jacobi o Givens ci permettono di trovare l'azione delle matrici ortogonali e senza formarle esplicitamente.MTMSTS


11

Come chiariscono i commenti ad altre risposte, il vero problema qui non è una carenza di matrici della famiglia, ma piuttosto una domanda sul perché i metodi iterativi piuttosto che diretti ("a forma chiusa") sono usati per diagonalizzare (reali) matrici simmetriche (tramite ortogonale somiglianza).

In effetti, qualsiasi matrice ortogonale può essere espressa come prodotto di matrici domestiche , quindi se conoscessimo la forma diagonale di una matrice simmetrica (i suoi autovalori), potremmo risolvere un set completo di autovettori ortogonali e rappresentare il corrispondente cambio di matrice di base come un prodotto delle trasformazioni domestiche in tempo polinomiale.

Quindi passiamo al commento tra parentesi di Victor "diverso dal teorema di Abele" perché stiamo effettivamente chiedendo perché i metodi iterativi dovrebbero essere usati per trovare le radici di un polinomio piuttosto che un metodo diretto . Naturalmente gli autovalori di una vera matrice simmetrica sono le radici del suo caratteristico polinomio, ed è possibile andare anche nella direzione opposta. Dato un vero polinomio con sole radici reali, è possibile costruire una matrice compagna simmetrica tridiagonale da una sequenza di Sturm per il polinomio . Vedi anche quel poster Esercizio 92 di Denis Serre in questo set. Questo è piuttosto utile per mostrare l'equivalenza di quei problemi poiché abbiamo visto (@AndrewWinters) che l'applicazione diretta delle matrici Householder tridiagonizzerà una vera matrice simmetrica.

L'analisi della complessità aritmetica per un metodo iterativo (isolamento della radice) è fornita in Reif (1999), Un algoritmo efficiente per la radice reale e problemi di autovalori tridiagonali simmetrici . L'approccio di Reif migliora le versioni su misura di QR per le matrici associate , fornendo invece di complessità.O(nlog3n)O(n2)

Il teorema di Abel-Galois-Ruffini afferma che nessuna formula generale per radici di polinomi superiori al quarto grado può essere data in termini di radicali (e di solito aritmetica). Tuttavia ci sono forme chiuse per le radici in termini di operazioni più esotiche . In linea di principio si potrebbero basare metodi di autovalutazione / diagonalizzazione su tali approcci , ma si incontrano alcune difficoltà pratiche:

  1. Il radicale Bring (noto anche come ultraradico) è una funzione di una variabile, in questo senso come prendere una radice quadrata. Jerrad (1835 circa) mostrò che la risoluzione della quintica generale poteva essere ridotta alla risoluzione di , in modo che la funzione univariata (usata in aggiunta ai radicali e ad altri aritmetici usuali) consentisse a tutti i quintici di essere risolto.t5+ta=0t(a)

  2. Questo si rompe con i polinomi di grado sei e superiori, sebbene si possano trovare vari modi per risolverli usando le funzioni di sole due variabili. Il 13 ° Problema di Hilbert era la congettura che i polinomi di grado generale sette non potevano essere risolti usando solo le funzioni al massimo di due variabili, ma nel 1957 VI Arnold mostrò che potevano. Tra le famiglie di funzioni multivariabili che possono essere utilizzate per ottenere soluzioni a polinomi di grado arbitrario vi sono integrali di Mellin, funzioni ipergeometriche e theta di Siegel.

  3. nCf:Y2=f(x)f(x)sono ricercati. Una buona scelta porta ad esprimere meno della metà di quelle radici e sembra che questo approccio richieda ripetute prove per ottenerle tutte. Ogni prova comporta la risoluzione di un sistema lineare omogeneo a costo .O(n3)

Pertanto i metodi indiretti / iterativi per isolare le radici reali (equivalenti autovalori delle matrici simmetriche), anche con elevata precisione, presentano attualmente vantaggi pratici rispetto ai metodi diretti / esatti noti per questi problemi.


Alcune note: 1. un metodo pratico per costruire la matrice compagna tridiagonale dalle sequenze di Sturm è stato delineato nei documenti di Fiedler e Schmeisser ; Ho dato un'implementazione di Mathematica qui , e non dovrebbe essere troppo difficile da implementare in un linguaggio più tradizionale.
JM,

2. Rispetto all'approccio della "funzione theta" per le radici polinomiali (che concordo è un po 'troppo ingombrante per l'uso pratico), Umemura delinea un approccio che utilizza le funzioni theta di Riemann .
JM,

2

Per quale motivo ritieni che ciò sia impossibile?

SS=solDsoltsolD

Qualsiasi matrice ortogonale di dimensioni n × n può essere costruita come prodotto al massimo di n tali riflessioni. Wikipedia . Quindi hai questa decomposizione.

Non sono sicuro dell'ultima affermazione, la cito solo (e penso che sia corretta). Per quanto ho capito la tua domanda, si riduce a se una matrice ortogonale può essere scomposta in una sequenza di trasformazioni di Household.


2
Avrei dovuto essere più specifico. Il primo passo per la diagonalizzazione di una matrice simmetrica è applicare Householder fino a quando non è tridiagonale. Successivamente, vengono eseguite le iterazioni QR. Questo processo non può essere completato utilizzando solo trasformazioni Household a forma chiusa. Perché? (diverso dal teorema di Abele)
Victor Liu,

1
Puoi farlo con le rotazioni di Jacobi. Golub e Van Loan scrivono che Jacobi è lo stesso di Givens. Il capofamiglia è solo un altro modo di fare Givens. In pratica, il modo "corretto" potrebbe essere con QR se è più veloce.
potenza

1

n-1KK

In realtà è utile per i metodi in cui si necessita ripetutamente della matrice ortogonale in una forma fattorizzata numericamente stabile.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.