Perché gli statistici hanno definito matrici casuali?


18

Ho studiato matematica dieci anni fa, quindi ho un background matematico e statistico, ma questa domanda mi sta uccidendo.

Questa domanda è ancora un po 'filosofica per me. Perché gli statistici hanno sviluppato tutti i tipi di tecniche per lavorare con matrici casuali? Voglio dire, un vettore casuale non ha risolto il problema? In caso contrario, qual è la media delle diverse colonne di una matrice casuale? Anderson (2003, Wiley) considera un vettore casuale un caso speciale di una matrice casuale con una sola colonna.

Non vedo il punto di avere matrici casuali (e sono sicuro che sono perché sono ignorante). Ma abbi pazienza. Immagina di avere un modello con 20 variabili casuali. Se voglio calcolare la funzione di probabilità congiunta, perché dovrei immaginarli come una matrice anziché un vettore?

Cosa mi sto perdendo?

ps: mi dispiace per la domanda scarsamente etichettata, ma non c'erano tag per la matrice casuale e non posso ancora crearne una!

modifica: ha cambiato la matrice in matrici nel titolo


1
Penso che tu stia pensando concettualmente a questo come un vettore casuale che è stato riorganizzato in modo che sia matrice.
Matthew Gunn,


9
Potresti anche chiedere perché le matrici sono di qualche interesse. È perfettamente naturale vedere come casuale qualsiasi matrice utilizzata per rappresentare un fenomeno osservato o misurato nel mondo reale. Ciò si traduce in una pletora di possibili tipi e modelli per matrici casuali, che vanno dalle matrici di adiacenza dei grafici casuali alle matrici di covarianza campione e altro ancora.
whuber

2
@Aksakal Penso che il punto dell'OP sia quando è utile analizzare qualcosa come matrici casuali. ad es. nella classificazione delle immagini di solito trasformi le tue matrici di immagini in vettori ... non esiste una "analisi" di matrice. così il commento di whuber è la migliore risposta finora: ad esempio una matrice di covarianza deve essere semi definita positiva - se si desidera simulare matrici di covarianza casuali è più facile lavorare con una specifica di matrice piuttosto che un vettore.
seanv507,

2
Le matrici casuali sono solo un caso speciale di tensori casuali.
Anony-Mousse -Restinata Monica

Risposte:


23

Dipende dal campo in cui ti trovi ma, una delle grandi spinte iniziali per lo studio delle matrici casuali è nata dalla fisica atomica ed è stata introdotta da Wigner. Puoi trovare una breve panoramica qui . In particolare, sono stati gli autovalori (che sono i livelli di energia nella fisica atomica) delle matrici casuali a generare tonnellate di interesse perché le correlazioni tra autovalori hanno fornito informazioni sullo spettro di emissione dei processi di decadimento nucleare.

Più recentemente, c'è stata una grande rinascita in questo campo, con l'avvento della / e distribuzione / e Tracy-Widom per i più grandi autovalori di matrici casuali, insieme a sorprendenti connessioni a campi apparentemente non correlati, come la teoria della piastrellatura , la fisica statistica, integrabile sistemi , fenomeni KPZ , combinatoria casuale e persino l' ipotesi di Riemann . Puoi trovare altri esempi qui .

Per esempi più concreti, una domanda naturale da porre su una matrice di vettori di riga è l'aspetto dei suoi componenti PCA. È possibile ottenere preventivi euristici per questo assumendo i dati provengono da una certa distribuzione, e poi guardando autovalori matrice di covarianza, che sarà essere previsti dalla matrice casuale di universalità : a prescindere (entro limiti ragionevoli) della distribuzione dei vettori, la distribuzione di limitazione della gli autovalori si avvicinano sempre a un insieme di classi note. Puoi pensarlo come una specie di CLT per matrici casuali. Vedi questo documento per esempi.


Grazie per la tua risposta. Sospettavo che potesse essere collegato ad alcuni tecnicismi matematici. Ma ora ha tutto un senso, la fisica è sempre stata intorno alla matematica e viceversa.
Eduardo,

Di Wigner carta era in metà del 1950, di Wishart carta era nella fine degli anni 1920. Quindi, è difficile affermare che Wigner abbia dato la prima grande spinta, secondo me.
Aksakal,

13

Sembra che tu ti senta a tuo agio con le applicazioni di vettori casuali. Ad esempio, mi occupo di questo tipo di vettori casuali ogni giorno: tassi di interesse di diversi tenori. La Federal Reserve Bank ha serie H15 , guarda i buoni del tesoro di 4 settimane, 3 mesi, 6 mesi e 1 anno. Puoi pensare a queste 4 tariffe come un vettore con 4 elementi. È anche abbastanza casuale, guarda i valori storici nella trama qui sotto.

inserisci qui la descrizione dell'immagine

Come con qualsiasi numero casuale, potremmo chiederci: qual è la covarianza tra di loro? Ora ottieni la matrice di covarianza 4x4. Se lo si stima su dati giornalieri di un mese, si ottengono 12 matrici di covarianza diverse ogni anno, se si desidera che non si sovrappongano. La matrice di covarianza campione di serie casuali è essa stessa un oggetto casuale, vedi l'articolo di Wishart "LA DISTRIBUZIONE DEL MOMENTO DEL PRODOTTO GENERALIZZATO IN CAMPIONI DA UNA NORMALE POPOLAZIONE MULTIVARI." QUI . C'è una distribuzione chiamata dopo di lui.

Questo è un modo per arrivare a matrici casuali. Non c'è da meravigliarsi che la teoria della matrice casuale (RMT) sia usata in finanza, come puoi vedere ora.


1
Dici di stimarlo su "dati di un mese", vuoi dire "dati giornalieri di un mese"?
Giovanni

1
@Giovanni, in questo esempio particolare, sì, tutti i giorni. Tuttavia, alcune serie sono misurate in giornata, come i corsi azionari. Se disponi di un portafoglio di azioni, puoi ottenere matrici di covarianza infragiornaliere a frequenze molto elevate.
Aksakal,

3
+1. Parafrasando qui, ma penso che un modo per motivare le matrici casuali sia che in questi casi siamo spesso interessati alla relazione tra vettori casuali (non solo all'interno). Ciò motiva naturalmente a pensare alle matrici anziché ai vettori.
Cliff AB,

@Aksakal I dati che menzioni arrivano con frequenza mensile e giornaliera. L'ho trovato confuso prima che tu rivedessi il post perché non avrebbe senso stimare una matrice di covarianza usando un mese di dati mensili.
Giovanni

@John, potresti stimare la matrice di covarianza su dati mensili o settimanali, sovrapposti o non sovrapposti ecc. Non esiste un modo giusto per farlo.
Aksakal,

8

Nella fisica teorica le matrici casuali svolgono un ruolo importante per comprendere le caratteristiche universali degli spettri energetici dei sistemi con particolari simmetrie.

Il mio background in fisica teorica può indurmi a presentare un punto di vista leggermente distorto qui, ma vorrei anche spingermi così lontano a suggerire che la popolarità della teoria delle matrici casuali (RMT) abbia avuto origine dalla sua riuscita applicazione in fisica.

Senza entrare troppo nei dettagli, ad esempio gli spettri energetici nella meccanica quantistica possono essere ottenuti calcolando gli autovalori dei sistemi Hamiltoniani, che possono essere espressi come una matrice eremitica. Spesso i fisici non sono interessati a sistemi particolari, ma vogliono sapere quali sono le proprietà generali dei sistemi quantistici che hanno proprietà caotiche, il che porta i valori della matrice eremita hamiltoniana a riempire ergodicamente lo spazio matrice al variare dell'energia o di altri parametri ( ad es. condizioni al contorno). Ciò motiva trattando una classe di sistemi fisici come matrici casuali e osservando le proprietà medie di questi sistemi. Raccomando la letteratura sulla congettura Bohigas-Gianonni-Schmidt se vuoi immergerti in questo più profondo.

In breve, ad esempio, si può dimostrare che i livelli di energia dei sistemi che hanno una simmetria di inversione del tempo si comportano universalmente in modo diverso dai livelli di energia dei sistemi che non hanno una simmetria di inversione del tempo (cosa che accade ad esempio se si aggiunge un campo magnetico). Un calcolo piuttosto breve che utilizza matrici casuali gaussiane può mostrare che i livelli di energia tendono ad essere diversamente vicini in entrambi i sistemi.

Questi risultati possono essere estesi e aiutati a comprendere anche altre simmetrie, che hanno avuto un impatto notevole su diversi campi, come anche la fisica delle particelle o la teoria del trasporto mesoscopico e successivamente anche nei mercati finanziari.


1
questo è il motivo per cui ho lasciato la fisica :) troppo "danno cerebrale"
Aksakal,

Gli statistici come Wishart dove prima dei fisici atomici.
kjetil b halvorsen,

5

Una mappa lineare è una mappa tra spazi vettoriali. Supponiamo di avere una mappa lineare e di aver scelto le basi per i suoi spazi dominio e intervallo. Quindi puoi scrivere una matrice che codifica la mappa lineare. Se vuoi considerare mappe lineari casuali tra questi due spazi, dovresti elaborare una teoria delle matrici casuali. La proiezione casuale è un semplice esempio di una cosa del genere.

Inoltre, ci sono oggetti valutati a matrice / tensore in fisica. Il tensore di stress viscoso è uno di questi (tra un vero zoo). In materiali viscoelastici quasi omogenei, può essere utile modellare le deformazioni (elastiche, viscose, ecc.) E quindi le sollecitazioni puntualmente come un tensore casuale con una piccola varianza. Sebbene ci sia un senso di "mappa lineare" per questo stress / sforzo, è più onesto descrivere questa applicazione di matrici casuali come randomizzare qualcosa che era già una matrice.


4

Il rilevamento della compressione come applicazione nell'elaborazione delle immagini si basa su matrici casuali come misure combinate di un segnale 2D. Le proprietà specifiche di queste matrici, vale a dire la coerenza , sono definite per queste matrici e svolgono un ruolo nella teoria.

Semplificato in modo sostanziale, si scopre che minimizzare la norma L1 di un determinato prodotto di una matrice gaussiana e un segnale di ingresso scarso consente di recuperare molte più informazioni di quanto ci si potrebbe aspettare.

La prima ricerca più notevole in quest'area che conosco è il lavoro della Rice University: http://dsp.rice.edu/research/compressive-sensing/random-matrices

La teoria dei prodotti a matrice come "misure di un segnale" risale almeno alla seconda guerra mondiale. Come mi raccontò un ex professore, testare individualmente ogni esercito arruolato per, diciamo, la sifilide, era proibitivo in termini di costi. Mescolando insieme questi campioni in modo sistematico (mescolando insieme porzioni di ciascun campione di sangue e testandoli) si ridurrebbe il numero di volte in cui un test doveva essere eseguito. Questo potrebbe essere modellato come un vettore binario casuale moltiplicato per una matrice sparsa.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.