Capisco (principalmente) come funziona l'analisi indipendente dei componenti (ICA) su un insieme di segnali da una popolazione, ma non riesco a farlo funzionare se le mie osservazioni (matrice X) includono segnali da due diverse popolazioni (con mezzi diversi) e I Mi chiedo se si tratti di una limitazione intrinseca dell'ICA o se posso risolverlo. I miei segnali sono diversi dal tipo comune analizzato in quanto i miei vettori sorgente sono molto brevi (ad esempio 3 valori di lunghezza), ma ho molte (ad esempio migliaia di) osservazioni. In particolare, sto misurando la fluorescenza in 3 colori in cui i segnali di fluorescenza ampia possono "riversarsi" in altri rivelatori. Ho 3 rilevatori e utilizzo 3 diversi fluorofori sulle particelle. Si potrebbe pensare a questo come a una spettroscopia di risoluzione molto scarsa. Qualsiasi particella fluorescente potrebbe avere una quantità arbitraria di uno dei 3 diversi fluorofori. Tuttavia, ho un insieme misto di particelle che tendono ad avere concentrazioni abbastanza distinte di fluorofori. Ad esempio, un set può generalmente avere un sacco di fluoroforo # 1 e poco fluoroforo # 2, mentre l'altro set ha poco di # 1 e molto di # 2.
Fondamentalmente, voglio deconvolgere l'effetto spillover per stimare la quantità effettiva di ciascun fluoroforo su ciascuna particella, piuttosto che avere una frazione del segnale da un fluoroforo che si aggiunge al segnale di un altro. Sembra che questo sarebbe possibile per l'ICA, ma dopo alcuni fallimenti significativi (la trasformazione della matrice sembra dare la priorità alla separazione delle popolazioni piuttosto che alla rotazione per ottimizzare l'indipendenza del segnale), mi chiedo se l'ICA non sia la soluzione giusta o se ho bisogno di pre-elaborare i miei dati in qualche altro modo per risolvere questo problema.
I grafici mostrano i miei dati sintetici utilizzati per dimostrare il problema. Partendo da fonti "vere" (pannello A) costituite da una miscela di 2 popolazioni, ho creato una matrice "vera" di miscelazione (A) e ho calcolato la matrice di osservazione (X) (pannello B). FastICA stima la matrice S (mostrata nel pannello C) e invece di trovare le mie vere fonti, mi sembra che ruoti i dati per minimizzare la covarianza tra le 2 popolazioni.
Alla ricerca di suggerimenti o approfondimenti.