Sto facendo una diagonalizzazione Lanczos di una matrice sparsa di grandi dimensioni (~ 2 milioni di elementi). Quasi tutti i passaggi dell'algoritmo Lanzcos vengono eseguiti in parallelo sulla GPU, ad eccezione della diagonalizzazione della matrice di Lanczos per verificare la convergenza. Per questo, ho usato l'algoritmo TQLI da Ricette numeriche. Esistono metodi per trovare l'eigensystem di una matrice tridiagonale paralleli o facilmente parallelizzabili? Esiste una versione parallela di TQLI?