In questo momento sto cercando di implementare una sorta di buffer di profondità nel software e ho un grosso problema quando ci scrivo. Avere un mutex è assolutamente eccessivo. Quindi ho creato un numero di mutex pari al numero di thread. Sto bloccando un mutex basato sul pixel corrente (pixel_index% mutexes_number) e questo funziona meglio, ma è ancora molto lento. E mi chiedo come sia fatto in una vera GPU? Esiste un algoritmo intelligente o un hardware che lo gestisce?