Uso HDF5 da anni, ma con l'aumentare delle dimensioni del set di dati sto iniziando a riscontrare gli stessi problemi elencati qui
http://cyrille.rossant.net/moving-away-hdf5/
Puoi indicarmi un formato come HDF5 con - Buon supporto per le scritture parallele - Supporto per l'accesso in blocco di enormi matrici
Il mio caso d'uso tipico è una matrice intera 100k x 100k. Mi piacerebbe averlo come un intero file da una prospettiva logica, ma devo scriverlo pezzo per pezzo con i lavoratori paralleli.