Immagina che il tuo requisito sia che tu abbia 3 enormi tabelle (dati strutturati) con circa 30 miliardi di righe ciascuna (dimensione totale di 4 TB) e che i tuoi numerosi utenti simultanei (che sono thread di sistema operativo paralleli su macchine LAN remote) dovranno leggere una parte di i dati attraverso le loro SELELCT DOVE GROUPBY esegue query e altamente simultanei, ad esempio 10.000 letture simultanee allo stesso tempo e anche gli utenti devono inserire (senza aggiornamento) i dati in queste tabelle altamente simultanei come 2000 scrittori simultanei (su tutta la rete LAN del data center) . Gli utenti vorrebbero leggere e inserire il più velocemente possibile da questa memoria in cui ogni lettura e scrittura avverranno entro l'intervallo da ms a 1 secondo.
Quali tecnologie consigliate per soddisfare tali requisiti? Esiste un archivio di dati o un archivio di valori chiave che potrebbero farlo? Il cloud NON è un'opzione.
Alcuni chiarimenti:
Gli utenti NON devono vedere subito i dati e l'eventuale coerenza è accettabile. I dati sono accessibili tramite qualsiasi driver che l'archiviazione può fornire e gli utenti sono di nuovo solo thread in esecuzione su macchine remote del data center. Le query sono per lo più come SELEZIONA DOVE GROUPBY.
I dati sono in formato tabulare e ogni riga è di circa 60 byte.
Nessuna opzione cloud in cui non posso usare DynamoDB o soluzioni simili. Devo poterlo ospitare internamente nel data center.
Tutti i dati delle tabelle possono essere letti continuamente e il modello di utilizzo è imprevedibile. Non ci sono join o query super lunghe. Nessun DR richiesto ma è richiesto un HA ragionevole ma non deve essere sofisticato. Ogni lettore sta ottenendo un batch di righe in base alla clausola where e alle righe non sono realmente correlate. Probabilmente possiamo avere una lunghezza fissa per ogni riga, ma spero che il livello di archiviazione se ne preoccupi.
Inoltre, la mia più grande preoccupazione sono tutte quelle scritture simultanee che stanno accadendo con letture simultanee.
Le tue opinioni in merito sono molto apprezzate.
E ancora, ho tre di quelle tabelle con ogni 30 miliardi di righe che contengono diversi tipi di oggetti