È perché è più facile ed economico aumentare la larghezza di banda della DRAM piuttosto che diminuire la latenza. Per ottenere i dati da una fila aperta di ram, è necessaria una quantità non banale di lavoro.
L'indirizzo della colonna deve essere decodificato, i mux che selezionano le linee a cui accedere devono essere guidati e i dati devono spostarsi attraverso il chip verso i buffer di output. Ciò richiede un po 'di tempo, soprattutto se si considera che i chip SDRAM sono prodotti su un processo su misura per densità di ram elevate e velocità logiche non elevate. Per aumentare la larghezza di banda, dire usando DDR (1,2,3 o 4), la maggior parte della logica può essere ampliata o pipeline e può funzionare alla stessa velocità della generazione precedente. L'unica cosa che deve essere più veloce è il driver I / O per i pin DDR.
Al contrario, per ridurre la latenza è necessario velocizzare l'intera operazione, il che è molto più difficile. Molto probabilmente, parti del ram dovrebbero essere realizzate su un processo simile a quello per le CPU ad alta velocità, aumentando sostanzialmente il costo (il processo ad alta velocità è più costoso, inoltre ogni chip deve passare attraverso 2 processi diversi).
Se si confrontano le cache della CPU con RAM e disco rigido / SSD, esiste una relazione inversa tra l'archiviazione è grande e l'archiviazione è veloce. Un L1 $ è molto veloce, ma può contenere solo tra 32 e 256kB di dati. Il motivo per cui è così veloce è perché è piccolo:
- Può essere posizionato molto vicino alla CPU utilizzandolo, il che significa che i dati devono percorrere una distanza più breve per arrivarci
- I cavi su di esso possono essere accorciati, il che significa che richiede meno tempo perché i dati attraversino
- Non occupa molta area o molti transistor, quindi farlo su un processo ottimizzato per la velocità e usare molta potenza per bit memorizzato non è così costoso
Man mano che avanzi nella gerarchia, ogni opzione di archiviazione diventa più grande in termini di capacità, ma anche più grande nell'area e più lontana dal dispositivo che la utilizza, il che significa che il dispositivo deve rallentare.