Che cos'è una rete di archiviazione e quali vantaggi offre rispetto alle diverse soluzioni di archiviazione?


35

Propongo che si tratti di una domanda canonica sulle reti di archiviazione di livello aziendale.

Che cos'è una rete di archiviazione (SAN) e come funziona?
In che cosa differisce da un NAS (Network Attached Storage)?
Quali sono i casi d'uso rispetto all'archiviazione diretta (DAS)?
In che modo è meglio o peggio?
perché è così costoso?
Dovrei (o la mia azienda) usarne uno?


@Basil: pensi che la domanda dovrebbe riguardare anche i NAS? Sono cose fondamentalmente diverse dalla SAN (e c'è già una domanda a confronto: serverfault.com/questions/81723/… ). Volevo che questo fosse specifico per le SAN. Non rimuoverò la tua modifica, ma apprezzerei un feedback della community su questo.
Massimo

Il servizio di file è in genere una funzione della maggior parte dei dispositivi di archiviazione sul mercato ora che la maggior parte delle persone chiamerebbe una "SAN".
Basilio,

Penso che la domanda che ho collegato copra abbastanza bene, e anche i NAS sono concettualmente molto più semplici (sono fondamentalmente file server). Una SAN è più complessa, modulare e costosa. L'ampliamento dell'ambito di questa domanda a tutte le forme di archiviazione lo renderebbe troppo ampio. Questa è, ovviamente, la mia opinione.
Massimo

Il mio punto è che ogni soluzione di archiviazione che puoi ottenere ora ha un servizio di file integrato. EMC, HDS, IBM, HP, Netapp (ovviamente), Dell. Non puoi parlare di una "SAN" (di nuovo, un termine improprio, dal momento che in realtà è quello che descrivi come livello di connettività) senza parlare della pubblicazione dei file. Potresti saltare nella stanza delle comunicazioni?
Basil,

1
Mi piace come è andata a finire. Penso che sia meglio focalizzare questa domanda su cosa sia una SAN e menzionare solo il NAS di passaggio. Quella domanda più vecchia su "qual è la differenza tra SAN, NAS, DAS?" potrebbe essere aggiornato un po 'e trasformato in una domanda e risposta canonica da solo.
Reparto - Ripristina Monica

Risposte:


45

Prima di tutto, per un (ampio) confronto tra DAS, NAS e SAN storage vedi qui .


Esistono alcune idee sbagliate comuni sul termine " SAN ", che significa " Storage Area Network " e come tale, in senso stretto , si riferisce solo all'infrastruttura di comunicazione che collega i dispositivi di archiviazione (array di dischi, librerie di nastri, ecc.) E agli utenti di archiviazione (server ). Tuttavia, nella pratica comune il termine "SAN" è usato per riferirsi a due cose:

  1. Un'infrastruttura di archiviazione completa, incluso tutto l'hardware e il software coinvolti nella fornitura di accesso condiviso ai dispositivi di archiviazione centrali da più server. Questo utilizzo, sebbene non strettamente corretto, è comunemente accettato e ciò a cui la maggior parte delle persone fa riferimento quando si parla di "SAN". Il resto di questa risposta si concentrerà su di essa, descrivendo così ogni componente di un'infrastruttura di archiviazione a livello aziendale.
  2. Un singolo array di archiviazione (vedi più avanti); come in "abbiamo una SAN Brand X con 20 TB di spazio di archiviazione". Questo utilizzo è fondamentalmente errato, perché non tiene nemmeno conto del vero significato di "SAN" e presuppone solo che sia una qualche forma di dispositivo di archiviazione.

Una SAN può essere composta da hardware molto diverso, ma di solito può essere suddivisa in vari componenti:

  • Array di archiviazione : è qui che vengono effettivamente archiviati i dati (e quella che viene erroneamente chiamata "SAN" abbastanza spesso). Sono composti da:
    • Dischi fisici: ovviamente archiviano i dati. Vengono utilizzati dischi di livello aziendale, il che significa che di solito hanno una capacità per disco inferiore, ma prestazioni e affidabilità molto più elevate; inoltre, sono molto più costosi dei dischi di classe consumer. I dischi possono utilizzare una vasta gamma di connessioni e protocolli ( SATA , SAS , FC , ecc.) E diversi supporti di archiviazione (i dischi a stato solido stanno diventando sempre più comuni), a seconda dell'implementazione SAN specifica.
    • Disk Enclosures: qui sono posizionati i dischi. Forniscono loro collegamenti elettrici e dati.
    • Controller / processori di archiviazione: gestiscono l'I / O del disco, il RAID e la memorizzazione nella cache (il termine "controller" o "processore" varia tra i fornitori di SAN). Ancora una volta, vengono utilizzati controller a livello aziendale, quindi hanno prestazioni e affidabilità molto migliori rispetto all'hardware di classe consumer. Possono, e di solito sono, configurati in coppia per ridondanza.
    • Pool di archiviazione : un pool di archiviazione è un mucchio di spazio di archiviazione, comprendente alcuni (spesso molti) dischi in una configurazione RAID. Si chiama "pool" perché sezioni di esso possono essere allocate, ridimensionate e disallocate su richiesta, creando LUN.
    • Numeri di unità logici (LUN): un LUN è un pezzo di spazio disegnato da un lotto di memoria, che viene quindi reso disponibile ("presentato") a uno o più server. Questo viene visto dai server come un volume di archiviazione e può essere formattato da loro usando qualsiasi file system che preferiscono.
  • Librerie nastro: possono essere connesse a una SAN e utilizzare la stessa tecnologia di comunicazione sia per la connessione ai server sia per i backup diretti da storage a nastro.
  • Rete di comunicazione ( la "SAN" vera e propria ): questo è ciò che consente agli utenti di archiviazione (server) di accedere ai dispositivi di archiviazione (array di archiviazione, librerie di nastri, ecc.); è, a rigor di termini, il vero significato del termine "Storage Area Network" e l'unica parte di un'infrastruttura di archiviazione che dovrebbe essere definita come tale. Esistono davvero molte soluzioni per connettere i server ai dispositivi di archiviazione condivisi, ma i più comuni sono:
    • Fibre Channel : una tecnologia che utilizza la fibra ottica per connessioni ad alta velocità allo storage condiviso. Include adattatori bus host , cavi in ​​fibra ottica e switch FC e può raggiungere velocità di trasferimento che vanno da 1 Gbit a 20 Gbit. Inoltre, l' I / O multipath può essere utilizzato per raggruppare diversi collegamenti fisici, consentendo una maggiore larghezza di banda e tolleranza agli errori.
    • iSCSI : un'implementazione delprotocollo SCSI su trasporto IP. Funziona suhardware Ethernet standard, il che significa che può raggiungere velocità di trasferimento da 100 Mbit (generalmente non utilizzate per le SAN) a 100 Gbit. È possibile utilizzare anche l'I / O multipath (sebbene il livello di rete sottostante presenti alcune complessità aggiuntive).
    • Fibre Channel over Ethernet (FCoE) : una tecnologia tra FC completo e iSCSI, che utilizza Ethernet come livello fisico ma FC come protocollo di trasporto, evitando così la necessità di un livello IP nel mezzo.
    • InfiniBand : una tecnologia di connettività ad alte prestazioni, meno utilizzata e piuttosto costosa, ma che può raggiungere unalarghezza di banda impressionante .
  • Host Bus Adapters (HBA): le schede adattatrici utilizzate dai server per accedere al livello di connettività; possono essere adattatori dedicati (come nelle FC SAN) o schede Ethernet standard. Esistono anche HBA iSCSI, che dispongono di una connessione Ethernet standard, ma possono gestire il protocollo iSCSI nell'hardware, sollevando così il server da un carico aggiuntivo.

Una SAN offre molte funzionalità aggiuntive rispetto allo storage collegato direttamente (o fisicamente condiviso):

  • Tolleranza agli errori: l' alta disponibilità è integrata in qualsiasi SAN di livello aziendale ed è gestita a tutti i livelli, dagli alimentatori negli array di archiviazione alle connessioni del server. I dischi sono più affidabili, il RAID viene utilizzato per resistere a guasti a disco singolo (o a disco multiplo), vengono utilizzati controller ridondanti e l'I / O multipath consente l'accesso alla memoria senza interruzioni anche in caso di interruzione del collegamento.
  • Maggiore capacità di archiviazione: le SAN possono contenere molti dispositivi di archiviazione di grandi dimensioni, consentendo spazi di archiviazione molto maggiori di quelli che un singolo server potrebbe raggiungere.
  • Gestione dinamica dell'archiviazione: i volumi di archiviazione (LUN) possono essere creati, ridimensionati e distrutti su richiesta; possono essere spostati da un server all'altro; l'allocazione di memoria aggiuntiva su un server richiede solo alcune configurazioni, anziché acquistare dischi e installarli.
  • Prestazioni: una SAN correttamente configurata, che utilizza tecnologie recenti (sebbene costose), può ottenere prestazioni davvero impressionanti ed è progettata da zero per gestire un carico simultaneo pesante da più server.
  • Replica a livello di archiviazione: due (o più) array di archiviazione possono essere configurati per la replica sincrona, consentendo il reindirizzamento completo dell'I / O del server da uno all'altro in scenari di errore o disastro.
  • Snapshot a livello di archiviazione : la maggior parte degli array di archiviazione consente di scattare istantanee di singoli volumi e / o interi pool di archiviazione. Tali istantanee possono quindi essere ripristinate, se necessario.
  • Backup a livello di archiviazione: la maggior parte delle SAN consente anche di eseguire backup direttamente dagli array di archiviazione alle librerie a nastro connesse alla SAN, bypassando completamente i server che effettivamente utilizzano i dati; vengono utilizzate varie tecniche per garantire l'integrità e la coerenza dei dati.

Sulla base di tutto quanto sopra, i vantaggi dell'utilizzo delle SAN sono evidenti; ma per quanto riguarda i costi per acquistarne uno e la complessità della gestione di uno?

Le SAN sono hardware di livello aziendale (anche se può esserci un caso aziendale per le SAN di piccole dimensioni anche nelle aziende medio-piccole); sono ovviamente altamente personalizzabili, quindi possono variare da "un paio di TB con iSCSI da 1 Gbit e un'affidabilità un po 'elevata" a "diverse centinaia di TB con velocità, prestazioni e affidabilità sorprendenti e una replica sincrona completa su un data center DR"; i costi variano di conseguenza, ma sono generalmente più elevati (come nel "costo totale", così come nel "costo per gigabyte di spazio") rispetto ad altre soluzioni. Non esiste uno standard di prezzo, ma non è raro che anche le SAN di piccole dimensioni abbiano un prezzo compreso tra decine di migliaia (e persino centinaia di migliaia) di dollari.

La progettazione e l'implementazione di una SAN (ancora di più per una fascia alta) richiede competenze specifiche e questo tipo di lavoro viene solitamente svolto da persone altamente specializzate. Le operazioni quotidiane, come la gestione dei LUN, sono notevolmente più semplici, ma in molte aziende la gestione dello stoccaggio è comunque gestita da una persona o un team dedicato.

Indipendentemente dalle considerazioni di cui sopra, le SAN sono la soluzione di archiviazione preferita dove sono richieste elevata capacità, affidabilità e prestazioni.


3
Vota ++ per una risposta così approfondita.
Simon Catlin,

3

Ne hai bisogno? Dipende. £ o $ per TB sono considerevolmente più alti di DAS. Inoltre, temo che la performance di DAS funzioni meglio di FC / AL e iSCSI SAN (beh, almeno nei miei test con DB Oracle e SQL Server). Ma con DAS non si ottengono i vantaggi di poter condividere lo spazio di archiviazione (ottimo per clustering e VMWare).

Numerosi fornitori di storage stanno migrando dal Fibre Channel per le connessioni del controller host-to-storage, a favore di iSCSI, che funziona su Ethernet. È di nuovo la vecchia saga Token-Ring vs Ethernet; Con così tanta ricerca e investimenti nel settore in Ethernet, FC non riesce a tenere il passo. Uno switch Ethernet a 10 Gbps è molto più economico di uno FC a 8 Gbps, inoltre può essere vLANd o segmentato in altro modo per fornire dati di archiviazione e non di archiviazione.

Tuttavia, ci sono alcuni grandi vantaggi delle SAN:

  • Snapshot SAN (punto di ripristino point in time per un server o raccolta di server)
  • Replica a livello di blocco on-site e off-site (senza coinvolgere il server host, quindi non è necessaria una replica basata su software)
  • Backup SAN diretti: se il sistema di backup è in grado di collegarsi e funzionare con la SAN

Se stai pensando di immergere il dito del piede nell'acqua dello storage condiviso, guarda prodotti come il kit HP P4000.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.