Negli ultimi anni con l'avvento della virtualizzazione e più recentemente con Grandi dati (gestione di grandi volumi di dati) sono apparse varianti delle soluzioni esistenti, che coprono nuove esigenze, fornendo capacità di archiviazione ancora maggiori e maggiore ridondanza. Alcuni esempi potrebbero essere i storage mesh o modulare per SAN e VTL.
Alcune di queste soluzioni esistenti sono elencate qui:
TU DAI (Archiviazione collegata diretta)
Questo tipo di archiviazione può essere trovato dai PC di casa ai server. I dischi sono collegati direttamente al bus della scheda madre. Generalmente a basso costo e di solito non è ottimizzato come repository di informazioni poiché è multiuso. Memorizza il sistema operativo e qualsiasi altro software che deve essere eseguito.
Per migliorarne la funzionalità, con due o più dischi è possibile configurare diversi tipi di RAID (Redundant Array of Independent Disks) a seconda delle esigenze dell'utente. In tutti i casi le informazioni sono suddivise in blocchi e il modo di memorizzare questi blocchi lascia il posto a diverse configurazioni logiche.
RAID0 (rimozione)Le informazioni (blocchi) vengono divise e distribuite uniformemente tra due o più dischi. Di solito viene utilizzato per aumentare le prestazioni (lettura/scrittura) ma non ha alcuna parità o ridondanza, se un disco configurato in RAID0 si guasta, le informazioni vengono completamente perse.
RAID1 (mirroring)Utilizza anche due o più dischi, in cui le informazioni vengono archiviate in duplicato (con mirroring), quindi consuma il doppio dei dischi (uno per le informazioni e l'altro per il suo mirror), motivo per cui di solito è l'opzione più costosa dal punto di vista economico .
La perdita di un membro dell'insieme non pregiudica la disponibilità delle informazioni.
RAID 0 + 1/1 + 0Combinazione dei due precedenti. Saranno disponibili la velocità di RAID0 e la ridondanza (e il costo) dei dischi RAID1.
RAID5 (con parità semplice)Hai bisogno di almeno tre dischi. Usa una parità che è distribuita tra tutti i membri. Il calcolo dello spazio di archiviazione disponibile è: dischi totali meno uno.
Se un disco si guasta, viene utilizzata la parità distribuita per calcolare le informazioni mancanti, il che comporta una riduzione delle prestazioni ma le informazioni saranno comunque accessibili.
RAID6 (con doppia parità)Configurazione molto simile a RAID 5 ma è possibile accedere ai dati anche con la perdita di due dischi. Statisticamente parlando, la perdita di dati è molto più improbabile, una probabilità stimata di 1/120.000 rispetto a RAID5 su un gruppo di dischi in esecuzione da 5 anni.
Per entrambe le configurazioni con parità, quando si sostituiscono i dischi guasti, il sistema dovrà ricostruire le informazioni utilizzando gli altri dischi. Questo periodo di tempo dipenderà dal tipo di dischi.
Per quanto riguarda lo spazio disponibile, ecco una tabella comparativa se si trattasse di 10 dischi da 1Tb.
SANTO (rete di archiviazione)
È una rete ad alte prestazioni, in cui l'obiettivo principale è fornire ai sistemi informatici un'elevata capacità di archiviazione, che va da pochi terabyte a petabyte o più …
Originariamente le SAN utilizzavano esclusivamente il protocollo Fibre Channel in cui le informazioni viaggiano attraverso la fibra ottica come un raggio di luce, oggi iSCSI è stato incorporato anche utilizzando il cablaggio Ethernet e, più recentemente, le reti convergenti FCoE, che è lo stesso protocollo Fibre Channel, ma incapsulato in un IP pacchetto. Le informazioni sono accessibili a livello di blocco.
I dispositivi di archiviazione sono generalmente composti da due o più controller (ridondanti tra loro) che gestiscono un insieme di dischi. Ora è anche possibile connettersi a questa rete SAN Backup Libraries, storage e server, tra gli altri.
Al tempo di progettare un SAN sarà necessario considerare:
- Come garantire un'elevata disponibilità, sia attraverso la ridondanza dei suoi componenti (controller, switch, cablaggio, alimentazione, dischi, ecc.),
- scalabilità, quando cresce se si decide di sostituire parti specifiche dell'attrezzatura, sostituirla o acquisirne un'altra per lavorare insieme.
- O caratteristiche specifiche del prodotto che si adatta alle nostre esigenze. Ogni produttore offre diversi tipi di funzionalità e licenze.
SANTO (Archiviazione modulare)
In genere, una configurazione SAN è costituita da due controller in esecuzione active-active (per evitare singoli punti di errore) e un set di dischi configurati nei tipi RAID sopra menzionati. Ogni controller è multifunzionale, indipendentemente sarà in grado di gestire la comunicazione con l'host, la cache interna e il set di dischi. A fronte del guasto di uno di essi, il restante sopporterà il carico transazionale totale, nella maggior parte dei casi con la conseguente diminuzione delle prestazioni complessive del sistema.
Stoccaggio interno SAN è un'opzione economicamente efficace, ma presenta complessità in termini di scalabilità. Poiché due controller o nodi sono il massimo supportato nella maggior parte delle configurazioni, per espandere lo schema di storage, i controller dovranno essere sostituiti da altri con prestazioni più elevate o dovrà essere aggiunta un'altra SAN con il conseguente costo economico e amministrativo.
Negli ultimi anni, due società hanno introdotto sul mercato un nuovo concetto di storage SAN. Si tratta di un cluster multi-nodo, dove inizialmente, come la configurazione SAN standard, è composto da due nodi multifunzione ridondanti. La differenza principale risiede in un'interconnessione dei controllori tramite interruttori formare una maglia o una rete tra tutti i membri. Le informazioni sono distribuite tra tutti i membri e sono accessibili da qualsiasi controller, aumentando le prestazioni ogni volta che viene aggiunto un nodo.
Dischi (Tipi di dischi/connettori)
Canale in fibra otticaÈ un protocollo di trasporto che trasmette comandi SCSI su canali in fibra. Cronologicamente, i dischi Fibre Channel sono stati i primi ad essere utilizzati nelle SAN. Questo tipo di connettività ad alta velocità consente fino a 127 dischi (contro i 15 per SCSI) su una distanza massima di 30 metri.
Sono utilizzati in data center di medie e alte prestazioni, anche se oggi a causa del costo dei dischi l'industria informatica tende a utilizzare SAS, lasciando FC per una nicchia specifica.
Serial Attached SCSI o SASSerial Attached SCSI o SAS è il sostituto di SCSI (parallelo), che è stato utilizzato per più di due decenni. Con prestazioni simili ai dischi FC, costi inferiori ed essendo soggetta agli stessi rigorosi controlli sui suoi componenti, è stata gradualmente in grado di entrare nel segmento aziendale di fascia alta.
NearLine SAS (NL-SAS)Era la risposta alla domanda di storage a basso costo in ambiente aziendale. Si potrebbe dire che sono dischi SATA con un miglior controllo di qualità e interfaccia SAS (ereditando così le sue funzionalità), di conseguenza permette di avere grandi capacità dove le prestazioni non sono la cosa principale.
SSD aziendaleSSD aziendale (Enterprise Solid State Drive), sebbene il suo costo per Gb sia ancora elevato Fornisce le prestazioni più elevate rispetto ad altri tipi di dischi. Non avendo parti in movimento si riducono drasticamente i tempi di accesso alle informazioni. Disponibili con interfaccia SAS o SATA e con capacità fino al terabyte, la loro durata è leggermente inferiore a quella di un disco SAS. Sono spesso usati come memoria cache.
In generale, ci sono tre categorie di dischi se li classifichiamo in base alle loro prestazioni complessive (IOPS, Input Output Per Second): NL-SAS è il più lento e Enterprise SSD all'altra estremità dell'elenco. Questo tipo di raggruppamento o stratificazione delle prestazioni è chiamato livelli.
Diversi produttori offrono, integrate nel firmware dei loro controller o tramite software, funzionalità come "auto tiering", inserendo le informazioni a cui si accede più di frequente nel gruppo dei dispositivi più veloci e al diminuire della richiesta verranno riassegnate ad altri dispositivi con prestazioni inferiori e costo.
NAS (Archiviazione collegata alla rete)
Detto anche "server NAS", è un computer di minor valore economico con un sistema operativo e/o software ottimizzato per l'archiviazione delle informazioni accessibili a livello di file. Non è necessaria una particolare infrastruttura di rete in quanto la comunicazione con i client avviene tramite TCP/IP e i protocolli utilizzati per condividere i file sono: CIFS (Common Internet File System) diffuso in ambiente Windows o nativo NFS (Network File System) Linux.
Viene tradizionalmente utilizzato per la condivisione di file (documenti e multimediali), auditing, repository, ecc., anche se recentemente, poiché la sua disponibilità e prestazioni sono migliorate, viene spesso utilizzato anche per alcuni tipi di database relazionali e virtualizzazione.
Nonostante le sue differenze con SAN, non si escludono a vicenda.
Backup (Backup su nastro)
Questo è il tipo più vecchio di memoria di massa (ed è ancora utilizzato!).
Il backup su nastro ha dovuto affrontare severi test nel corso della sua esistenza, soprattutto quando le tecnologie emergenti sono più pratiche e veloci. I nastri hanno sempre goduto di grandi quantità di spazio di archiviazione rispetto a un disco rigido, stiamo parlando dell'ordine di 15 Tb comprimendo i dati (su un nastro LTO7 di ultima generazione).
Con la tecnologia odierna, ogni nastro ha un'aspettativa di vita di 30 anni o più e questo lo rende il mezzo preferito per l'archiviazione delle informazioni. È importante ricordare che ogni generazione di nastri (LTO-x) ha la compatibilità di due generazioni a ritroso per la lettura e una per la scrittura.
Oggi sono ancora utilizzati per la loro portabilità e rapporto costi/benefici.
VTL (Libreria di nastri virtuali)
Negli ultimi anni, il backup su disco ha guadagnato popolarità grazie ai prezzi più bassi dei dischi e anche al minor intervento da parte dell'utente. Generalmente le sue prestazioni sono superiori poiché non dipende dalla ricerca sequenziale come il nastro.
È un dispositivo che comunica con il software di backup comportandosi come una libreria a nastro, ma l'archiviazione risulta in un set di dischi. In parole povere, è un ibrido. Ha avuto una certa accettazione nei centri di calcolo che li utilizzano come fase intermedia prima del dumping su nastro, riducendo le finestre di sicurezza e ripristino. In alcuni casi è stato utilizzato per sostituire i robot di backup senza sacrificare lo schema in esecuzione. C'è più di un prodotto sul mercato che svolge la stessa funzione ma che è concettualmente distante da una libreria virtuale.