La deduplicazione dei dati è una tecnologia di archiviazione popolare e popolare che ottimizza la capacità di archiviazione. Elimina i dati ridondanti rimuovendo i dati duplicati dal set di dati, lasciando solo una copia. Come mostrato nella figura seguente. Questa tecnologia può ridurre notevolmente la necessità di archiviazione fisica spazio per soddisfare la crescente domanda di archiviazione dei dati. La tecnologia deduplica può portare molti vantaggi pratici, inclusi principalmente i seguenti aspetti:
(1) | Soddisfare i requisiti ROI (ritorno sull'investimento)/TCO (costo totale di proprietà); |
(2) | La rapida crescita dei dati può essere controllata in modo efficace; |
(3) | Aumentare lo spazio di archiviazione effettivo e migliorare l'efficienza di archiviazione; |
(4) | Risparmiare sul costo totale di archiviazione e sui costi di gestione; |
(5) | Risparmiare la larghezza di banda della rete di trasmissione dei dati; |
(6) | Risparmia sui costi operativi e di manutenzione quali spazio, alimentazione e raffreddamento. |
La tecnologia di deduplica è ampiamente utilizzata nei sistemi di backup e archiviazione dei dati, perché ci sono molti dati duplicati dopo più backup di dati, il che è molto adatto per questa tecnologia. Infatti, la tecnologia di deduplica può essere utilizzata in molte situazioni, inclusi i dati online, dati Near-Line e sistemi di archiviazione dati offline. Può essere implementato in file system, gestori di volumi, NAS e sans.Dedupe può essere utilizzato anche per il ripristino di emergenza, la trasmissione e la sincronizzazione dei dati, poiché una tecnologia di compressione dei dati può essere utilizzata per il confezionamento dei dati. La tecnologia Dedupe può aiutare molte applicazioni a ridurre archiviazione dei dati, risparmio di larghezza di banda di rete, miglioramento dell'efficienza di archiviazione, riduzione della finestra di backup e risparmio sui costi.
La deduplica ha due dimensioni principali: rapporti di deduplicazione e prestazioni. Le prestazioni di deduplicazione dipendono dalla tecnologia di implementazione specifica, mentre la velocità di deduplicazione è determinata dalle caratteristiche dei dati stessi e dai modelli di applicazione, come mostrato nella tabella seguente. I fornitori di storage attualmente riportano tassi di deduplicazione che variano da 20:1 a 500:1.
Tasso di deduplica elevato | Basso tasso di deduplica |
Dati creati dall'utente | Dati dal mondo naturale |
Dati a basso tasso di cambiamento | Dati ad alto tasso di cambiamento |
Dati di riferimento, dati inattivi | Dati attivi |
Applicazione a basso tasso di modifica dei dati | Applicazione con tasso di modifica dei dati elevato |
Backup completo dei dati | Backup incrementale dei dati |
Archiviazione dei dati a lungo termine | Archiviazione dei dati a breve termine |
Ampia gamma di applicazioni dati | Piccola gamma di applicazioni dati |
Elaborazione aziendale continua dei dati | Elaborazione aziendale di dati generali |
Piccola segmentazione dei dati | Segmentazione dei big data |
Allungare la segmentazione dei dati | Segmentazione dei dati a lunghezza fissa |
Contenuto dei dati percepiti | Contenuto dei dati sconosciuto |
Deduplicazione dei dati temporali | Deduplicazione dei dati spaziali |
Punti di implementazione deduplica
È necessario considerare vari fattori quando si sviluppa o si applica la tecnologia Dedupe, poiché questi fattori influiscono direttamente sulle sue prestazioni ed efficacia.
(1) | Che cosa | Quali dati vengono deponderati? |
(2) | Quando | Quando verrà eliminato il peso? |
(3) | Dove | Dov'è l'eliminazione del peso? |
(4) | Come | Come ridurre il peso? |
Tecnologia chiave di deduplica
Il processo di deduplicazione del sistema di archiviazione in generale è questo: prima di tutto il file di dati viene diviso in un insieme di dati, per ogni blocco di dati calcolare l'impronta digitale, quindi in base alle parole chiave di ricerca dell'hash dell'impronta digitale, la corrispondenza indica i dati per il duplicato blocchi di dati, memorizza solo il numero di indice del blocco di dati, altrimenti significa che il blocco di dati è l'unico pezzo di un nuovo blocco di dati di archiviazione e crea meta informazioni rilevanti. Pertanto, un file fisico nel sistema di archiviazione corrisponde a una rappresentazione logica di a set di metadati FP. Durante la lettura del file, leggere prima il file logico, quindi secondo la sequenza FP, estrarre il blocco dati corrispondente dal sistema di archiviazione, ripristinare la copia del file fisico. Può essere visto dal processo sopra che le tecnologie chiave di Dedupe includono principalmente la segmentazione dei blocchi di dati dei file, il calcolo delle impronte digitali dei blocchi di dati e il recupero dei blocchi di dati.
(1) Segmentazione del blocco dati del file
(2) Calcolo dell'impronta digitale del blocco dati
(3) Recupero del blocco dati
Per trovare questi modelli consigliati per avviare la deduplicazione dei pacchetti di rete:
Broker di pacchetti di rete Mylinking™ (NPB) ML-NPB-640048*10GE SFP+ più 4*40GE/100GE QSFP28, massimo 880 Gbps
Broker di pacchetti di rete Mylinking™ (NPB) ML-NPB-56606*40GE/100GE QSFP28 più 48*10GE/25GE SFP28, massimo 1,8 Tbps
Broker di pacchetti di rete Mylinking™ (NPB) ML-NPB-506048*10GE SFP+ più 2*40GE QSFP, massimo 560 Gbps
Broker di pacchetti di rete Mylinking™ (NPB) ML-NPB-486048*10GE SFP+, massimo 480 Gbps, Funzione Plus
Broker di pacchetti di rete Mylinking™ (NPB) ML-NPB-4810SFP+ 48*10GE, massimo 480 Gbps
Broker di pacchetti di rete Mylinking™ (NPB) ML-NPB-2410P24*10GE SFP+, massimo 240 Gbps, funzione DPI
Broker di pacchetti di rete Mylinking™ (NPB) ML-NPB-6400
48*10GE SFP+ più 4*40GE/100GE QSFP28, massimo 880 Gbps
Orario di pubblicazione: 18 ottobre 2022