La soluzione del problema "Micro Burst" nello scenario applicativo di bypass del traffico di rete

In un tipico scenario applicativo NPB, il problema più problematico per gli amministratori è la perdita di pacchetti causata dalla congestione dei pacchetti mirror e delle reti NPB. La perdita di pacchetti in NPB può causare i seguenti sintomi tipici negli strumenti di analisi back-end:

- Viene generato un allarme quando l'indicatore di monitoraggio delle prestazioni del servizio APM diminuisce e il tasso di successo delle transazioni diminuisce

- Viene generato l'allarme di eccezione dell'indicatore di monitoraggio delle prestazioni della rete NPM

- Il sistema di monitoraggio della sicurezza non riesce a rilevare gli attacchi alla rete a causa dell'omissione di eventi

- Eventi di audit del comportamento di perdita del servizio generati dal sistema di audit del servizio

... ...

In quanto sistema centralizzato di acquisizione e distribuzione per il monitoraggio del bypass, l'importanza dell'NPB è evidente. Allo stesso tempo, il modo in cui elabora il traffico di pacchetti dati è molto diverso da quello di un tradizionale switch di rete live, e la tecnologia di controllo della congestione del traffico di molte reti di servizio live non è applicabile all'NPB. Per risolvere la perdita di pacchetti NPB, partiamo dall'analisi della causa principale della perdita di pacchetti.

Analisi della causa principale della congestione della perdita di pacchetti NPB/TAP

Innanzitutto, analizziamo il percorso effettivo del traffico e la relazione di mappatura tra il sistema e il traffico in entrata e in uscita della rete di livello 1 o NPB. Indipendentemente dal tipo di topologia di rete formata da NPB, in quanto sistema di raccolta, esiste una relazione di traffico in ingresso e in uscita di tipo molti-a-molti tra "accesso" e "uscita" dell'intero sistema.

Micro Burst 1

Poi analizzeremo il modello di business di NPB dal punto di vista dei chip ASIC su un singolo dispositivo:

Micro Burst 2

Caratteristica 1: Il "traffico" e la "velocità dell'interfaccia fisica" delle interfacce di input e output sono asimmetrici, con conseguente inevitabile numero di micro-burst. In tipici scenari di aggregazione del traffico molti-a-uno o molti-a-molti, la velocità fisica dell'interfaccia di output è solitamente inferiore alla velocità fisica totale dell'interfaccia di input. Ad esempio, 10 canali di raccolta da 10 Gbps e 1 canale di output da 10 Gbps; in uno scenario di distribuzione multilivello, tutti gli NPBBS possono essere considerati nel loro complesso.

Caratteristica 2: Le risorse di cache dei chip ASIC sono molto limitate. Per quanto riguarda i chip ASIC attualmente più diffusi, un chip con capacità di scambio di 640 Gbps ha una cache di 3-10 Mbyte; un chip con capacità di 3,2 Tbps ha una cache di 20-50 Mbyte. Tra questi, BroadCom, Barefoot, CTC, Marvell e altri produttori di chip ASIC.

Caratteristica 3: Il meccanismo convenzionale di controllo del flusso PFC end-to-end non è applicabile ai servizi NPB. Il fulcro del meccanismo di controllo del flusso PFC è ottenere un feedback di soppressione del traffico end-to-end e, in definitiva, ridurre l'invio di pacchetti allo stack di protocollo dell'endpoint di comunicazione per alleviare la congestione. Tuttavia, la sorgente dei pacchetti dei servizi NPB è costituita da pacchetti mirror, quindi la strategia di elaborazione della congestione può essere solo scartata o memorizzata nella cache.

Di seguito è riportato l'aspetto di un tipico micro-burst sulla curva di flusso:

Micro Burst 3

Prendendo come esempio l'interfaccia 10G, nel diagramma di analisi dell'andamento del traffico di secondo livello, la velocità del traffico si mantiene a circa 3 Gbps per un lungo periodo. Nel grafico di analisi dell'andamento in micromillisecondi, il picco di traffico (MicroBurst) ha ampiamente superato la velocità fisica dell'interfaccia 10G.

Tecniche chiave per mitigare il microburst dell'NPB

Ridurre l'impatto della mancata corrispondenza della velocità dell'interfaccia fisica asimmetrica- Durante la progettazione di una rete, ridurre il più possibile le velocità asimmetriche delle interfacce fisiche di input e output. Un metodo tipico consiste nell'utilizzare un collegamento di uplink con velocità più elevata ed evitare velocità asimmetriche delle interfacce fisiche (ad esempio, copiare contemporaneamente traffico a 1 Gbit/s e 10 Gbit/s).

Ottimizzare la politica di gestione della cache del servizio NPB- La politica di gestione della cache comune applicabile al servizio di switching non è applicabile al servizio di forwarding del servizio NPB. La politica di gestione della cache basata su garanzia statica + condivisione dinamica dovrebbe essere implementata in base alle caratteristiche del servizio NPB, al fine di ridurre al minimo l'impatto dei microburst NPB nell'attuale contesto di limitazione dell'ambiente hardware del chip.

Implementare la gestione dell'ingegneria del traffico classificato- Implementare la gestione della classificazione dei servizi di ingegneria del traffico prioritario basata sulla classificazione del traffico. Garantire la qualità del servizio delle diverse code di priorità in base alle larghezze di banda delle code di categoria e garantire che i pacchetti di traffico di servizio sensibili all'utente possano essere inoltrati senza perdita di pacchetti.

Una soluzione di sistema ragionevole migliora la capacità di memorizzazione nella cache dei pacchetti e la capacità di modellazione del traffico- Integra la soluzione attraverso diverse soluzioni tecniche per espandere la capacità di memorizzazione nella cache dei pacchetti del chip ASIC. Modellando il flusso in punti diversi, il micro-burst diventa una curva di flusso micro-uniforme dopo la modellazione.

Soluzione di gestione del traffico Micro Burst Mylinking™

Schema 1 - Strategia di gestione della cache ottimizzata per la rete + gestione della priorità della qualità del servizio classificato a livello di rete

Strategia di gestione della cache ottimizzata per l'intera rete

Basandosi sulla profonda conoscenza delle caratteristiche del servizio NPB e degli scenari aziendali pratici di un gran numero di clienti, i prodotti di raccolta del traffico Mylinking™ implementano una serie di strategie di gestione della cache NPB "garanzia statica + condivisione dinamica" per l'intera rete, che hanno un impatto positivo sulla gestione della cache del traffico in caso di un gran numero di interfacce di input e output asimmetriche. La tolleranza ai microburst è massimizzata quando la cache del chip ASIC corrente è fissa.

Tecnologia di elaborazione Microburst - Gestione basata sulle priorità aziendali

Micro Burst 4

Quando l'unità di acquisizione del traffico viene distribuita in modo indipendente, è possibile assegnarle una priorità in base all'importanza dello strumento di analisi back-end o dei dati di servizio stessi. Ad esempio, tra i numerosi strumenti di analisi, APM/BPC ha una priorità più elevata rispetto agli strumenti di analisi/monitoraggio della sicurezza, poiché prevede il monitoraggio e l'analisi di vari dati indicatori di importanti sistemi aziendali. Pertanto, in questo scenario, i dati richiesti da APM/BPC possono essere definiti ad alta priorità, i dati richiesti dagli strumenti di monitoraggio/analisi della sicurezza possono essere definiti a media priorità e i dati richiesti da altri strumenti di analisi possono essere definiti a bassa priorità. Quando i pacchetti di dati raccolti entrano nella porta di ingresso, le priorità vengono definite in base all'importanza dei pacchetti. I pacchetti con priorità più elevata vengono inoltrati preferibilmente dopo i pacchetti con priorità più elevata, e i pacchetti con altre priorità vengono inoltrati dopo i pacchetti con priorità più elevata. Se continuano ad arrivare pacchetti con priorità più elevata, i pacchetti con priorità più elevata vengono inoltrati preferibilmente. Se i dati in ingresso superano la capacità di inoltro della porta di uscita per un lungo periodo di tempo, i dati in eccesso vengono memorizzati nella cache del dispositivo. Se la cache è piena, il dispositivo scarta preferibilmente i pacchetti di ordine inferiore. Questo meccanismo di gestione prioritaria garantisce che gli strumenti di analisi chiave possano ottenere in modo efficiente i dati di traffico originali necessari per l'analisi in tempo reale.

Tecnologia di elaborazione Microburst - meccanismo di garanzia della classificazione dell'intera qualità del servizio di rete

Micro Burst 5

Come mostrato nella figura sopra, la tecnologia di classificazione del traffico viene utilizzata per distinguere i diversi servizi su tutti i dispositivi a livello di accesso, di aggregazione/core e di output, e le priorità dei pacchetti acquisiti vengono rimarcate. Il controller SDN fornisce la policy di priorità del traffico in modo centralizzato e la applica ai dispositivi di inoltro. Tutti i dispositivi che partecipano alla rete vengono mappati su code di priorità diverse in base alle priorità trasportate dai pacchetti. In questo modo, i pacchetti con priorità avanzata a basso traffico possono raggiungere una perdita di pacchetti pari a zero. Risolve efficacemente il problema della perdita di pacchetti nei servizi di monitoraggio APM e di bypass del traffico di audit di servizi speciali.

Soluzione 2 - Cache di sistema di espansione a livello GB + schema di modellazione del traffico
Cache estesa del sistema di livello GB
Quando il dispositivo della nostra unità di acquisizione del traffico dispone di capacità di elaborazione funzionali avanzate, può liberare una certa quantità di spazio nella memoria (RAM) del dispositivo come buffer globale del dispositivo, migliorando notevolmente la capacità del buffer del dispositivo. Per un singolo dispositivo di acquisizione, è possibile fornire almeno GB di capacità come spazio cache del dispositivo di acquisizione. Questa tecnologia rende la capacità del buffer della nostra unità di acquisizione del traffico centinaia di volte superiore a quella dei dispositivi di acquisizione tradizionali. A parità di velocità di inoltro, la durata massima dei microburst della nostra unità di acquisizione del traffico aumenta. Il livello di millisecondi supportato dai dispositivi di acquisizione tradizionali è stato portato al secondo livello e il tempo di microburst che può essere supportato è stato aumentato di migliaia di volte.

Capacità di modellazione del traffico multi-coda

Tecnologia di elaborazione Microburst: una soluzione basata su buffer di grandi dimensioni + Traffic Shaping

Micro Burst 6

Grazie a un buffer di grandissima capacità, i dati di traffico generati dai micro-burst vengono memorizzati nella cache e la tecnologia di traffic shaping viene utilizzata nell'interfaccia in uscita per garantire un output fluido dei pacchetti verso lo strumento di analisi. Grazie all'applicazione di questa tecnologia, il fenomeno della perdita di pacchetti causato dai micro-burst viene risolto radicalmente.


Data di pubblicazione: 27 febbraio 2024