Nello scenario applicativo tipico di NPB, il problema più critico per gli amministratori è la perdita di pacchetti causata dalla congestione dei pacchetti replicati e delle reti NPB. La perdita di pacchetti in NPB può causare i seguenti sintomi tipici negli strumenti di analisi back-end:
- Viene generato un allarme quando l'indicatore di monitoraggio delle prestazioni del servizio APM diminuisce e il tasso di successo delle transazioni diminuisce
- Viene generato l'allarme di eccezione dell'indicatore di monitoraggio delle prestazioni di rete NPM
- Il sistema di monitoraggio della sicurezza non riesce a rilevare gli attacchi di rete a causa dell'omissione di eventi
- Eventi di audit relativi alla perdita di comportamento del servizio generati dal sistema di audit del servizio
...
In quanto sistema centralizzato di acquisizione e distribuzione per il monitoraggio del bypass, l'importanza di NPB è evidente. Allo stesso tempo, il modo in cui elabora il traffico di pacchetti dati è piuttosto diverso da quello di un tradizionale switch di rete attivo, e le tecnologie di controllo della congestione del traffico utilizzate in molte reti di servizio attive non sono applicabili a NPB. Come risolvere la perdita di pacchetti in NPB? Analizziamo le cause principali di tale perdita!
Analisi delle cause principali della congestione da perdita di pacchetti NPB/TAP
Innanzitutto, analizziamo il percorso di traffico effettivo e la relazione di mappatura tra il sistema e il traffico in entrata e in uscita della rete NPB di livello 1 o di livello 2. Indipendentemente dal tipo di topologia di rete che NPB forma, in quanto sistema di raccolta, esiste una relazione di traffico in entrata e in uscita molti-a-molti tra "accesso" e "uscita" dell'intero sistema.
Analizziamo quindi il modello di business di NPB dal punto di vista dei chip ASIC su un singolo dispositivo:
Caratteristica 1La "velocità di traffico" e la "velocità dell'interfaccia fisica" delle interfacce di input e output sono asimmetriche, il che comporta inevitabilmente un elevato numero di micro-burst. Nei tipici scenari di aggregazione del traffico molti-a-uno o molti-a-molti, la velocità fisica dell'interfaccia di output è solitamente inferiore alla velocità fisica totale dell'interfaccia di input. Ad esempio, 10 canali di raccolta a 10G e 1 canale di output a 10G; in uno scenario di implementazione multilivello, tutti gli NPBBS possono essere considerati come un tutt'uno.
Caratteristica 2Le risorse di cache dei chip ASIC sono molto limitate. Per quanto riguarda i chip ASIC attualmente più diffusi, un chip con una capacità di scambio di 640 Gbps ha una cache di 3-10 Mbyte; un chip con una capacità di 3,2 Tbps ha una cache di 20-50 Mbyte. Tra i produttori di chip ASIC figurano BroadCom, Barefoot, CTC, Marvell e altri.
Caratteristica 3Il meccanismo di controllo del flusso PFC end-to-end convenzionale non è applicabile ai servizi NPB. Il fulcro del meccanismo di controllo del flusso PFC è quello di ottenere un feedback di soppressione del traffico end-to-end e, in definitiva, ridurre l'invio di pacchetti allo stack di protocollo dell'endpoint di comunicazione per alleviare la congestione. Tuttavia, la sorgente dei pacchetti dei servizi NPB è costituita da pacchetti replicati, quindi la strategia di gestione della congestione può essere solo quella di scartare o memorizzare nella cache.
Di seguito viene mostrato l'aspetto di un tipico micro-burst sulla curva di flusso:
Prendendo come esempio l'interfaccia 10G, nel diagramma di analisi dell'andamento del traffico di secondo livello, la velocità di traffico si mantiene a circa 3 Gbps per un lungo periodo. Nel grafico di analisi dell'andamento a micro-millisecondi, il picco di traffico (MicroBurst) ha superato di gran lunga la velocità fisica dell'interfaccia 10G.
Tecniche chiave per mitigare il microburst NPB
Ridurre l'impatto della discrepanza asimmetrica della velocità dell'interfaccia fisica- In fase di progettazione di una rete, è opportuno ridurre al minimo le velocità asimmetriche delle interfacce fisiche di input e output. Un metodo tipico consiste nell'utilizzare un collegamento di uplink con velocità più elevata ed evitare velocità asimmetriche delle interfacce fisiche (ad esempio, copiare contemporaneamente traffico a 1 Gbit/s e a 10 Gbit/s).
Ottimizzare la politica di gestione della cache del servizio NPB- La politica di gestione della cache comune applicabile al servizio di switching non è applicabile al servizio di inoltro del servizio NPB. La politica di gestione della cache di garanzia statica + condivisione dinamica dovrebbe essere implementata in base alle caratteristiche del servizio NPB. Al fine di minimizzare l'impatto dei microburst NPB nelle attuali limitazioni dell'ambiente hardware del chip.
Implementare la gestione dell'ingegneria del traffico classificato- Implementare la gestione della classificazione del servizio di ingegneria del traffico prioritario basata sulla classificazione del traffico. Garantire la qualità del servizio delle diverse code di priorità in base alla larghezza di banda delle code di categoria e assicurare che i pacchetti di traffico di servizio sensibili dell'utente possano essere inoltrati senza perdita di pacchetti.
Una soluzione di sistema adeguata migliora la capacità di memorizzazione nella cache dei pacchetti e la capacità di modellazione del traffico.- Integra la soluzione attraverso vari mezzi tecnici per espandere la capacità di caching dei pacchetti del chip ASIC. Modellando il flusso in diverse posizioni, il micro-burst diventa una curva di flusso micro-uniforme dopo la modellazione.
Soluzione Mylinking™ per la gestione del traffico a micro-burst
Schema 1 - Strategia di gestione della cache ottimizzata per la rete + gestione delle priorità di qualità del servizio classificato a livello di rete
Strategia di gestione della cache ottimizzata per l'intera rete.
Grazie alla profonda conoscenza delle caratteristiche del servizio NPB e degli scenari aziendali pratici di un ampio numero di clienti, i prodotti di raccolta del traffico Mylinking™ implementano una strategia di gestione della cache NPB basata su "garanzia statica + condivisione dinamica" per l'intera rete, che si rivela efficace nella gestione della cache del traffico in presenza di un elevato numero di interfacce di input e output asimmetriche. La tolleranza ai microburst viene massimizzata quando la cache del chip ASIC è fissa.
Tecnologia di elaborazione a microburst - Gestione basata sulle priorità aziendali
Quando l'unità di acquisizione del traffico viene distribuita in modo indipendente, è possibile assegnare priorità in base all'importanza dello strumento di analisi back-end o all'importanza dei dati di servizio stessi. Ad esempio, tra i vari strumenti di analisi, APM/BPC ha una priorità più alta rispetto agli strumenti di analisi/monitoraggio della sicurezza, poiché implica il monitoraggio e l'analisi di diversi dati indicatori di importanti sistemi aziendali. Pertanto, in questo scenario, i dati richiesti da APM/BPC possono essere definiti ad alta priorità, i dati richiesti dagli strumenti di monitoraggio/analisi della sicurezza a media priorità e i dati richiesti dagli altri strumenti di analisi a bassa priorità. Quando i pacchetti di dati raccolti entrano nella porta di input, le priorità vengono definite in base alla loro importanza. I pacchetti con priorità più alta vengono inoltrati con priorità maggiore, e i pacchetti con priorità inferiore vengono inoltrati con priorità minore. Se continuano ad arrivare pacchetti con priorità più alta, questi vengono inoltrati con priorità maggiore. Se i dati in ingresso superano la capacità di inoltro della porta di uscita per un lungo periodo di tempo, i dati in eccesso vengono memorizzati nella cache del dispositivo. Se la cache è piena, il dispositivo scarta prioritariamente i pacchetti di ordine inferiore. Questo meccanismo di gestione prioritaria garantisce che i principali strumenti di analisi possano ottenere in modo efficiente i dati di traffico originali necessari per l'analisi in tempo reale.
Tecnologia di elaborazione a microburst: meccanismo di garanzia della classificazione dell'intera qualità del servizio di rete.
Come mostrato nella figura precedente, la tecnologia di classificazione del traffico viene utilizzata per distinguere i diversi servizi su tutti i dispositivi a livello di accesso, aggregazione/core e output, e le priorità dei pacchetti acquisiti vengono rimarcate. Il controller SDN fornisce la policy di priorità del traffico in modo centralizzato e la applica ai dispositivi di inoltro. Tutti i dispositivi che partecipano alla rete vengono mappati a diverse code di priorità in base alle priorità trasportate dai pacchetti. In questo modo, i pacchetti a bassa priorità e con traffico ridotto possono raggiungere una perdita di pacchetti pari a zero. Risolvendo efficacemente il problema della perdita di pacchetti nei servizi di monitoraggio APM e di bypass del traffico di audit di servizi speciali.
Soluzione 2 - Cache di sistema di espansione a livello GB + schema di gestione del traffico
Cache estesa del sistema a livello GB
Quando il dispositivo della nostra unità di acquisizione del traffico possiede capacità di elaborazione avanzate, può liberare una certa quantità di spazio nella memoria (RAM) del dispositivo come buffer globale, migliorando notevolmente la capacità di buffer del dispositivo stesso. Per un singolo dispositivo di acquisizione, è possibile fornire almeno una capacità di GB come spazio cache. Questa tecnologia rende la capacità di buffer della nostra unità di acquisizione del traffico centinaia di volte superiore a quella dei dispositivi di acquisizione tradizionali. A parità di velocità di inoltro, la durata massima dei micro-burst della nostra unità di acquisizione del traffico risulta maggiore. Il livello di millisecondi supportato dalle apparecchiature di acquisizione tradizionali è stato aggiornato al secondo livello e il tempo di micro-burst sopportabile è stato aumentato di migliaia di volte.
Capacità di modellazione del traffico multi-coda
Tecnologia di elaborazione a microburst: una soluzione basata su un ampio buffer caching e sulla modellazione del traffico.
Grazie a una capacità di buffer estremamente elevata, i dati di traffico generati dai micro-burst vengono memorizzati nella cache e la tecnologia di traffic shaping viene utilizzata nell'interfaccia di uscita per garantire un flusso di pacchetti fluido verso lo strumento di analisi. Attraverso l'applicazione di questa tecnologia, il fenomeno della perdita di pacchetti causato dai micro-burst viene risolto in modo fondamentale.
Data di pubblicazione: 27 febbraio 2024





