ProCurve CPU al 100% per alcuni minuti dopo il riavvio


9

Ho effettuato aggiornamenti del firmware negli switch HP. Sono stati aggiornati due diversi modelli:

  • Switch ProCurve 5406zl Intelligent Edge (J8697A): aggiornato da K.15.06.0008 a K.15.12.0012
  • Switch HP 2520-24G-PoE (J9299A): aggiornato da J.14.54 a J.15.09.0021

Controllando ogni interruttore subito dopo aver avviato la nuova immagine, ho osservato qualcosa:

  1. Switch ha caricato la nuova immagine del firmware senza errori e la connettività è stata ripristinata non appena lo switch si è avviato. A questo punto l'utilizzo della CPU era basso (meno del 10%)
  2. Pochi secondi dopo, l'utilizzo della CPU è aumentato fino al 100% e si è fermato lì per diversi minuti. A questo punto non sono riuscito a rilevare alcun problema a parte il fatto che CLI tramite SSH è un po 'lento: connettività normale, nessun messaggio di registro ...
  3. Dopo cinque o dieci minuti al 100%, la CPU è tornata alla normalità senza alcuna modifica da parte mia.

Entrambi i modelli avevano questo comportamento. Ho eseguito il rollback di un'unità di ciascun modello all'immagine del firmware precedente e si sono comportati allo stesso modo.

Nonostante questo picco della CPU subito dopo l'avvio non abbia causato problemi, mi chiedo se il normale comportamento di rete possa essere la causa di questo picco, ma non credo. Ho considerato i seguenti aspetti:

  1. Subito dopo l'avvio STP inizia a funzionare, genera BPDU e attiva ciclicamente tutte le porte dello switch attraverso gli stati Bloking, Listening, Learning e Forwarding. Tuttavia, anche con 802.1D questo processo non richiede più di 1 minuto con i timer predefiniti. Inoltre, stavo controllando gli switch tramite SSH, quindi tutti i calcoli STP erano già stati eseguiti prima che potessi collegarmi allo switch.

  2. Subito dopo l'avvio, la tabella degli indirizzi MAC è vuota e la trasmissione è necessaria per l'inoltro dei primi frame. Ma dubito che questa trasmissione richiederebbe il 100% di CPU, molto meno per 5 minuti, in uno switch a 24 porte.

  3. Tutti gli switch fungono da dispositivi L2, nessuna funzionalità L3 abilita, quindi scarto il routing e altri processi L3.

Mi manca qualcosa di "normale" nelle operazioni di rete che potrebbe spiegare questo utilizzo della CPU per 5 minuti dopo il riavvio mantenendo la connettività? Forse è una sorta di processo in background che lo switch esegue subito dopo il riavvio?

Risposte:


8

Questo ha richiesto meno di 2 secondi su Google: portale di rete HP

Serie di switch HP ProCurve 5400zl - Utilizzo elevato della CPU (99-100%) dopo l'emissione all'avvio

Subito dopo l'avvio dello switch, si osserva un elevato utilizzo della CPU (99-100%). Soluzione

All'avvio dello switch, una delle attività di inizializzazione è la creazione di chiavi di crittografia. Avere le chiavi create in anticipo significa che in seguito, quando una funzionalità come SSL o SSH che utilizza le chiavi viene configurata o utilizzata, si verifica un ritardo minimo nella disponibilità. Questa attività richiede alcuni secondi prima di aumentare, a seconda del modello di switch, della configurazione caricata e della revisione del software. Anche se l'attività consuma fino al 100% della CPU, viene eseguita con una priorità molto bassa. Pertanto, se viene avviata un'altra attività che richiede cicli CPU, questa attività a bassa priorità verrà annullata. Se questa attività di inizializzazione / generazione chiave viene eseguita ininterrottamente da attività con priorità più elevata, il completamento richiede circa 10 minuti. Se la CPU è impegnata con altre attività, il tempo di completamento verrà prolungato.

Per verificare che la CPU elevata vista sia effettivamente ciò che è stato descritto qui e non qualcos'altro che richiede la risoluzione dei problemi, utilizzare i comandi documentati di seguito.

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

L'output sarà simile al seguente.

Switch # task-monitor cpu Switch # show uptime 0000: 00: 01: 42.36 Switch # show cpu

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services

Sono d'accordo che questo sembra descrivere il problema che ho riscontrato. Ma poi mi viene in mente una nuova domanda. Come ho detto, stavo controllando gli switch attraverso la connessione SSH. Se le chiavi SSH vengono generate pochi secondi dopo aver effettuato l'accesso: come è possibile avviare la sessione SSH prima che le chiavi fossero pronte?
Daniel Yuste Aroca,

2
Da Procurve Access Security Guide: quando si genera una coppia di chiavi host sullo switch, lo switch inserisce la coppia di chiavi nella memoria flash (e non nel file running-config). Inoltre, l'interruttore mantiene la coppia di chiavi durante i riavvii, compresi i cicli di accensione. La rimozione (azzeramento) della coppia di chiavi pubblica / privata dello switch rende lo switch non in grado di impegnarsi nel funzionamento SSH e disabilita automaticamente IP SSH sullo switch.
Daniel Yuste Aroca,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.