Ho effettuato aggiornamenti del firmware negli switch HP. Sono stati aggiornati due diversi modelli:
- Switch ProCurve 5406zl Intelligent Edge (J8697A): aggiornato da K.15.06.0008 a K.15.12.0012
- Switch HP 2520-24G-PoE (J9299A): aggiornato da J.14.54 a J.15.09.0021
Controllando ogni interruttore subito dopo aver avviato la nuova immagine, ho osservato qualcosa:
- Switch ha caricato la nuova immagine del firmware senza errori e la connettività è stata ripristinata non appena lo switch si è avviato. A questo punto l'utilizzo della CPU era basso (meno del 10%)
- Pochi secondi dopo, l'utilizzo della CPU è aumentato fino al 100% e si è fermato lì per diversi minuti. A questo punto non sono riuscito a rilevare alcun problema a parte il fatto che CLI tramite SSH è un po 'lento: connettività normale, nessun messaggio di registro ...
- Dopo cinque o dieci minuti al 100%, la CPU è tornata alla normalità senza alcuna modifica da parte mia.
Entrambi i modelli avevano questo comportamento. Ho eseguito il rollback di un'unità di ciascun modello all'immagine del firmware precedente e si sono comportati allo stesso modo.
Nonostante questo picco della CPU subito dopo l'avvio non abbia causato problemi, mi chiedo se il normale comportamento di rete possa essere la causa di questo picco, ma non credo. Ho considerato i seguenti aspetti:
Subito dopo l'avvio STP inizia a funzionare, genera BPDU e attiva ciclicamente tutte le porte dello switch attraverso gli stati Bloking, Listening, Learning e Forwarding. Tuttavia, anche con 802.1D questo processo non richiede più di 1 minuto con i timer predefiniti. Inoltre, stavo controllando gli switch tramite SSH, quindi tutti i calcoli STP erano già stati eseguiti prima che potessi collegarmi allo switch.
Subito dopo l'avvio, la tabella degli indirizzi MAC è vuota e la trasmissione è necessaria per l'inoltro dei primi frame. Ma dubito che questa trasmissione richiederebbe il 100% di CPU, molto meno per 5 minuti, in uno switch a 24 porte.
Tutti gli switch fungono da dispositivi L2, nessuna funzionalità L3 abilita, quindi scarto il routing e altri processi L3.
Mi manca qualcosa di "normale" nelle operazioni di rete che potrebbe spiegare questo utilizzo della CPU per 5 minuti dopo il riavvio mantenendo la connettività? Forse è una sorta di processo in background che lo switch esegue subito dopo il riavvio?