Recentemente l'utilizzo della CPU del motore di routing su due dei nostri router peering Juniper è aumentato dal ~ 10-20% del carico medio all'80 +%. Sto cercando di capire cosa sta causando questo (e come ridurre questo carico elevato).
Alcune informazioni sui router: entrambi eseguono la stessa versione JunOS, entrambi sono collegati alle stesse due LAN IXP peering e hanno un gran numero (diverse centinaia) di sessioni (quasi identiche) IPv4 e IPv6. Entrambi i router hanno una connessione a un diverso provider di transito IP e sono collegati allo stesso modo al resto della nostra rete. Il carico della CPU dei motori di routing non è fisso sull'80 +%, ci sono cadute ai livelli normali da minuti a ore, ma questi cali non sono così frequenti.
Cose che ho controllato:
- non sono state apportate modifiche alla configurazione nel momento in cui è iniziato l'aumento
- non c'è aumento del traffico non unicast diretto al piano di controllo
- non c'è (sostanziale) cambiamento nella quantità di traffico inoltrato (anche se anche un aumento non dovrebbe importare)
show system processes summary
indica che ilrpd
processo sta causando un elevato carico della CPU- non ci sono peer BGP che sbattono rapidamente causando una grande quantità di cambiamenti BGP
Una possibile spiegazione che posso trovare è un peer (o più di uno) su uno dei due router di IXP che sono collegati all'invio di un gran numero di aggiornamenti BGP. Attualmente ho solo statistiche sul numero di messaggi BGP per le mie sessioni di transito (che non mostrano attività anomale) e con diverse centinaia di sessioni BGP sulle LAN di peering non è così facile individuare le sessioni problematiche se dovessi creare grafici per tutte le sessioni.
Le mie domande sono:
- ci sono altre cose che dovrei verificare per trovare la causa di questo aumento del carico della CPU sui motori di routing?
- come posso facilmente scoprire quali sessioni stanno causando questi problemi (se la mia ipotesi è corretta)? L'abilitazione delle traceoption BGP genera enormi quantità di dati, ma non sono sicuro che mi dia delle intuizioni reali.