Risoluzione dei problemi di una rete "lenta"


21

Tutti abbiamo lamentato che la "rete" è "lenta" ad un certo punto: potrebbe essere localizzata in una stanza (switch) o un computer, potrebbe essere solo Internet (DNS? Problema del browser?), Potrebbe essere solo un'applicazione (query SQL a esecuzione prolungata? Scansione AV in esecuzione?).

Quando hai escluso ovvi problemi di sistema e / o delle applicazioni, come fai per testare una rete per lentezza o comportamento irregolare? Ti arrampichi sui livelli OSI? In tal caso, come si fa a controllare ogni livello? Cosa fai per assicurarti che la rete fisica sia a posto in un ambiente sconosciuto? Che dire di troppe trasmissioni o di una tempesta di trasmissione? Livello 3 o superiore? traceroute? Altri suggerimenti, metodi, idee? Funzionalità e strumenti indispensabili (mirroring delle porte, SNMP, monitoraggio, ecc.) Per reti di ogni dimensione?



1
forse, ma ho pensato che una wiki avrebbe avuto un po 'più di longevità e avrebbe dato a più persone la possibilità di contribuire.
WuckaChucka,

Prima di tutto devo essere convinto che è "internet"! Più spesso allora non è "internet". La maggior parte degli utenti che ho visitato dicono che le connessioni Internet sono inattivo anche quando stanno provando ad accedere a un file server locale.
tony roth,

2
È perché tutti i tuoi utenti stanno trasmettendo in streaming i feed video della Coppa del Mondo in questo momento!
BillN,

Risposte:


9

tcpdump e WireShark sono i tuoi amici.

Trovo che guardare i pacchetti sul filo di una rete "lenta" contro una "buona" rete sia di solito ciò che individua un problema.

Esistono molti tipi di "lento".

Puoi monitorare la latenza verso siti locali e Internet utilizzando uno strumento come SmokePing. (SmokePing può essere configurato per tenere traccia della latenza ICMP e della latenza del servizio dai servizi TCP)

I tuoi switch dovrebbero tenere traccia dei pacchetti di trasmissione rispetto ai pacchetti unicast. Rappresenta graficamente quel rapporto.

Mi piace anche monitorare i traceroute (controllando i nomi di dominio degli hop dell'ISP tra siti "importanti").

Spero che questi commenti siano d'aiuto.


1
Quando guardi i pacchetti, quali sono alcune cose che stai cercando o "segnali rivelatori" che c'è un problema?
WuckaChucka,

3
Cercare un numero elevato di ritrasmissioni TCP e \ o ripristini TCP. cerca anche un'alta percentuale di traffico broadcast.
joeqwerty,

eccellente. Lo metterei quasi in una risposta separata.
WuckaChucka,

se è possibile utilizzare netmon 3+ da MS, visitare Microsoft Research e scaricare l'analizzatore tcp research.microsoft.com/en-us/downloads/… è piuttosto interessante per i problemi di rete di debug. inoltre c'è una versione a 32 bit se necessario.
tony roth,

+1 per SmokePing. Che, insieme a cose come IPSLA nei router e negli switch Cisco, può fare molto per aiutarti a capire se c'è una rete lenta o un'applicazione lenta.
Christopher Cashell,

6

È difficile dare risposte specifiche poiché il 90% di questo lavoro è un'esperienza che ti insegna dove cercare quale tipo di problema, e l'altro 90% sa dove cercare su Google per avere suggerimenti su dove iniziare.

Di solito provo le cose del sacco di carta come convincere il cliente a dimostrare il problema (principalmente per escludere problemi con le dita e qualsiasi problema che il cliente potrebbe avere descrivendo il suo problema), quindi provo a duplicare il problema su un altro computer. Farlo spesso ti dà un'idea di dove cercare.

Non dimenticare il problema correttivo di un riavvio, soprattutto per i sistemi Windows, anche oggi. In passato era così tanto che chiedevo alla gente "Hai riavviato? Beh, provaci e fammi sapere se il problema persiste" - questo ha risolto una percentuale molto grande dei problemi che mi venivano posti.

Spesso ci sono anche frutti a basso rischio nei problemi di risoluzione DNS e connettività di base (ACL su router, gap d'aria nella rete, ping / traceroutes / mtrs verso siti remoti, ecc.).

Per i servizi su cui hai il controllo diretto, l'esecuzione di nagios o qualcosa per garantire che il servizio sia effettivamente in esecuzione può spesso innescare la risoluzione di problemi prima che i clienti ne parlino. Probabilmente vuoi anche eseguire la raccolta delle statistiche, direttamente tramite Munin o qualcosa del genere, o tramite SNMP a qualcosa come Cactus.

Di solito cerco di far funzionare Cacti contro almeno tutti i miei core switch e firewall; dove possibile, corro cactus contro tutto ciò che posso. In questi casi di solito cerco cose come il numero di errori delle porte o il traffico eccessivo. I grafici del firewall di alcuni dispositivi possono mostrare l'utilizzo della CPU e sessioni simultanee; imparerai a quali soglie il tuo dispositivo firewall inizia ad avere problemi.

Il firewall potrebbe essere in grado di accedere a un dispositivo syslog; in tal caso, registra tutto ciò che puoi e cerca tra quelli per suggerimenti. Questo sarà più facile se esegui qualcosa come syslog-ng o rsyslog o splunk che ti consente di dividere i tuoi registri piuttosto che occuparti di un file monolitico.

Cerco anche di eseguire nfsen almeno all'interno del mio firewall e, laddove possibile, l'uplink al provider di servizi Internet. Questo ti consente di tornare indietro nel tempo per guardare le sessioni per vedere chi stava facendo cosa; questo a volte può catturare comportamenti interessanti.


5

Ecco un paio di strumenti utili per la risoluzione dei problemi di latenza e altri problemi di rete:

  • la modalità OSI l - inizia dal basso e procedi verso l'alto
  • ping - controlla il tuo RTT (es. latenza)
  • Ping HTTP : utile se il firewall blocca i normali ICMP
  • ping -r 9 - utile per identificare situazioni di routing asimmetriche
  • traceroute - come arrivano i miei pacchetti e come rispondono i router lungo il percorso? Tenere presente che i router spesso elaborano questi pacchetti con una priorità bassa, quindi le prestazioni reali potrebbero essere migliori.
  • Wireshark : richiede un po 'di esperienza, ma non puoi ottenere molto di livello inferiore
  • SpeedGuide.net TCP / IP Analyzer - controlla le impostazioni TCP del tuo PC
  • SG TCP Optimizer - (solo Windows) suggerisce modi per ottimizzare le impostazioni della scheda di rete
  • IP Chicken : qual è il tuo indirizzo IP di origine (non NAT'd)?
  • http://downforeveryoneorjustme.com/ - forse è si ...
  • Test della velocità della larghezza di banda : controlla le velocità di download / upload
  • Strumenti di rete : esegui strumenti / test al di fuori della tua rete
  • controlla le porte della tua rete per errori / CRC / ecc. -
  • controlla la tua rete per utilizzo eccessivo (monitor della larghezza di banda) e tempeste di trasmissione
  • verificare l'inondazione unicast: utilizzare WireShark e monitorare il traffico unicast non destinato alla workstation.
  • verifica che il bridge radice spanning tree sia posizionato correttamente

Se il ping -r scade, cosa dice? Ad esempio, una ping 8.8.8.8funziona, ma ping -r 9 8.8.8.8pretende molto
Michiel van Vaardegem

4

Se gestisci una rete wireless, uno dei rallentamenti frequenti è l'interferenza del canale. Un gruppo di SSID in un'area può davvero rallentare il traffico di rete. (Pensa: la demo di iPhone 4 al WWDC '10).

La risoluzione di questo problema è abbastanza semplice se con un software in grado di mostrare i modelli di traffico wireless nell'area. Ce n'è uno gratuito e basato sul Web all'indirizzo: http://meraki.com/tools/stumbler . (divulgazione: lavoro per Meraki)

Per ridurre le interferenze, è meglio essere sui canali 1, 6 o 11. Anche l'utilizzo dell'ingranaggio 802.11n con la frequenza di 5 GHz potrebbe aiutare.


1

Comincio sempre con il monitoraggio delle cose del livello 2 usando Cacti . Ciò ti fornirà una buona quantità di dati che puoi utilizzare per cercare modelli e puoi confrontare i tuoi grafici di cactus quando tutto funziona bene rispetto a quando gli utenti vedono la lentezza.

Probabilmente non troverà il problema esatto, ma ti darà un buon punto di partenza per aiutarti a restringere il problema.


Qualcosa in particolare che stai cercando nei grafici dei cactus?
WuckaChucka,

1

Comincio dal router più esterno e scendo e misuro le prestazioni nel modo più primitivo: uso un sito di test della larghezza di banda o un sito FTP esterno noto che ti darà la tua velocità di upload / download e continuerò a scendere fino a quando trova il livello in cui si trova il problema.

Una volta che sai dove si trova il problema, distribuisci i tuoi strumenti e monitor fantasiosi. Ma non perdere tempo a fare queste cose su ogni livello. Ci vorrà un'eternità.


Che dire delle prestazioni interne delle applicazioni?
WuckaChucka,

@wuckachucka: in genere se si verifica un problema con il codice, questo viene visualizzato in tutti i registri, quindi la risoluzione dei problemi non è poi così grave. Sai anche da dove iniziare (l'applicazione). Il problema più grande con la risoluzione dei problemi di rete è TROVARE il problema. Se si hanno disallineamenti della velocità delle porte o MTU errati o altri problemi fisici, questi sono un bastardo completo per la risoluzione dei problemi tramite i registri e l'approccio cavernicolo ha molti vantaggi lì.
Satanicpuppy,

1

Devi anche conoscere i tuoi server e l'ambiente desktop / client, piuttosto che supporre che l'utente sia corretto quando dicono "la rete è lenta". È necessario risolvere metodicamente ogni problema: come altri hanno già detto, dovresti prima essere in grado di visualizzare e riprodurre idealmente l'errore, quindi lavorare da lì in modo logico per lo scenario.

Avere una buona gestione e monitoraggio sulla rete e sui server può farti risparmiare un sacco di tempo, tuttavia, perché non stai provando a trovare strumenti al volo mentre potresti anche cercare di mitigare o correggere i sintomi e gestire gli utenti che si lamentano /i clienti.

Le risposte per tcpdump e WireShark non sono sbagliate, quelle possono essere parti vitali del tuo toolkit. Ma a meno che tu non sia completamente sicuro che si tratti effettivamente della rete, non dovrebbero essere la prima cosa che cerchi.


0

La rete lenta è un fenomeno comune. La bassa velocità della rete può essere causata da una serie di cose. risolvere i problemi della rete lenta è uno dei lavori più comuni e problematici nella gestione quotidiana della rete.

Secondo l'analisi, i motivi principali della rete lenta sono:

Loopback
Broadcast/Multicast storm
Virus attack
Server slow response
Too many clients
Application slow response
Error client mask

Come possiamo scoprire rapidamente la causa della rete lenta? È una buona idea acquisire e analizzare i pacchetti con un analizzatore di rete (Ax3soft Unicorn, WireShark e così via).

Leggi anche l'articolo "Trova motivi per rete lenta", facendo clic sull'URL ( http://www.ids-sax2.com//Unicorn/Tutorials/Find-Reasons-for-Slow-Network-with-Ax3soft-Unicorn .htm ) per visitarlo.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.