Abbiamo una scatola SAN EMC NX4 che serve una condivisione CIFS a numerosi server di app Windows Server 2008 R2. I server delle app utilizzano la condivisione CIFS per servire molti file di immagine (~ 2500 operazioni al secondo sulla condivisione), tuttavia né la SAN né i server delle app mostrano evidenti segni di stress.
Di tanto in tanto un server delle app, apparentemente all'improvviso, interromperà la connessione alla SAN. Qualsiasi codice .NET che tenta di servire un file dalla SAN non riesce con:
System.IO.IOException: The specified network name is no longer available
Se eseguo il RDP sul server delle app e provo ad accedere a "\ san-name" tramite explorer, visualizzo lo stesso errore. Tutti gli altri server di app possono accedervi perfettamente. Posso anche accedere perfettamente a "\ ip-of-san", anche il ping funziona.
Un riavvio del server delle app risolve il problema, ma questa è una misura un po 'drastica per il problema, dato che sembra che la SAN funzioni correttamente e che il computer possa accedervi - sembra proprio che l'accesso "\ san-name" abbia incrinato.
Questo è successo a due diversi server di app durante l'ultima settimana, quindi non sospetto che la causa sia un singolo server di app. Ignorando la causa per ora - come potrei ripristinare la connessione "\ san-name" senza riavviare la macchina? E posso in qualche modo interrogare cosa è andato storto?
I registri eventi non mostrano nulla (oltre agli errori ASP.NET correlati causati dal problema), né sui server delle app né sulla SAN.
Aggiornamento: in
base ai suggerimenti, la prossima volta proverò a riavviare il servizio Workstation e vedrò se questo risolve il problema. Sicuramente non è una soluzione, ma molto più veloce da fare che riavviare l'intera macchina come ho fatto attualmente. Qualche modo per interrogare lo stato delle connessioni gestite dal servizio Workstation?
Aggiornamento 2:
confermato che il riavvio del servizio Workstation "risolve" il problema. Il prossimo passo è provare la modifica del reg per aumentare il valore MaxCmds. Non riuscirò a confermare se si tratta del problema, posso solo supporre che venga eseguito per un lungo periodo senza problemi.