Devo assicurarmi che la mia sitemap XML contenga meno rifiuti (collegamenti interrotti). L'elenco di URL è tra le centinaia di migliaia e, anche se potrebbe essere fattibile testarli tutti 1 per 1, preferirei non farlo, per molte ragioni:
1 - Saved bandwidth
2 - Faster traffic for real clients
3 - Less noise in visitor statistics (because my test would count as a visit)
5 - I could go on...
Quindi penso che prendere un sottoinsieme casuale sarebbe sufficiente, il problema è che non conosco le probabilità.
C'è una semplice funzione che posso usare?
Se aiuta, possiamo supporre di avere a priori informazioni sulla probabilità che un collegamento si interrompa tra le corse. Diciamo che su tutte le esecuzioni c'è uno per ogni dato link da rompere.