Abbiamo avuto alcuni seri problemi con il ragno (incredibilmente) mal scritto di Yahoo in passato , e di conseguenza li abbiamo bloccati. Marco Arment di Tumblr ha anche condiviso le sue frustrazioni con noi l'31 / 31/2009, che è stato un fattore nel nostro blocco. [Il ragno di Yahoo] ci …
C'è il bot Ask, che imposta questa intestazione: Mozilla/2.0 (compatible; Ask Jeeves/Teoma) Considerando questo, ho le seguenti domande: Se sto scrivendo un web crawler chiamato Pippo, quale user agent dovrei usare? Qual è la differenza se inserisco Mozilla/2.0o Mozilla/5.0? Qualsiasi altro suggerimento su come devo formattare il mio user agent …
I miei registri sono pieni di visitatori bot, spesso dell'Europa orientale e della Cina. I robot sono identificati come Ahrefs, Seznam, LSSRocketCrawler, Yandex, Sogou e così via. Devo bloccare questi robot dal mio sito e perché? Quali hanno uno scopo legittimo nell'aumentare il traffico sul mio sito? Molti di loro …
Come devo interpretare un User-agent vuoto? Ho un codice di analisi personalizzato e quel codice deve analizzare solo il traffico umano. Ho una lista di agenti utente che indica il traffico umano e il traffico bot, ma l'agente utente vuoto si sta rivelando problematico. E sto ricevendo molto traffico con …
L'agente utente in un normale browser contiene 'bot' o 'crawl'? Controllo l'agente utente sul mio sito per vedere se proviene da un bot o meno. Se lo è, posso fare alcune piccole ottimizzazioni poiché non effettuano il login. (Non cambio affatto il contenuto) Dopo aver aggiunto i controlli per 30-40 …
Le voci del registro di accesso di Apache sul mio sito sono in genere come questa: 207.46.13.174 - - [31 / Ott / 2016: 10: 18: 55 +0100] "GET / contact HTTP / 1.1" 200 256 "-" "Mozilla / 5.0 (compatibile; bingbot / 2.0; + http: // www .bing.com / …
Gli user-agent possono essere elencati insieme, seguiti dalle loro regole comuni come in un robots.txt ? User-agent: Googlebot User-agent: ia_archiver #Alexa User-agent: BingPreview #Microsoft User-agent: bingbot #Microsoft User-agent: MSNBot #Microsoft User-agent: Slurp #Yahoo User-agent: Ask Jeeves/Teoma #Ask Disallow: /adm30_buds/
Ho eseguito un piccolo crawler Web e ho dovuto decidere quale agente utente utilizzare per esso. Gli elenchi degli agenti cingolati e Wikipedia suggeriscono il seguente formato: examplebot/1.2 (+http://www.example.com/bot.html) Tuttavia, alcuni robot omettono il segno più davanti all'URL. E mi chiedo cosa significhi in primo luogo, ma non sono riuscito …
Ho un sito che, per ragioni normative, potrebbe non essere indicizzato o cercato automaticamente. Ciò significa che dobbiamo tenere lontani tutti i robot e impedire loro di spiderare il sito. Ovviamente abbiamo avuto un file robots.txt che non consente tutto dall'inizio. Tuttavia, osservare il file robots.txt è qualcosa che solo …
(Domanda di bontà in fondo) Sto riscontrando un problema con un client che accede al nostro sito e la causa principale è che a WAF (Web Application Firewall) non piace la stringa User-Agent: User-Agent: Mozilla/5.0 (X11; Linux i686; rv:34.0; C7QcSBPWTsrpX5YLvVZMqiujEZLWPtOYk3tDZ9WhW18=) Gecko/20100101 Firefox/34.0 In questo caso, la stringa codificata in base64 …
Cosa usi per rilevare il cellulare del visitatore, se possibile fino al modello? Attualmente manteniamo il nostro database, ma è davvero in ritardo a causa della mancanza di manodopera per mantenerlo, quindi abbiamo deciso di provare una soluzione di terze parti. Questi sono i miei candidati ma non ho tempo …
Ho alcuni codici speciali che funzionano solo con i browser HTML5 (semplici elementi di geolocalizzazione). Voglio reindirizzare gli utenti iPhone e Android alla versione m.example.com del mio sito Web. Qual è il modo migliore per farlo?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.