Perché trattarli come URL con diversa capitalizzazione del percorso e barra finale come diversi?


8

Questi sono tutti URL strettamente diversi:

http://www.example.com/page
http://www.example.com/pAge
http://www.example.com/page/
http://www.example.com/paGE/

Capisco che sia conforme alle rigide regole ISO, ma perché? Quanti siti Web esistono là fuori che trattano effettivamente pagee page/come diversi URL puoi visitare? O effettivamente utilizzare le maiuscole per differenziare i contenuti? Se lo facessero direi loro che probabilmente stanno sbagliando.

Perché dobbiamo perdere tempo a conformarci a queste regole? Non è abbastanza banale che Google lo risolva pagee page/siano la stessa pagina e probabilmente non dovrebbero essere trattati come contenuti duplicati?

Risposte:


10

Capisco che sia conforme alle rigide regole ISO, ma perché?

Esistono diversi sistemi operativi dietro i vari server in rete e per alcuni di essi una directory o un file denominato pagenon è uguale a quello nominato Page. Il risultato è che si tratta in realtà di due posizioni diverse e nemmeno necessariamente dello stesso tipo di posizione (dir / page). Il server Web potrebbe essere configurato senza distinzione tra maiuscole e minuscole, ma non si può presumere che. Pertanto, le regole devono presumere che le cose si preoccupino del caso e se non lo fanno allora. Realisticamente, probabilmente non è una grande idea fare affidamento sulle differenze dei casi, ma la situazione esiste e quindi deve essere presa in considerazione, a volte con cose come mod_speling .

Quanti siti Web esistono là fuori che trattano effettivamente pagina e pagina / come diversi URL che puoi visitare?

Essi sono diversi. È quasi sempre nascosto da te:

  1. Quando vai example.com/foo/sul web server è consapevole che stai andando in una directory, e quindi cerca un file che corrisponda a ciò che è configurato per riconoscere come indice di directory. Quindi alla fine finisci example.com/index.htmlper esempio.
  2. Se vai example.com/foosul server, cerca effettivamente un file nella directory principale chiamato just foo. Se non trova uno, quindi controlla se c'è una directory chiamata /fooe si può arrivare fino a 1 #.

Quello che sembra leggere come un comportamento "normale" in # 2 è in realtà un fallback per gestire un caso probabile.
Quanti usano nomi di file senza estensione è irrilevante. Ancora: vero problema; deve essere preso in considerazione.

Se lo facessero direi loro che probabilmente stanno sbagliando.

Questa è un'opinione.
È possibile eseguire il backup con vari argomenti pratici sull'insensibilità al maiuscolo / minuscolo e su come gestire gli URL senza estensione con i quali non sono necessariamente in disaccordo, ma in realtà si sbaglierebbe a dirlo.


Esempio brutto / irritante per non fare casini con il caso: esiste un sito che gestisco, ma il personale IT del cliente gestisce il server effettivo. L'hanno configurato per reindirizzare tutti gli hit di example.com su www.example.com ma per qualsiasi motivo il reindirizzamento ha anche forzato tutto in lettere minuscole (non mi è stato detto questo). Gli editor del sito stavano caricando ad es. CamelCase.jpg. Qualche altro codice che non controllavo si collegherebbe a quelle immagini senza il www, causando tutti i tipi di sciocche rotture fino a quando non l'abbiamo cacciato.
Su '25


8

Non è prevista alcuna offesa, ma oggi la sensibilità al case è VITAL per gli URL : vengono utilizzati milioni di volte al giorno:

bit.ly

  1. http://bit.ly/ri2LhQ
  2. http://bit.ly/ri2LHq

Due siti molto diversi - possibili solo grazie alla distinzione tra maiuscole e minuscole


3
Indovina come ho fatto? Ho preso un mio url dal caso in cui il caso è stato modificato in modo casuale. Mi ci sono voluti 2 tentativi per trovare un URL univoco. Per quanto riguarda il tuo esempio in cui è relativamente ovvio che ognuno dovrebbe essere la stessa pagina ... questo è il reindirizzamento canonico o basato su server 301. Dovresti essere responsabile della potenza della tua struttura URL e non del protocollo HTTP stesso.
Chris Kluis,

5

Questa non è una norma di Google, sono regole di base.

Dal punto di vista dell'utente di Windows è difficile comprendere i nomi dei file con distinzione tra maiuscole e minuscole. Tuttavia, nei sistemi unix / linux, pAge e page non sono gli stessi file né le stesse directory, e così via i server web.

La barra finale è un problema di configurazione (o scelta). Tieni presente che sulla maggior parte dei server Web, il server emetterà un reindirizzamento 30x su / pagina due / pagina /, quindi, richiedendo una seconda richiesta al tuo server.

Puoi rendere insensibile al tuo server web e configurarlo in qualsiasi modo desideri rispettare le tue regole.

Ma ancora una volta, non è affatto correlato a Google

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.