I caratteri spaziali possono essere codificati come "+" in un unico contesto: coppie chiave-valore codificate application / x-www-form-urlencoded.
RFC-1866 (specifica HTML 2.0), paragrafo 8.2.1. il sottoparagrafo 1. dice: "I nomi e i valori dei campi del modulo sono sfuggiti: i caratteri di spazio sono sostituiti da` + 'e quindi i caratteri riservati sono sfuggiti ").
Ecco un esempio di tale stringa nell'URL in cui RFC-1866 consente la codifica di spazi come vantaggi: " http://example.com/over/there?name=foo+bar ". Quindi, solo dopo "?", Gli spazi possono essere sostituiti da vantaggi (in altri casi, gli spazi devono essere codificati in% 20). Questo modo di codificare i dati dei moduli viene anche fornito nelle specifiche HTML successive, ad esempio, cercare i paragrafi pertinenti sull'applicazione / x-www-form-urlencoded nelle specifiche HTML 4.01 e così via.
Tuttavia, poiché è difficile determinare sempre correttamente il contesto, è consigliabile non codificare mai gli spazi come "+". È meglio codificare in percentuale tutti i caratteri tranne "senza prenotazione" definito in RFC-3986, p. 2.3. Ecco un esempio di codice che illustra cosa dovrebbe essere codificato. Viene fornito nel linguaggio di programmazione Delphi (pascal), ma è molto facile capire come funziona per qualsiasi programmatore indipendentemente dal linguaggio posseduto:
(* percent-encode all unreserved characters as defined in RFC-3986, p.2.3 *)
function UrlEncodeRfcA(const S: AnsiString): AnsiString;
const
HexCharArrA: array [0..15] of AnsiChar = '0123456789ABCDEF';
var
I: Integer;
c: AnsiChar;
begin
// percent-encoding, see RFC-3986, p. 2.1
Result := S;
for I := Length(S) downto 1 do
begin
c := S[I];
case c of
'A' .. 'Z', 'a' .. 'z', // alpha
'0' .. '9', // digit
'-', '.', '_', '~':; // rest of unreserved characters as defined in the RFC-3986, p.2.3
else
begin
Result[I] := '%';
Insert('00', Result, I + 1);
Result[I + 1] := HexCharArrA[(Byte(C) shr 4) and $F)];
Result[I + 2] := HexCharArrA[Byte(C) and $F];
end;
end;
end;
end;
function UrlEncodeRfcW(const S: UnicodeString): AnsiString;
begin
Result := UrlEncodeRfcA(Utf8Encode(S));
end;