Come risposta precedente, il set di caratteri è un insieme di caratteri (lettere, numeri, ideogrammi ecc.) Assegnati a un numero; per poterli vedere, devi avere il carattere (le piccole "immagini" che leggiamo). Erano importanti usando LatinX, perché per ogni X, lo stesso numero (byte) poteva riferirsi a un carattere diverso.
Oggi è più importante selezionare la codifica: lo standard è UTF-8, la rappresentazione di maggior successo di Unicode (compatibile con ASCII ma così flessibile da includere tutte le lingue, anche cinese e giapponese) e lo standard W3C. In altre parole, include tutti i set di caratteri.
Collazione: questa è una parola vecchio stile, derivata dal latino. Significa: confrontare una copia (manoscritto) con l'originale per trovare differenze (errori o modifiche). È stato molto utile in passato, ma ora è quasi un arcaismo perché i nostri documenti e libri sono scritti usando il computer e la copia è sempre identica all'originale. Esempio: in italiano (derivato dal latino) c'è il verbo "collazionare", ma è nei dizionari e nessuno lo usa.
Pertanto, le regole di confronto definiscono il comportamento degli operatori di confronto: =,>, <, <=,> = ...
Ovviamente quegli operatori vengono usati per decidere se due stringhe sono uguali o se una parola è "maggiore" di un'altra, molto importante se vogliamo ordinare. Le lettere non sono nello stesso ordine per ogni lingua, quindi una parola può essere più grande di un'altra usando una collazione, ma non usando un'altra. Vedi [1] per un esempio pratico.
le regole di confronto "bin" sono le più rigorose: SELEZIONA "b" = "B" => FALSE
le regole di confronto "ci" non fanno distinzione tra maiuscole e minuscole: SELECT "b" = "B" => TRUE
il "generale" tende a ignorare alcune differenze: SELEZIONA "a" = "à" => TRUE
altri sono specifici per una o più lingue. Esempio "svedese" (non so perché lo svedese sia spesso un valore predefinito)
Sto ancora cercando un sito web in cui il comportamento di ogni fascicolo sia descritto in dettaglio ... quegli esempi sono dovuti alla mia esperienza.
[1] http://www.olcot.co.uk/sql-blogs/revised-difference-between-collation-sql_latin1_general_cp1_ci_as-and-latin1_general_ci_as