Ordine del dizionario nordcoreano


9

L'obiettivo

Data una stringa di sillabe Hangul, ordina i caratteri nell'ordine del dizionario nordcoreano.

Introduzione alle sillabe di Hangul

Hangul (한글) è il sistema di scrittura coreano inventato da Sejong il Grande. Le sillabe Hangul sono allocate nel punto Unicode U + AC00 - U + D7A3. Una sillaba Hangul è composta da una consonante iniziale, una vocale e una consonante finale opzionale.

Le consonanti iniziali sono:

ㄱ ㄲ ㄴ ㄷ ㄸ ㄹ ㅁ ㅂ ㅃ ㅅ ㅆ ㅇ ㅈ ㅉ ㅊ ㅋ ㅌ ㅍ ㅎ

Le vocali sono:

ㅏ ㅐ ㅑ ㅒ ㅓ ㅔ ㅕ ㅖ ㅗ ㅘ ㅙ ㅚ ㅛ ㅜ ㅝ ㅞ ㅟ ㅠ ㅡ ㅢ ㅣ

Le consonanti finali sono:

(none) ㄱ ㄲ ㄳ ㄴ ㄵ ㄶ ㄷ ㄹ ㄺ ㄻ ㄼ ㄽ ㄾ ㄿ ㅀ ㅁ ㅂ ㅄ ㅅ ㅆ ㅇ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ

Ad esempio, ha consonante iniziale , vocale e consonante finale .

Ordine del dizionario sudcoreano

Le consonanti e le vocali sopra sono ordinate nell'ordine del dizionario sudcoreano. Le sillabe sono in primo luogo ordinate per consonanti iniziali, in secondo luogo per vocali e infine per consonanti finali (opzionali).

Il blocco Unicode per le sillabe di Hangul contiene tutte le combinazioni consonanti / vocali ed è interamente ordinato nell'ordine del dizionario sudcoreano.

Il blocco Unicode può essere visto qui e i primi 256 caratteri sono mostrati a scopo illustrativo:

가각 갂 갃간 갅갆 갇갈 갉갊 갋갌 갍갎 갏감 갑값 갓갔 강갖 갗갘 같갚 갛개 객갞 갟갠 갡갢 갣갤 갥갦 갧갨 갩갪 갫갬 갭갮 갯갰 갱갲 갳갴 갵갶 갷갸 갹갺 갻갼 갽갾 갿걀 걁걂 걃걄 걅걆 걇걈 걉걊 걋걌 걍걎 걏걐 걑걒 걓걔 걕걖 걗걘 걙걚 걛걜 걝걞 걟걠 걡걢 걣걤 걥걦 걧걨 걩걪 걫걬 걭걮 걯거 걱걲 걳건 걵걶 걷걸 걹걺 걻걼 걽걾 걿검 겁겂 것 겄겅 겆겇 겈겉 겊겋 게겍 겎겏 겐겑 겒겓 겔겕 겖겗 겘겙 겚겛 겜겝 겞겟 겠겡 겢겣 겤겥 겦겧 겨격 겪겫 견겭 겮겯 결겱 겲겳 겴겵 겶겷 겸겹 겺겻 겼경 겾겿 곀곁 곂곃 계곅 곆곇 곈곉 곊곋 곌곍 곎곏 곐곑 곒곓 곔곕 곖곗 곘곙 곚곛 곜곝 곞곟 고곡 곢곣 곤곥 곦곧 골곩 곪곫 곬곭 곮곯 곰곱 곲곳 곴공 곶곷 곸곹 곺곻 과 곽 곾곿

Ad esempio, la seguente frase (senza spazi e punteggiatura):

키스의고유조건은입술끼리만나야하고특별한기술은필요치않다

è ordinato in:

건고고기끼나다리만별술술스않야요유은은의입조치키특필하한

In C ++, se la stringa è in std::wstring, l'ordinamento sopra è semplice std::sort.

Ordine del dizionario nordcoreano

Il dizionario della Corea del Nord ha un ordine consonante / vocale diverso.

Le consonanti iniziali sono ordinate come:

ㄱ ㄴ ㄷ ㄹ ㅁ ㅂ ㅅ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ ㄲ ㄸ ㅃ ㅆ ㅉ ㅇ

Le vocali sono ordinate come:

ㅏ ㅑ ㅓ ㅕ ㅗ ㅛ ㅜ ㅠ ㅡ ㅣ ㅐ ㅒ ㅔ ㅖ ㅚ ㅟ ㅢ ㅘ ㅝ ㅙ ㅞ

Le consonanti finali sono ordinate come:

(none) ㄱ ㄳ ㄴ ㄵ ㄶ ㄷ ㄹ ㄺ ㄻ ㄼ ㄽ ㄾ ㄿ ㅀ ㅁ ㅂ ㅄ ㅅ ㅇ ㅈ ㅊ ㅋ ㅌ ㅍ ㅎ ㄲ ㅆ

Come il Sud, le sillabe sono in primo luogo ordinate per consonanti iniziali, in secondo luogo per vocali e infine per consonanti finali (opzionali).

Se viene data la frase sopra, l'output deve essere:

건고고기나다리만별술술스조치키특필하한끼않야요유은은입의

Regole

  1. Se l'input contiene un carattere non compreso tra U + AC00 - U + D7A3, cade in una situazione non importante .

  2. Poiché si tratta di un codice-golf, vince il codice più breve in byte.



Se ciò ha senso, suggerirei di aggiungere un caso di prova in cui i caratteri sono ordinati diversamente in base alla consonante finale esclusivamente (usando ㄲ o ㅆ con la stessa consonante iniziale e la stessa vocale).
Arnauld,

(Più in generale, aggiungere alcuni altri casi di test sarebbe fantastico.)
Arnauld

Casi di prova suggeriti: 가까나다따라마바빠사싸아자짜차카타파(tutte le consonanti iniziali), 가개갸걔거게겨계고과괘괴교구궈궤귀규그긔기(tutte le vocali), 가각갂갃간갅갆갇갈갉갊갋갌갍갎갏감갑값갓갔강갖갗갘같갚갛(tutte le consonanti finali).
Grimmy,

1
Bene, tanto per quello ... 86 diverse regole di confronto SQL coreane; tutti ordinano alla maniera "sudcoreana". Bella (difficile) domanda.
BradC,

Risposte:


1

05AB1E , 47 45 38 byte

Σ•¡®šúIтÝ„Š’#„λ†x!·“•4B33¡€.ā`ââyÇ68+è

Provalo online!

Σ                        # sort characters of the input by:
 •...•                   #  compressed integer 13096252834522000035292405913882127943177557
      4B                 #  converted to base 4: 211211121231211111033010101010231002310010331121111111111111111121111111
        33¡              #  split on 33: [2112111212312111110, 010101010231002310010, 1121111111111111111121111111]
           €.ā           #  enumerate each (pairs each digit with its index)
              `ââ        #  reduce by cartesian product (yields a list with 11172 elements)
                 yÇ      #  codepoint of the current character
                   68+   #  + 68
                      è  #  index into the large list (with wraparound)

7

JavaScript (ES6),  150 148  137 byte

Salvato 10 byte grazie a @Grimy

I / O: matrici di caratteri.

a=>a.map(c=>"ANBCODEFPGQSHRIJKLM"[(n=c.charCodeAt()-44032)/588|0]+"AKBLCMDNERTOFGSUPHIQJ"[n/28%21|0]+~(n%28%18==2)+c).sort().map(s=>s[4])

Provalo online!

Suddividere le sillabe di Hangul

nIVF

I=n588, V=n28mod21, F=nmod28

Commentate

a => a.map(c =>                  // for each character c in the input:
  "ANBCODEFPGQSHRIJKLM"[         //   start with a letter from 'A' to 'S'
    (n = c.charCodeAt() - 44032) //   for the initial consonant
    / 588 | 0                    //
  ] +                            //
  "AKBLCMDNERTOFGSUPHIQJ"[       //   append a letter from 'A' to 'U'
    n / 28 % 21 | 0              //   for the vowel
  ] +                            //
  ~(                             //   append "-2" for ㄲ or ㅆ (the only North
    n % 28 % 18 == 2             //   Korean final consonants that are sorted
  ) +                            //   differently) or "-1" otherwise
  c                              //   append the original character
)                                // end of map()
.sort()                          // sort in lexicographical order
.map(s => s[4])                  // isolate the original characters

1

Carbone , 80 byte

F”&→∧⁶⍘⎚%γD¦ρJG”F”E⎇↓Nη⊙��⭆Ws@}4”F”E↖hY9 t⟧⊙γIO↶5ε∧¬⁶⦃”Φθ⁼℅μΣ⟦⁴⁴⁰³²×⌕βι⁵⁸⁸⍘⁺κλ²⁸

Provalo online! Il collegamento è alla versione dettagliata del codice. Spiegazione: Funziona generando tutte le 11172 sillabe Hangul nell'ordine del dizionario nordcoreano e controllando per vedere quali sono presenti nell'input (quindi tutti gli altri caratteri vengono eliminati; anche un po 'lento: impiega 18 secondi su TIO). Spiegazione:

F”&→∧⁶⍘⎚%γD¦ρJG”

Passa sopra la stringa compressa acdfghjmopqrsbeiknl. Questo rappresenta l'elenco delle consonanti iniziali sudcoreane (numerate usando l'alfabeto minuscolo occidentale) nell'ordine del dizionario nordcoreano.

F”E⎇↓Nη⊙��⭆Ws@}4”

Passa sopra la stringa compressa 02468cdhik1357bgj9eaf. Questo rappresenta l'elenco delle vocali della Corea del Sud (numerate usando le cifre ASCII e l'alfabeto minuscolo) nell'ordine del dizionario nordcoreano.

F”E↖hY9 t⟧⊙γIO↶5ε∧¬⁶⦃”

Passa sopra la stringa compressa 013456789abcdefghijlmnopqr2k. Questo rappresenta l'elenco delle consonanti finali della Corea del Sud (usando la stessa numerazione delle vocali) nell'ordine del dizionario nordcoreano.

Φθ⁼℅μΣ⟦⁴⁴⁰³²×⌕βι⁵⁸⁸⍘⁺κλ²⁸

Concatena la vocale e la consonante finale e decodifica come numero base 28, quindi aggiungi 588 volte la vocale iniziale e 0xAC00. Stampa tutti i caratteri dall'input che hanno quello come ordinale.


I caratteri sostitutivi sono sintassi valida?
Dannyu NDos,

@DannyuNDos Rappresenta il valore \xFFin byte nella tabella codici di Charcoal.
Neil,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.