Come vengono generalmente trattati i commenti nei linguaggi di programmazione e nel markup? Sto scrivendo un parser per un linguaggio di markup personalizzato e voglio seguire il principio della minima sorpresa , quindi sto cercando di determinare la convenzione generale.
Ad esempio, un commento incorporato in un token dovrebbe "interferire" con il token o no? In generale, è qualcosa di simile:
Sys/* comment */tem.out.println()
valido?
Inoltre, se la lingua è sensibile alle nuove righe e il commento abbraccia la nuova riga, la nuova riga dovrebbe essere considerata o no?
stuff stuff /* this is comment
this is still comment */more stuff
essere trattato come
stuff stuff more stuff
o
stuff stuff
more stuff
?
So cosa fanno alcune lingue specifiche, né cerco opinioni, ma cerco o meno: c'è un consenso generale su cosa ci si aspetta generalmente da un mark up per quanto riguarda token e nuove righe?
Il mio contesto particolare è un markup simile a un wiki.