sfondo
Per i miei invii di code-golf in C, ho bisogno di uno strumento di elaborazione. Come in molte altre lingue, lo spazio bianco è per lo più irrilevante nella fonte C (ma non sempre!) - Rende ancora il codice molto più comprensibile per l'uomo. Un programma C completamente golfato che non contiene un singolo spazio ridondante spesso è a malapena leggibile.
Pertanto, mi piace scrivere il mio codice in C per una presentazione di code-golf che includa spazi bianchi e talvolta commenti, quindi il programma mantiene una struttura comprensibile durante la scrittura. L'ultimo passaggio è rimuovere tutti i commenti e gli spazi bianchi ridondanti. Questo è un compito noioso e insensato che dovrebbe davvero essere svolto da uno stagista di un programma per computer.
Compito
Scrivi un programma o una funzione che elimini i commenti e gli spazi bianchi ridondanti da una sorgente C "pre-golf" secondo le seguenti regole:
- Una
\
(barra rovesciata) come l'ultimo carattere di una riga è una continuazione di riga . Se lo trovi, devi considerare la seguente riga come parte della stessa riga logica (potresti ad esempio rimuovere completamente la\
e la seguente\n
(nuova riga) prima di fare qualsiasi altra cosa) - I commenti utilizzeranno solo il formato di una riga, a partire da
//
. Quindi, per rimuoverli, ignori il resto della linea logica ovunque incontri//
fuori da una stringa letterale (vedi sotto). - I caratteri degli
spazi bianchi sono (spazio),
\t
(tab) e\n
(newline, quindi qui la fine di una linea logica). Quando trovi una sequenza di spazi bianchi, esamina i caratteri non bianchi che lo circondano. Se
- entrambi sono alfanumerici o di sottolineatura (intervallo
[a-zA-Z0-9_]
) o - entrambi sono
+
o - entrambi sono
-
o - quello che precede è
/
e quello che segue è*
quindi sostituire la sequenza con un singolo carattere spazio (
).
Altrimenti, eliminare completamente la sequenza.
Questa regola ha alcune eccezioni :
- Le direttive del preprocessore devono apparire sulle proprie righe nell'output. Una direttiva preprocessore è una riga che inizia con
#
. - All'interno di una stringa letterale o letterale di carattere , non è necessario rimuovere spazi bianchi. Qualsiasi
"
(virgoletta doppia) /'
(virgoletta singola) che non è preceduta direttamente da un numero dispari di barre rovesciate (\
) inizia o termina una stringa letterale / carattere letterale . Hai la certezza che i letterali di stringhe e caratteri finiscano sulla stessa linea da cui sono partiti. i letterali stringa e i caratteri letterali non possono essere nidificati, quindi un valore letterale'
interno a una stringa , nonché"
un valore letterale interno a un carattere non hanno alcun significato speciale.
- entrambi sono alfanumerici o di sottolineatura (intervallo
Specifica I / O
L'input e l'output devono essere sequenze di caratteri (stringhe) inclusi caratteri di nuova riga o matrici / elenchi di stringhe che non contengono caratteri di nuova riga. Se si sceglie di utilizzare matrici / elenchi, ogni elemento rappresenta una linea, quindi le nuove righe sono implicite dopo ogni elemento.
È possibile supporre che l'input sia un codice sorgente valido del programma C. Questo significa anche che contiene solo caratteri ASCII stampabili, schede e nuove righe. È consentito un comportamento indefinito sull'input non valido.
Non sono consentiti spazi vuoti iniziali o finali / righe vuote .
Casi test
ingresso
main() { printf("Hello, World!"); // hi }
produzione
main(){printf("Hello, World!");}
ingresso
#define max(x, y) \ x > y ? x : y #define I(x) scanf("%d", &x) a; b; // just a needless comment, \ because we can! main() { I(a); I(b); printf("\" max \": %d\n", max(a, b)); }
produzione
#define max(x,y)x>y?x:y #define I(x)scanf("%d",&x) a;b;main(){I(a);I(b);printf("\" max \": %d\n",max(a,b));}
ingresso
x[10];*c;i; main() { int _e; for(; scanf("%d", &x) > 0 && ++_e;); for(c = x + _e; c --> x; i = 100 / *x, printf("%d ", i - --_e)); }
produzione
x[10];*c;i;main(){int _e;for(;scanf("%d",&x)>0&&++_e;);for(c=x+_e;c-->x;i=100/ *x,printf("%d ",i- --_e));}
ingresso
x; #include <stdio.h> int main() { puts("hello // there"); }
produzione
x; #include<stdio.h> int main(){puts("hello // there");}
input (un esempio del mondo reale)
// often used functions/keywords: #define P printf( #define A case #define B break // loops for copying rows upwards/downwards are similar -> macro #define L(i, e, t, f, s) \ for (o=i; o e;){ strcpy(l[o t], l[o f]); c[o t]=c[s o]; } // range check for rows/columns is similar -> macro #define R(m,o) { return b<1|b>m ? m o : b; } // checking for numerical input is needed twice (move and print command): #define N(f) sscanf(f, "%d,%d", &i, &j) || sscanf(f, ",%d", &j) // room for 999 rows with each 999 cols (not specified, should be enough) // also declare "current line pointers" (*L for data, *C for line length), // an input buffer (a) and scratch variables r, i, j, o, z, c[999], *C, x=1, y=1; char a[999], l[999][999], (*L)[999]; // move rows down from current cursor position D() { L(r, >y, , -1, --) r++ ? strcpy(l[o], l[o-1]+--x), c[o-1]=x, l[o-1][x]=0 : 0; c[y++] = strlen(l[o]); x=1; } // move rows up, appending uppermost to current line U() { strcat(*L, l[y]); *C = strlen(*L); L(y+1, <r, -1, , ++) --r; *l[r] = c[r] = 0; } // normalize positions, treat 0 as max X(b) R(c[y-1], +1) Y(b) R(r, ) main() { for(;;) // forever { // initialize z as current line index, the current line pointers, // i and j for default values of positioning z = i = y; L = l + --z; C = c + z; j = x; // prompt: !r || y/r && x > *C ? P "end> ") : P "%d,%d> ", y, x); // read a line of input (using scanf so we don't need an include) scanf("%[^\n]%*c", a) // no command arguments -> make check easier: ? a[2] *= !!a[1], // numerical input -> have move command: // calculate new coordinates, checking for "relative" N(a) ? y = Y(i + (i<0 | *a=='+') * y) , x = X(j + (j<0 || strchr(a+1, '+')) * x) :0 // check for empty input, read single newline // and perform <return> command: : ( *a = D(), scanf("%*c") ); switch(*a) { A 'e': y = r; x = c[r-1] + 1; B; A 'b': y = 1; x = 1; B; A 'L': for(o = y-4; ++o < y+2;) o<0 ^ o<r && P "%c%s\n", o^z ? ' ' : '>', l[o]); for(o = x+1; --o;) P " "); P "^\n"); B; A 'l': puts(*L); B; A 'p': i = 1; j = 0; N(a+2); for(o = Y(i)-1; o<Y(j); ++o) puts(l[o]); B; A 'A': y = r++; strcpy(l[y], a+2); x = c[y] = strlen(a+2); ++x; ++y; B; A 'i': D(); --y; x=X(0); // Commands i and r are very similar -> fall through // from i to r after moving rows down and setting // position at end of line: A 'r': strcpy(*L+x-1, a+2); *C = strlen(*L); x = 1; ++y > r && ++r; B; A 'I': o = strlen(a+2); memmove(*L+x+o-1, *L+x-1, *C-x+1); *C += o; memcpy(*L+x-1, a+2, o); x += o; B; A 'd': **L ? **L = *C = 0, x = 1 : U(); y = y>r ? r : y; B; A 'j': y<r && U(); } } }
produzione
#define P printf( #define A case #define B break #define L(i,e,t,f,s)for(o=i;o e;){strcpy(l[o t],l[o f]);c[o t]=c[s o];} #define R(m,o){return b<1|b>m?m o:b;} #define N(f)sscanf(f,"%d,%d",&i,&j)||sscanf(f,",%d",&j) r,i,j,o,z,c[999],*C,x=1,y=1;char a[999],l[999][999],(*L)[999];D(){L(r,>y,,-1,--)r++?strcpy(l[o],l[o-1]+--x),c[o-1]=x,l[o-1][x]=0:0;c[y++]=strlen(l[o]);x=1;}U(){strcat(*L,l[y]);*C=strlen(*L);L(y+1,<r,-1,,++)--r;*l[r]=c[r]=0;}X(b)R(c[y-1],+1)Y(b)R(r,)main(){for(;;){z=i=y;L=l+--z;C=c+z;j=x;!r||y/r&&x>*C?P"end> "):P"%d,%d> ",y,x);scanf("%[^\n]%*c",a)?a[2]*=!!a[1],N(a)?y=Y(i+(i<0|*a=='+')*y),x=X(j+(j<0||strchr(a+1,'+'))*x):0:(*a=D(),scanf("%*c"));switch(*a){A'e':y=r;x=c[r-1]+1;B;A'b':y=1;x=1;B;A'L':for(o=y-4;++o<y+2;)o<0^o<r&&P"%c%s\n",o^z?' ':'>',l[o]);for(o=x+1;--o;)P" ");P"^\n");B;A'l':puts(*L);B;A'p':i=1;j=0;N(a+2);for(o=Y(i)-1;o<Y(j);++o)puts(l[o]);B;A'A':y=r++;strcpy(l[y],a+2);x=c[y]=strlen(a+2);++x;++y;B;A'i':D();--y;x=X(0);A'r':strcpy(*L+x-1,a+2);*C=strlen(*L);x=1;++y>r&&++r;B;A'I':o=strlen(a+2);memmove(*L+x+o-1,*L+x-1,*C-x+1);*C+=o;memcpy(*L+x-1,a+2,o);x+=o;B;A'd':**L?**L=*C=0,x=1:U();y=y>r?r:y;B;A'j':y<r&&U();}}}
Questo è code-golf , quindi vince la risposta più breve (in byte) valida.