Domande taggate «text-processing»

Manipolazione o esame del testo tramite programmi, script, ecc.

6
Filtro utf8 non valido
Ho un file di testo in una codifica sconosciuta o mista. Voglio vedere le righe che contengono una sequenza di byte non valida UTF-8 (eseguendo il piping del file di testo in un programma). Allo stesso modo, voglio filtrare le righe valide UTF-8. In altre parole, sto cercando .grep [notutf8] …





8
Come convertire TXT in PDF?
Voglio convertire i .txtfile in .pdf. Sto usando questo: ls | while read ONELINE; do convert -density 400 "$ONELINE" "$(echo "$ONELINE" | sed 's/.txt/.pdf/g')"; done Ma questo produce un "errore" - se c'è una riga molto lunga nel file di testo, non viene racchiuso. Testo di input PDF di output …

5
Elimina l'ultima riga dal file
Uso sed per eliminare rapidamente le righe con una posizione specifica come sed '1d' sed '5d' Ma cosa succede se voglio eliminare l'ultima riga del file e non conosco il conteggio delle righe (so che posso ottenerlo usando wce molti altri trucchi). Attualmente, utilizzare una soluzione alternativa con heade tailcombinato …

5
Sostituire le variabili di ambiente in un file con i loro valori effettivi?
Esiste un modo semplice per sostituire / valutare le variabili di ambiente in un file? Come diciamo che ho un file config.xmlche contiene: <property> <name>instanceId</name> <value>$INSTANCE_ID</value> </property> <property> <name>rootPath</name> <value>/services/$SERVICE_NAME</value> </property> ...eccetera. Voglio sostituire $INSTANCE_IDnel file il valore della INSTANCE_IDvariabile d'ambiente, $SERVICE_NAMEcon il valore di SERVICE_NAMEvar env. Non saprò a …




4
Grep dalla fine di un file all'inizio
Ho un file con circa 30.000.000 di righe (Radius Accounting) e ho bisogno di trovare l'ultima corrispondenza di un determinato modello. Il comando: tac accounting.log | grep $pattern dà ciò di cui ho bisogno, ma è troppo lento perché il sistema operativo deve prima leggere l'intero file e quindi inviarlo …



1
Come rendere consapevoli i caratteri non ascii (unicode)?
Sto cercando di rimuovere alcuni caratteri dal file (UTF-8). Sto usando trper questo scopo: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Il file contiene alcuni caratteri stranieri (come "Латвийская" o "àé"). trnon sembra capirli: li tratta come non alfa e li rimuove. Ho provato a cambiare alcune delle mie impostazioni locali: …

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.