Unicode è uno standard del settore informatico per la codifica, la rappresentazione e la gestione coerenti del testo espresso nella maggior parte dei sistemi di scrittura del mondo.
Ho appena incontrato uno screenshot del terminale di qualcuno: C'è un elenco di tutti i personaggi che possono essere utilizzati in un prompt di Bash o qualcuno può procurarmi il personaggio per la stella e la freccia destra?
Ho un file in codifica UTF-8 con BOM e voglio rimuovere la BOM. Esistono strumenti da riga di comando di Linux per rimuovere la distinta componenti dal file? $ file test.xml test.xml: XML 1.0 document, UTF-8 Unicode (with BOM) text, with very long lines
Vorrei contribuire a un progetto open source fornendo stringhe tradotte. Uno dei loro requisiti è che i contributori devono usare UTF-8 come codifica per i file PO. Sto usando VIM 7.3 su Linux. Come posso essere sicuro che la codifica di VIM sia impostata su UTF-8, in modo da poter …
Se eseguo il seguente semplice script: #!/bin/bash printf "%-20s %s\n" "Früchte und Gemüse" "foo" printf "%-20s %s\n" "Milchprodukte" "bar" printf "%-20s %s\n" "12345678901234567890" "baz" Stampa: Früchte und Gemüse foo Milchprodukte bar 12345678901234567890 baz vale a dire, il testo con umlaut (come ü) viene "ridotto" di un carattere per umlaut. Certamente, …
Ho un file di testo in una codifica sconosciuta o mista. Voglio vedere le righe che contengono una sequenza di byte non valida UTF-8 (eseguendo il piping del file di testo in un programma). Allo stesso modo, voglio filtrare le righe valide UTF-8. In altre parole, sto cercando .grep [notutf8] …
Quindi stavo guardando questa risposta su StackOverflow e mi sono reso conto che i miei caratteri non coprono gran parte dello spettro unicode utf-8 (dato che ottengo molti quadrati). Qualcuno conosce un carattere che coprirà tutto quel post?
Il semplice codice qui funziona come previsto sulla mia macchina se lanciato con bash: function ⏰(){ date } ⏰ Potrebbe esserci un problema per altre persone che usano questo, o è universale? Mi chiedo perché non ho mai visto nulla di simile in questo altro codice sorgente per ora. Modifica: …
Sto cercando di rimuovere alcuni caratteri dal file (UTF-8). Sto usando trper questo scopo: tr -cs '[[:alpha:][:space:]]' ' ' <testdata.dat Il file contiene alcuni caratteri stranieri (come "Латвийская" o "àé"). trnon sembra capirli: li tratta come non alfa e li rimuove. Ho provato a cambiare alcune delle mie impostazioni locali: …
Per esempio: sed 's/\u0091//g' file1 In questo momento, devo fare hexdumpper ottenere il numero esadecimale e inserire sedcome segue: $ echo -ne '\u9991' | hexdump -C 00000000 e9 a6 91 |...| 00000003 E poi: $ sed 's/\xe9\xa6\x91//g' file1
Di recente ho aggiornato il mio server Arch Linux e durante quel processo tmux è stato aggiornato. Stavo usando tmuxmentre l'aggiornamento andava avanti e l'ho usato in seguito, ma tutti durante la stessa sessione SSH. Ora, tuttavia, ogni volta che provo a emettere un tmuxcomando, visualizzo questo errore: tmux: need …
Questa domanda è stata migrata dallo Stack Overflow perché è possibile rispondere a Exchange Stack Unix e Linux. Migrato 8 anni fa . Sto usando il seguente comando per grep l'intervallo del set di caratteri per il codice esadecimale da 0900 (anziché अ) a 097F (anziché व). Come posso usare …
ɛ("Epsilon latino") è una lettera usata in alcune lingue africane, di solito per rappresentare il suono vocale nella "base" inglese. In Unicode è codificato come U + 025B, molto distinto da tutti i giorni e. Tuttavia, se io sortil seguente: eb ed ɛa ɛc sembra che sortconsideri ɛed eequivalenti: ɛa …
Ho un elenco di punti di codice Unicode, ma non conosco un modo "semplice" per convertire questi valori esadecimali nei caratteri reali che rappresentano ... Ho sentito che zsh ha echo -e '\u0965', ma uso bash 4.1. C'è qualcosa di semplice come il metodo zsh, per bash?
In Unicode, alcune combinazioni di caratteri hanno più di una rappresentazione. Ad esempio, il carattere ä può essere rappresentato come "ä", ovvero il punto di codice U + 00E4 (due byte c3 a4nella codifica UTF-8) o come "ä", ovvero i due punti di codice U + 0061 U + 0308 …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.