L'ambiente Unix ha alcuni strumenti eccellenti per l'analisi del testo in varie forme. Tuttavia, di recente, i dati non sono nei formati (storici) tradizionali (CSV, TSV, basati su record o altri delimitatori) rispetto a prima. I dati in questi giorni vengono scambiati in formati strutturati come XML / JSON.
So che ci sono alcuni buoni strumenti come sed, awk e Perl che possono masticare quasi ogni forma di dati là fuori. Tuttavia, per lavorare con questo tipo di dati strutturati, spesso si deve scrivere un programma completo e, dato il poco tempo disponibile per estrarre informazioni, è necessario sedersi e capire l'intera logica di ciò che si desidera interrogare e mettere giù programmaticamente. A volte questo non è OK, fondamentalmente perché le informazioni estratte da quei file agiscono come input per ulteriori lavori; anche a causa del tempo necessario per cercare la soluzione appropriata e codificarla. È necessario uno strumento da riga di comando con opzioni sufficienti per trovare, interrogare e scaricare i dati.
Sto cercando strumenti che prendono un XML / JSON o altre forme di dati strutturati e lo scaricano in altri formati come CSV, ecc., In modo che da lì si possano usare altri comandi per ricavarne qualsiasi informazione.
Esistono utility da riga di comando che conosci che svolgono questo tipo di lavoro? Sono già disponibili script awk / Perl?
jq
è un buon strumento per analizzare JSON nella shell: stedolan.github.io/jq