Sto cercando di creare un set di dati su diversi file di registro di uno dei nostri prodotti.
I diversi file di registro hanno il loro layout e il loro contenuto; Li ho raggruppati con successo, rimanendo solo un passo ...
In effetti, i "messaggi" di registro sono le migliori informazioni. Non ho un elenco completo di tutti quei messaggi, ed è una cattiva idea codificare in base a quelli perché l'elenco può cambiare ogni giorno.
Quello che vorrei fare è separare il testo di identificazione dal testo del valore (ad esempio: "File caricato XXX" diventa (identificazione: "File caricato", valore: "XXX")). Sfortunatamente, questo esempio è semplice e nel mondo reale ci sono layout diversi e talvolta valori multipli.
Stavo pensando di usare i kernel di stringa, ma è destinato al clustering ... e il clustering non è applicabile qui (non conosco il numero di diversi tipi di messaggi e, anche se, sarebbe troppo).
Hai qualche idea?
Grazie per l'aiuto.
PS: per chi programma, questo può essere più facile da capire. Supponiamo che il codice contenga come log printf ("blabla% s", "xxx") -> Vorrei che "blabla" e "xxx" fossero separati