Ho alcuni dati che devo visualizzare e non sono sicuro del modo migliore per farlo. Ho una serie di elementi di base con rispettive frequenze e risultati . Ora devo tracciare quanto bene il mio metodo "trova" (cioè un risultato 1) gli oggetti a bassa frequenza. Inizialmente avevo solo un asse x di frequenza e un asse y di 0-1 con grafici a punti, ma sembrava orribile (specialmente quando si confrontano i dati di due metodi). Cioè, ogni elemento ha un risultato (0/1) ed è ordinato in base alla sua frequenza.F = { f 1 , ⋯ , f n } O ∈ { 0 , 1 } n q ∈ Q
Ecco un esempio con i risultati di un singolo metodo:
La mia prossima idea era quella di dividere i dati in intervalli e calcolare una sensibilità locale sugli intervalli, ma il problema con quell'idea è che la distribuzione della frequenza non è necessariamente uniforme. Quindi, come dovrei scegliere meglio gli intervalli?
Qualcuno conosce un modo migliore / più utile per visualizzare questo tipo di dati per rappresentare l'efficacia della ricerca di oggetti rari (cioè a frequenza molto bassa)?
EDIT: Per essere più concreti, sto mettendo in mostra la capacità di alcuni metodi di ricostruire sequenze biologiche di una determinata popolazione. Per la convalida utilizzando dati simulati, devo mostrare la capacità di ricostruire varianti indipendentemente dalla sua abbondanza (frequenza). Quindi in questo caso sto visualizzando gli oggetti mancati e trovati, ordinati in base alla loro frequenza. Questo terreno non includerà varianti ricostruiti che non sono in .