Sono interessato a calcolare manualmente l'area sotto la curva (AUC), o statistica c, per un modello di regressione logistica binaria. Ad esempio, nel set di dati di convalida, ho il valore reale per la variabile dipendente, retention (1 = mantenuto; 0 = non mantenuto), nonché uno stato di conservazione previsto …
Akaike Information Criterion (AIC) e la statistica c (area sotto la curva ROC) sono due misure di adattamento del modello per la regressione logistica. Ho difficoltà a spiegare cosa sta succedendo quando i risultati delle due misure non sono coerenti. Immagino che stiano misurando aspetti leggermente diversi dell'adattamento del modello, …
Ho due classificatori A: ingenua rete bayesiana B: rete bayesiana ad albero (collegata singolarmente) In termini di accuratezza e altre misure, A si comporta in modo relativamente peggiore di B. Tuttavia, quando utilizzo i pacchetti R ROCR e AUC per eseguire l'analisi ROC, si scopre che l'AUC per A è …
La precisione media (AP) è l'area sotto la curva di richiamo di precisione (AUC della curva PR)? MODIFICARE: ecco alcuni commenti sulla differenza tra PR AUC e AP. L'AUC è ottenuto per interpolazione trapezoidale della precisione. Una metrica alternativa e di solito quasi equivalente è la precisione media (AP), restituita …
Nella discussione: come generare una curva roc per la classificazione binaria , penso che la confusione fosse che un "classificatore binario" (che è qualsiasi classificatore che separa 2 classi) era per Yang quello che viene chiamato un "classificatore discreto" (che produce uscite discrete 0/1 come un SVM) e non uscite …
L'immagine seguente mostra una curva continua di tassi falsi positivi rispetto a tassi positivi reali: Tuttavia, ciò che non ottengo immediatamente è come vengono calcolate queste tariffe. Se un metodo viene applicato a un set di dati, ha un determinato tasso FP e un certo tasso FN. Ciò non significa …
Preambolo Questo è un post lungo. Se rileggi questo, tieni presente che ho modificato la parte della domanda, sebbene il materiale di sfondo rimanga lo stesso. Inoltre, credo di aver escogitato una soluzione al problema. Quella soluzione appare in fondo al post. Grazie a CliffAB per aver sottolineato che la …
Sto usando un classificatore che restituisce probabilità. Per calcolare l'AUC, sto usando il pacchetto R pROC. Le probabilità di output dal classificatore sono: probs=c(0.9865780, 0.9996340, 0.9516880, 0.9337157, 0.9778576, 0.8140116, 0.8971550, 0.8967585, 0.6322902, 0.7497237) probsmostra la probabilità di essere nella classe '1'. Come mostrato, il classificatore ha classificato tutti i campioni …
Ho dei dubbi su quale misura di prestazione usare, area sotto la curva ROC (TPR in funzione di FPR) o area sotto la curva di richiamo di precisione (precisione come funzione di richiamo). I miei dati sono sbilanciati, cioè il numero di istanze negative è molto più grande di istanze …
Ho costruito una curva ROC per un sistema diagnostico. L'area sotto la curva è stata quindi stimata in modo non parametrico come AUC = 0,89. Quando ho provato a calcolare la precisione con l'impostazione della soglia ottimale (il punto più vicino al punto (0, 1)), ho ottenuto che la precisione …
Sto sperimentando l'algoritmo della macchina per aumentare il gradiente tramite il caretpacchetto in R. Utilizzando un piccolo set di dati di ammissione al college, ho eseguito il seguente codice: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- …
Sto cercando di usare la funzione ' densità ' in R per fare stime sulla densità del kernel. Ho qualche difficoltà a interpretare i risultati e confrontare vari set di dati in quanto sembra che l'area sotto la curva non sia necessariamente 1. Per qualsiasi funzione di densità di probabilità …
Ho addestrato due modelli (classificatori binari usando h2o AutoML) e voglio selezionarne uno da usare. Ho i seguenti risultati: model_id auc logloss logloss_train logloss_valid gini_train gini_valid DL_grid_1 0.542694 0.287469 0.092717 0.211956 0.872932 0.312975 DL_grid_2 0.543685 0.251431 0.082616 0.186196 0.900955 0.312662 le colonne auce loglosssono le metriche di convalida incrociata (la …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.