AUC nella regressione logistica ordinale


9

Sto usando 2 tipi di regressione logistica: uno è il tipo semplice, per la classificazione binaria, e l'altro è la regressione logistica ordinale. Per calcolare l'accuratezza del primo, ho usato la convalida incrociata, in cui ho calcolato l'AUC per ogni piega e poi calcolato l'AUC medio. Come posso farlo per la regressione logistica ordinale? Ho sentito parlare di ROC generalizzato per predittori multi-classe, ma non sono sicuro di come calcolarlo.

Grazie!


1
Non AUC ma correlati: il micro / macro curve precisione richiamo a stats.stackexchange.com/questions/21551/...
Yevgeny

Risposte:


4

Mi piace solo l'area sotto la curva ROC ( -index) perché sembra essere una probabilità di concordanza. c è un blocco costitutivo dei coefficienti di correlazione dei ranghi. Ad esempio, Somers ' D x y = 2 × ( c - 1cc. PerYordinale,Dxyè un'eccellente misura della discriminazione predittiva e ilpacchettoRfornisce semplici modi per ottenere stime diDxycorrette dal sovra-adattamento del bootstrap. È possibile eseguire il backsolve per unc-index generalizzato(AUROC generalizzato). Ci sono ragioni per non considerare ogni livello diYseparatamente perché questo non sfrutta la natura ordinale diY.DXy=2×(c-12)YDXyrmsDXycYY

In rmsci sono due funzioni per la regressione ordinale: lrme orm, quest'ultima che gestisce continua e fornisce più famiglie di distribuzione (funzioni di collegamento) rispetto alle probabilità proporzionali.Y


Il problema principale sarà come rms calcola il usato nella D x y di Sommer ? c-iondeXDXy
Chamberlain Foncha,

1
Si scrive Somer . L' indice generalizzato viene semplicemente calcolato risolvendo l'equazione che ho elencato sopra. Sono esaminate tutte le possibili combinazioni interne di osservazioni con valori Y diversi e la frazione di tali coppie per le quali le previsioni sono nello stesso ordine è la stima della probabilità di concordanza. Ho frainteso una cosa: la funzione usa ρ di Spearman invece di D x y . cYormρDXy
Frank Harrell,

Grazie per la correzione ortografica. Nella regressione ordinale sarà molto più interessante non solo guardare l'ordinamento a coppie come viene fatto nella funzione orm che hai menzionato, ma anche osservare l'ordinamento coerente (con operatori ternari o superiori) a seconda del numero di classi che hai. In sintesi quello che sto dicendo è: con una regressione logistica cumulativa adattata, ad esempio, l'ordinamento delle classi è curato nel modello. Una misura predittiva dovrebbe anche essere in grado di non effettuare un confronto a coppie P(pred1<pred2|oBS1<oBS2)ma confronto del modulo $ P (pred_1 <pred_2 <pred_3 | obs_1 <obs_2 <o
Chamberlain Foncha il

Non sapendo di tali misure, la mia prima reazione è che stanno mettendo in difficoltà un ostacolo.
Frank Harrell,

1

L'AUC per la regressione ordinale è qualcosa di complicato. Potresti voler calcolare l'AUC per ogni classe creando dei manichini che assumano il valore 1 per la classe che stai calcolando l'AUC e 0 per il resto delle altre classi. Se hai 4 classi, creerai 4 AUC e le traccia sullo stesso grafico. Il problema principale con questo metodo è il fatto che penalizza equamente la classificazione errata. Classificare in modo molto più intuitivo una classificazione di classe 1 in classe 3 dovrebbe essere peggiore di classificare in modo errato la classe 1 in classe 2.

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.