Calcolo dell'affidabilità inter-rater in R con numero variabile di rating?


9

Wikipedia suggerisce che un modo per considerare l'affidabilità inter-rater è usare un modello di effetti casuali per calcolare la correlazione intraclasse . L'esempio di correlazione intraclasse parla di guardare

σα2σα2+σϵ2

da un modello

Yij=μ+αi+ϵij

"dove Y ij è il j esima osservazione nell'i esimo gruppo, μ è una media complessiva osservata, α i è un effetto casuale inosservato condivisa da tutti i valori del gruppo I, e ε ij è un termine rumore inosservato."

Questo è un modello interessante soprattutto perché nei miei dati nessun valutatore ha valutato tutte le cose (sebbene la maggior parte abbia valutato 20+) e le cose sono valutate un numero variabile di volte (di solito 3-4).

Domanda n. 0: "gruppo i" in quell'esempio ("gruppo i") è un raggruppamento di cose classificate?

Domanda n. 1: se cerco l'affidabilità inter-rater, non ho bisogno di un modello di effetti casuali con due termini, uno per il rater e uno per la cosa classificata? Dopotutto, entrambi hanno possibili variazioni.

Domanda n. 2: come esprimere al meglio questo modello in R?

Sembra che questa domanda abbia una proposta carina:

lmer(measurement ~ 1 + (1 | subject) + (1 | site), mydata)

Ho esaminato un paio di domande e la sintassi del parametro "random" per lme è opaca per me. Ho letto la pagina di aiuto per lme , ma la descrizione di "random" è incomprensibile per me senza esempi.

Questa domanda è in qualche modo simile a una lunga lista di domande , con questa la più vicina. Tuttavia, molti non affrontano la R in dettaglio.


I modelli di effetti misti e quelli di effetti casuali sono codificati allo stesso modo in R. Vedi ncbi.nlm.nih.gov/pmc/articles/PMC3402032 per ulteriori informazioni sul tuto!
Noé,

Risposte:


6

Il modello a cui hai fatto riferimento nella tua domanda è chiamato "modello unidirezionale". Presuppone che gli effetti di riga casuali siano l'unica fonte sistematica di varianza. Nel caso dell'affidabilità inter-rater, le file corrispondono agli oggetti di misura (ad es. Soggetti).

Modello a senso unico : dove è la media per tutti gli oggetti, è l'effetto riga e è l'effetto residuo.

xij=μ+ri+wij
μriwij

Tuttavia, ci sono anche "modelli a due vie". Questi presuppongono che vi sia una varianza associata agli effetti di riga casuali e agli effetti di colonna casuali o fissi. Nel caso dell'affidabilità inter-rater, le colonne corrispondono alle fonti di misurazione (ad es., I rater).

Modelli a due vie : dove è la media per tutti oggetti, è l'effetto riga, è l'effetto colonna, è l'effetto di interazione ed è l'effetto residuo. La differenza tra questi due modelli è l'inclusione o l'esclusione dell'effetto di interazione.

xij=μ+ri+cj+rcij+eij
xij=μ+ri+cj+eij
μricjrcijeij

Dato un modello a due vie, è possibile calcolare uno dei quattro coefficienti ICC: la coerenza del punteggio singolo ICC (C, 1), la coerenza del punteggio medio ICC (C, k), l'accordo sul punteggio singolo ICC (A, 1) o l'accordo sul punteggio medio ICC (A, k). Le ICC a punteggio singolo si applicano alle misurazioni singole (ad esempio, singoli rater), mentre le ICC a punteggio medio si applicano alle misurazioni medie (ad esempio, la media di tutti i rater). Le ICC di coerenza escludono la varianza della colonna dalla varianza del denominatore (ad esempio, consentendo ai valutatori di variare intorno ai propri mezzi), mentre le ICC di accordo includono la varianza della colonna nella varianza del denominatore (ad esempio, imponendo ai valutatori di variare intorno alla stessa media).xijx¯i

Ecco le definizioni se si assume un effetto di colonna casuale:

Definizioni ICC a effetti casuali a due vie (con o senza effetto di interazione) :

ICC(C,1)=σr2σr2+(σrc2+σe2) or σr2σr2+σe2
ICC(C,k)=σr2σr2+(σrc2+σe2)/k or σr2σr2+σe2/k
ICC(A,1)=σr2σr2+(σc2+σrc2+σe2) or σr2σr2+(σc2+σe2)
ICC(A,k)=σr2σr2+(σc2+σrc2+σe2)/k or σr2σr2+(σc2+σe2)/k

Puoi anche stimare questi valori usando i quadrati medi di ANOVA:

ICC a due vie :

ICC(C,1)=MSRMSEMSR+(k1)MSE
ICC(C,k)=MSRMSEMSR
ICC(A,k)=MSR-MSE
ICC(A,1)=MSRMSEMSR+(k1)MSE+k/n(MSCMSE)
ICC(A,k)=MSRMSEMSR+(MSCMSE)/n

Puoi calcolare questi coefficienti in R usando il pacchetto irr :

icc(ratings, model = c("oneway", "twoway"),
type = c("consistency", "agreement"),
unit = c("single", "average"), r0 = 0, conf.level = 0.95)

Riferimenti

McGraw, KO e Wong, SP (1996). Formare inferenze su alcuni coefficienti di correlazione intraclasse. Metodi psicologici, 1 (1), 30–46.

Shrout, PE e Fleiss, JL (1979). Correlazioni intraclasse: usi nella valutazione dell'affidabilità dei valutatori. Bollettino psicologico, 86 (2), 420–428.


Grazie per la magnifica risposta! In un modello a due vie all'interno di icc in R, come possiamo rappresentare una selezione casuale di rater per riga? Voglio dire, immagina di avere un pool di 100 rater e ogni argomento è valutato da circa 5-10 di essi. Un simile scenario può essere gestito dal pacchetto icc?
michal,

Ogni rater dovrebbe avere la propria colonna nella matrice in cui si alimenta la funzione icc. Altrimenti, il calcolo è lo stesso per i modelli di effetti casuali e misti - la differenza principale è nell'interpretazione (quanto si possono considerare i risultati generalizzabili).
Jeffrey Girard,

Grazie per la risposta! Sto cercando di farlo, avendo principalmente NA nelle celle (e solo pochi valori con numeri effettivi per colonna, in cui un particolare valutatore ha valutato un soggetto corrispondente a una riga). Tuttavia, nell'output sto ricevendo un testo che dice che non sono stati registrati soggetti (ad es. Soggetti = 0 Raters = 9). Forse significa che ovunque è stata trovata almeno una NA, l'intera riga viene filtrata? Ma allora come posso indicare le valutazioni mancanti da un valutatore?
michal,

Hmm che potrebbe essere una limitazione di questa specifica funzione icc. Ho uno script MATLAB in grado di gestire questa situazione. Ti capita di avere accesso a MATLAB?
Jeffrey Girard,

1
Sì, controlla il mio sito Web: mreliability.jmgirard.com
Jeffrey Girard,
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.