Test statistico per confrontare la precisione di due dispositivi


10

Sto confrontando due dispositivi di controllo della temperatura entrambi progettati per mantenere la temperatura corporea esattamente a 37 gradi nei pazienti anestetizzati. I dispositivi sono stati montati su 500 pazienti che formano due gruppi. Gruppo A (400 pazienti) - Dispositivo 1, Gruppo B (100 pazienti) - Dispositivo 2. Ad ogni paziente è stata misurata la temperatura una volta ogni ora per 36 ore, ottenendo 18000 punti dati tra due gruppi. Devo determinare quale dispositivo controlla la temperatura corporea dei pazienti in modo più preciso nell'arco delle 36 ore. Ho creato grafici a linee che uniscono i valori mediani in ogni momento con barre di quartile e visivamente sembra che ci sia una differenza. Come devo analizzare i miei dati per dimostrare una differenza statistica?


Hai condiviso i pazienti tra i dispositivi? In caso contrario, si deve supporre che i pazienti di due gruppi siano simili in senso lato.
Aksakal,

Che dire di un modello di effetti misti? Gli errori standard per ciascun livello (gruppo A / B) direbbero, in un certo senso, quanto siano precise le misurazioni. È possibile tenere conto delle serie storiche e dei pazienti.
Roman Luštrik,

Risposte:


2

o

Quando si formula questo tipo di metrica, si sta implicitamente adottando una "funzione di penalità" che penalizza le temperature che si discostano dalla temperatura desiderata. Un'opzione sarebbe quella di misurare la "precisione" mediante una varianza inferiore attorno alla temperatura desiderata (trattandola come media fissa per il calcolo della varianza). La varianza viene penalizzata da un errore al quadrato, in modo da fornire una ragionevole penalizzazione per deviazioni elevate. Un'altra opzione sarebbe quella di penalizzare più pesantemente (ad esempio, errore al cubo). Un'altra opzione sarebbe quella di misurare semplicemente la quantità di tempo in cui ciascun dispositivo ha il paziente al di fuori dell'intervallo di temperatura che è clinicamente sicuro. In ogni caso, qualunque cosa tu scelga dovrebbe riflettere i pericoli percepiti di deviazione dalla temperatura desiderata.

Dopo aver determinato ciò che costituisce una metrica di "buona precisione", formulerai una sorta di "test di eteroscedasticità", formulato nel senso più ampio di consentire qualunque misura di precisione tu stia usando. Non sono sicuro di essere d'accordo con il commento di Whuber sulla regolazione dell'autocorrelazione. Dipende molto dalla tua formulazione di perdita: dopotutto, rimanere in un intervallo di temperature elevate per un lungo periodo di tempo potrebbe essere esattamente la cosa più pericolosa, quindi se ti adegui per tenere conto dell'auto-correlazione, potresti finire non riuscire a penalizzare sufficientemente i risultati altamente pericolosi.


0

Questo è un test di omoscedasticità. E poiché si tratta di una serie storica , la scelta appropriata è il test Breusch – Pagan , non il test F. Questo test risponde SOLO alla domanda sulla parità di precisione tra i due dispositivi. Il livello di precisione è un altro modo di pensare alla varianza.

[Modifica: modificato il test con quello corretto, considerando la dipendenza dal tempo]


3
Questo approccio è ragionevole. Ma perché non raggiungere entrambi gli obiettivi direttamente, confrontando le dispersioni intorno alla temperatura target piuttosto che le varianze (che misurano solo le dispersioni attorno alle temperature medie)? Una questione importante da verificare in primo luogo riguarda la correlazione seriale: se è elevata, è necessario apportare alcune correzioni (come ridurre i gradi di libertà nei test). Un altro problema riguarda la perdita : la funzione di perdita probabilmente non è quadratica. Forse le persone possono facilmente tollerare piccole fluttuazioni, ma il verificarsi di una grande fluttuazione potrebbe ferire. Questo dovrebbe essere esplorato.
whuber

@whuber Per quanto riguarda il confronto intorno alla temperatura target, se fossi in me, è esattamente quello che farei. L'OP ha appena specificamente posto la domanda sulla varianza, quindi indipendentemente dalle nostre inclinazioni, dobbiamo affrontarlo direttamente, sì? :)
Gary Chung,

2
Il problema per un test F non sarà la normalità, probabilmente sarà l'indipendenza. Queste sono serie temporali.
Glen_b -Restate Monica

@Glen_b Non riesco a credere di aver perso quel punto. Grazie per averlo scoperto. Modificato.
Gary Chung,

9
Con rispetto, no: la differenza tra questo sito e, diciamo, il sito di matematica è che una parte sostanziale della risposta a una domanda statistica implica aiutare l'OP a inquadrarlo come previsto. Molto spesso, le risposte corrette alle domande come originariamente poste qui sono poco utili o addirittura fuorvianti. Quindi il nostro primo compito come lettori attivi e aspiranti intervistati è accertare che stiamo interpretando la domanda in modo utile e appropriato e fornire risposte che rispondano meglio agli obiettivi del PO. Usa i commenti alla domanda per porre domande di chiarimento e verificare la tua interpretazione.
whuber

0

Se sei interessato a come i dispositivi mantengono una temperatura di 37 ° C, puoi:

  1. Usa tutti i dati disponibili di ogni persona così come sono o
  2. Stimare la deviazione media per persona da 37 ° C usando le 36 prove di ciascuna persona.

I dati si prestano naturalmente a misure ripetute di trattamento. Trattando le prove interne alla persona come cluster, ridurrete la probabilità di un intervallo di confidenza falsamente stimato intorno all'effetto del dispositivo. Inoltre, è possibile testare l'effetto del tempo tra i due dispositivi o come interazione con il dispositivo per accertare se il mantenimento della temperatura nel tempo è stato buono. Trovare un modo per visualizzare tutto ciò è di fondamentale importanza e può suggerire un approccio piuttosto che un altro. Qualcosa sulla falsariga di:

library(dplyr)
library(lme4)

set.seed(42)
id <- rep(1:500, each=36)
time <- rep(1:36,500)
temp <- c(rnorm(36*400, 38,0.5), rnorm(36*100,37.25,0.5))
temp <- temp + 1/time

prox_37 <- temp - 37
group <- c(rep("A",36*400), rep("B",36*100))
graph_t <- ifelse(group=="A", time-0.25, time+0.25)
df <- data.frame(id,time,temp,prox_37,group, graph_t)

id_means <- group_by(df, id) %>% summarize(mean_37 = mean(prox_37))
id_means$group <- c(rep("A",400), rep("B",100))

boxplot(id_means$mean_37 ~ id_means$group)

plot(graph_t, prox_37, col=as.factor(group))
loess_fit <- loess(prox_37 ~ time, data = df)
lines(c(1:36), predict(loess_fit, newdata= c(1:36)) , col = "blue")

summary(t.test(mean_37 ~group, data=id_means))

model1 <- glm(prox_37 ~ as.factor(group), family = "gaussian", data=df)
model2 <- lmer(prox_37 ~ as.factor(group) + (1 | id), data=df)
model3 <- lmer(prox_37 ~ as.factor(group) + time + (1 | id), data=df)
model4 <- lmer(prox_37 ~ as.factor(group) + time + time*as.factor(group) + (1 | id), data=df)

AIC(model1)
summary(model2)
summary(model3)
summary(model4)

inserisci qui la descrizione dell'immagine

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.