Quali sono i modi per mostrare due metodi analitici equivalenti?


11

Ho due diversi metodi analitici che possono misurare la concentrazione di una particolare molecola in una matrice (ad esempio misurare la quantità di sale nell'acqua)

I due metodi sono diversi e ognuno ha il proprio errore. Quali modi esistono per mostrare i due metodi sono equivalenti (o no).

Sto pensando che tracciare i risultati di un certo numero di campioni misurati con entrambi i metodi su un grafico a dispersione sia un buon primo passo, ma ci sono buoni metodi statistici?


Puoi fornire maggiori dettagli nella tua domanda? Non capisco quale sia "la concentrazione di una particolare molecola in una matrice".
Robin Girard,

2
@robin: "matrice" in questo contesto è la terminologia chimica analitica standard; si riferisce al mezzo in cui si possono trovare le entità da analizzare (gli "analiti"). Ad esempio, se stai analizzando la concentrazione di piombo nell'acqua del rubinetto, il piombo è l'analita e l'acqua è la matrice.
JM non è uno statistico il

Risposte:


13

Il semplice approccio di correlazione non è il modo giusto per analizzare i risultati degli studi di confronto dei metodi. Ci sono (almeno) due libri altamente raccomandati su questo argomento a cui ho fatto riferimento alla fine (1,2). In breve, quando si confrontano i metodi di misurazione, di solito ci si aspetta che (a) le nostre conclusioni non debbano dipendere dal particolare campione utilizzato per il confronto e (b) si debba tenere conto dell'errore di misurazione associato al particolare strumento di misurazione. Ciò preclude qualsiasi metodo basato su correlazioni e rivolgeremo la nostra attenzione ai componenti di varianza o ai modelli a effetti misti che consentono di riflettere l'effetto sistematico dell'articolo (qui, l'articolo sta per individuo o campione su cui vengono raccolti i dati), che deriva da (un).

Nel tuo caso, hai raccolto singole misurazioni utilizzando due metodi diversi (presumo che nessuno di essi possa essere considerato uno standard di riferimento) e la cosa fondamentale da fare è tracciare le differenze ( ) rispetto ai mezzi ( ); questo è chiamato un . Ti permetterà di verificare se (1) le variazioni tra le due serie di misurazioni sono costanti e (2) la varianza della differenza è costante nell'intervallo dei valori osservati. Fondamentalmente, questa è solo una rotazione di 45 ° di un semplice diagramma a dispersione di rispetto a e la sua interpretazione è simile a un diagramma di valori adattati vs. residui utilizzati nella regressione lineare. Poi, ( X 1 + X 2 ) / 2 X 1 X 2X1X2(X1+X2)/2X1X2

  • se la differenza è costante ( polarizzazione costante ), è possibile calcolare il limite di accordo (vedere (3))
  • se la differenza non è costante nell'intervallo di misurazione, è possibile adattare un modello di regressione lineare tra i due metodi (scegliere quello desiderato come predittore)
  • se la varianza delle differenze non è costante, prova a trovare una trasformazione adatta che renda la relazione lineare con varianza costante

Altri dettagli sono disponibili in (2), capitolo 4.

Riferimenti

  1. Dunn, G (2004). Progettazione e analisi di studi di affidabilità . Arnold. Vedi la recensione sull'International Journal of Epidemiology .
  2. Carstensen, B (2010). Confronto dei metodi di misurazione clinica . Wiley. Vedere il sito Web associato , incluso il codice R.
  3. L'articolo originale di Bland e Altman, Metodi statistici per valutare l'accordo tra due metodi di misurazione clinica .
  4. Carstensen, B (2004). Confronto e previsione tra diversi metodi di misurazione . Biostatistica , 5 (3) , 399–413.

ti dispiacerebbe chiarire cosa intendi con "(a) le nostre conclusioni non dovrebbero dipendere dal particolare campione utilizzato per il confronto"? Sto riscontrando problemi a causa dell'ambiguità di "campione" in questo contesto: significa "campione statistico" (un insieme di dati che si presume rappresenti un processo o una popolazione) o "campione ambientale" (un po 'di acqua, suolo, aria o tessuto, in genere). Con entrambi i significati non riesco proprio a trarre la linea logica per la tua conclusione che questo "preclude qualsiasi metodo basato su correlazioni".
whuber

@whuber Bene, intendo la raccolta di dati osservati (ad es. concentrazione di glucosio) che, idealmente, dovrebbe essere rappresentativa del probabile intervallo di ciò che viene misurato. Affidarsi alla correlazione può essere fuorviante perché dipende dalle unità campionate (ad esempio pazienti in un ospedale): possiamo ottenere una correlazione più elevata semplicemente ottenendo una o più misurazioni estreme su entrambe le scale, sebbene la relazione tra i due metodi sia sempre la stessa . Quindi, l'idea è che la distribuzione della misura di interesse non dovrebbe influenzare la nostra conclusione sulla comparabilità dei metodi. (...)
chl

@whuber (...) Ciò che vogliamo valutare è l' accordo al di là dei dati , non la relazione nei dati (sto citando Carstensen 2010 p. 8-9).
chl

Grazie; questo chiarisce bene la tua posizione. Questo è essenzialmente un esercizio di calibrazione, tranne per il fatto che non sembra che abbiamo uno standard di riferimento per il confronto; supponiamo semplicemente che i campioni fisici scelti dallo sperimentatore coprano una serie di concentrazioni reali. Pertanto, mentre scrivi, la correlazione di per sé non è necessariamente una misura utile di accordo tra i due metodi. Tuttavia, in genere, soprattutto per le analisi chimiche, è nota la vera concentrazione (poiché lo sperimentatore ha introdotto una quantità nota di una sostanza nella matrice).
whuber

@whuber Esatto. In assenza di un gold standard, siamo semplicemente interessati alla misura in cui i due metodi producono risultati "comparabili", quindi l'idea di fare affidamento sui cosiddetti limiti di accordo. Sebbene la vera misura possa essere conosciuta in anticipo, ogni strumento di misura porta il proprio errore di misurazione - almeno per quelli con cui ho avuto a che fare nel dominio biomedico (ad es. Concentrazione di glucosio nel sangue) e neuropsicologico (ad es. Livello di depressione).
chl

2

Se non hai modo di conoscere la vera concentrazione, l'approccio più semplice sarebbe una correlazione. Un ulteriore passo avanti potrebbe essere quello di condurre una semplice regressione predicendo il risultato sul metodo 2 usando il metodo 1 (o viceversa). Se i metodi sono identici, l'intercetta dovrebbe essere 0; se l'intercetta è maggiore o minore di 0 indicherebbe la distorsione di un metodo rispetto a un altro. La pendenza non standardizzata dovrebbe essere vicino a 1 se i metodi in media producono risultati identici (dopo aver controllato una distorsione verso l'alto o verso il basso nell'intercetta). L'errore nella pendenza non standardizzata potrebbe servire da indice della misura in cui i due metodi concordano.

Mi sembra che la difficoltà con i metodi statistici qui che stai cercando di affermare ciò che è tipicamente posto come un'ipotesi nulla, cioè che non ci siano differenze tra i metodi. Questo non è un colpo mortale per l'utilizzo di metodi statistici finché non hai bisogno di un valore p e puoi quantificare ciò che intendi per "equivalente" e puoi decidere quanta deviazione possono avere l'uno dall'altro prima di non più considerali equivalenti. Nell'approccio di regressione che ho descritto sopra, potresti considerare i metodi equivalenti se l'intervallo di confidenza attorno alla stima della pendenza includesse 1 e l'IC attorno all'intercetta includesse 0.


In chemiometria le risposte dello strumento sono spesso non lineari ed eteroscedastiche. Come minimo ciò impone una certa cautela nel condurre e interpretare la regressione.
whuber

1

Sono d'accordo con @drnexus. Inoltre, potrei raccomandare un test di Morgan-Pitman per l'uguaglianza delle varianze dei due metodi. Questo ti direbbe se un metodo ha più varianza rispetto all'altro. Questo di per sé potrebbe non essere una cosa negativa perché presumibilmente i due test hanno diversi compromessi di bias-varianza (ad esempio, un test potrebbe sempre dire 50% (distorto, ma nessuna varianza) mentre l'altro è imparziale ma molto rumoroso). Alcune conoscenze di dominio potrebbero essere utili qui per determinare la quantità di compromessi che desideri per il tuo metodo. Naturalmente, come notato da altri, sarebbe molto preferito avere un "gold standard".


1

Piuttosto una vecchia domanda, ma come è tornato oggi:

La parola chiave generale è "convalida della chimica analitica" e come tale è un po 'fuori tema qui (ma poiché non esiste un sito di Chimica qui (ancora: http://area51.stackexchange.com/proposals/4964/chemistry , I suppongo che possiamo lasciarlo qui per il momento)

Per questo ci sono alcune procedure standard in chimica analitica.

Libri:

  • Funk et. al: Quality Assurance in Analytical Chemistry, Wiley-VCH.

  • Kromidas (Hrsg.): Handbuch Validierung in der Analytik, Wiley-VCH
    (Non so se esiste una versione inglese e non ce l'ho (ancora). Ma il sommario elenca la convalida della calibrazione multivariata.)

Anche IUPAC ha qualcosa da dire al riguardo:

  • Danzer, K. e Currie, LA: Linee guida per la calibrazione in chimica analitica. Parte I. Fondamenti e calibrazione dei singoli componenti, Chimica pura e applicata, IUPAC, 1998, 4, 993-1014

  • Danzer, K. e Otto, M. e Currie, LA: Linee guida per la calibrazione in chimica analitica. Parte 2: Calibrazione multicomponente Chimica pura e applicata, 2004, 76, 1215-1225


0

Il tuo uso della frase "metodi analitici" mi confonde un po '. Presumo che per "metodi analitici" intendi un modello specifico / strategia di stima.

In generale, parlando esistono due tipi di metriche che è possibile utilizzare per scegliere tra gli stimatori.

Metriche nel campione

  • Rapporto di verosimiglianza / test di Wald / test di punteggio
  • R 2
  • Percentuale di hit nel campione (percentuale di previsioni corrette per i dati del campione)
  • (Molte altre metriche a seconda del modello / contesto di stima)

Metriche fuori campione

  • Percentuali di hit fuori campione (percentuale di previsioni corrette per dati fuori campione)

Se le stime sono equivalenti, si comporterebbero altrettanto bene su queste metriche. Si potrebbe anche vedere se le stime non sono statisticamente diverse tra loro (come il test a due campioni sull'uguaglianza dei mezzi) ma la metodologia per questo dipenderebbe dal modello e dalle specifiche del metodo.


Scusa, intendevo un metodo di misurazione analitico. Ho riformulato la domanda.
PaulHurleyuk,

In tal caso, penso che il test a due campioni di uguaglianza per mezzi / proporzioni sia ciò che potresti voler fare.

2
Un test di medie / proporzioni non ti darebbe solo una stima puntuale del fatto che i due metodi abbiano dato la stessa risposta media per un determinato insieme di risposte? Questo approccio non potrebbe produrre un risultato di "uguale" anche se i due metodi fossero effettivamente correlati negativamente l'uno con l'altro?
Russellpierce,

Questo è un buon punto.
Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.