Quali sono i criteri minimi di corrispondenza raccomandati per una corrispondenza paziente basata sulla demografia affidabile?


30

Quando si abbinano i pazienti in base ai dati demografici, ci sono raccomandazioni su quali campi devono corrispondere affinché il paziente sia lo "stesso paziente"?

So che gli algoritmi saranno diversi per le diverse implementazioni, sono solo curioso di sapere se ci sono buone pratiche o raccomandazioni in questo processo.

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

eccetera?


4
Probabilmente la risposta a questa domanda può anche cambiare a seconda del paese specifico o anche su considerazioni etniche e culturali. Ad esempio, il nome di una persona potrebbe non essere un buon identificativo del paziente per gli aborigeni australiani (o dovrebbe essere dato un "peso" inferiore nel loro caso) poiché possono cambiare nome nel tempo. Gli aborigeni australiani che hanno lo stesso nome di un defunto lo abbandonano perché ritengono che sia molto brutto portare lo stesso nome di qualcuno che è morto. Qualcosa di simile accade in altre culture dove il nome dei morti è tabù. link

4
O un altro esempio di uno studio non ancora pubblicato: negli immigrati filippini negli Stati Uniti, i dieci cognomi più comuni rappresentano circa il 6% di tutte le persone. Negli immigrati vietnamiti, rappresentano circa il 60%. I nomi sono un identificatore significativamente migliore nei filippini rispetto ai vietnamiti. Pubblicherò sicuramente quello studio quando sarà disponibile.

Solo per chiarire: l'obiettivo principale è quello di abbinare due serie di record?

Quando si tenta di abbinare i record, assicurarsi di distinguere tra la forza di una partita ("Bob" è molto simile a "Bob") rispetto al numero di possibili partite (ci sono molti Bob). Se due record hanno lo stesso nome e non ci sono altri record con quel nome , è probabilmente la stessa persona anche se gli indirizzi differiscono. Supponendo che tu abbia un corpus grande, ovviamente.
Jon of All Trades,

Risposte:


20

C'è questo fantastico saggio (in spagnolo, scusate) scritto da Pablo Pazos, un ingegnere CS dell'Uruguay che lavora su Healthcare IT dal 2006 e ha dato un grande contributo al campo, in cui descrive un algoritmo per farlo.

Puoi gestire l'articolo tramite un traduttore, ma il punto è che le informazioni di base per determinare l'identità di una persona sono il nome e il cognome (sia da padre che da madre), il sesso e la data di nascita. È interessante notare che esclude specificamente numeri di identificazione come SSN dai suoi algoritmi di corrispondenza delle identità, dal momento che "qualsiasi tipo di identificatore NON fa parte della sua identità" (immagino che questo punto potrebbe essere discutibile). Inoltre, esclude attributi come indirizzo, numeri di telefono, ecc. Poiché non sono realmente correlati all'identità di qualcuno, non sono associati a "chi è realmente qualcuno".

Inoltre, assegna "pesi" diversi a ciascuno degli attributi precedenti, in questo modo:

  • Nome: 17,5%
  • Secondo nome: 17,5%
  • Cognome (padre): 17,5%
  • Cognome (madre): 17,5%
  • Sesso: 10%
  • Data di nascita: 20%

Con le corrispondenze trovate su ciascuno di questi attributi, descrive una metodologia per ottenere un "indice di concordanza concordato" composito con il quale è possibile effettuare confronti tra record. Inoltre, sono possibili corrispondenze "parziali" sugli attributi del nome usando algoritmi come la distanza di Levenshtein .

Buona lettura, IMO. Mi dispiace che sia in spagnolo, ma spero di essere stato in grado di comunicare le sue idee principali.


2
questo è fantastico, grazie. +1 anche per menzionare la distanza poiché gli errori di battitura sono abbastanza comuni soprattutto nelle comunità con un'elevata diversità del background culturale, come spesso accade nel Nord America. Detto questo, la maggior parte dei casi in cui devo eseguire corrispondenze al dominio dei possibili valori è piuttosto limitata. Quindi in questi casi qualsiasi criterio affidabile (come i numeri di assicurazione sanitaria) che restituisce un singolo hit nel database sarà sufficiente, se vengono restituite più voci tendo a chiedere all'utente (se disponibile) o filtrare con criterio aggiuntivo.

. In questi casi il cliente è registrato o in clinica o in ospedale oppure no. In caso di MPI, tuttavia, si tratta di un gioco con la palla completamente nuovo.

13

Non esiste un singolo algoritmo magico per la corrispondenza dei pazienti e dubito che ci sarà mai.

Per cominciare, ci sono variazioni regionali. Come ha sottolineato MMattoli, ciò che funziona bene in un ospedale urbano degli Stati Uniti probabilmente non andrà bene in una clinica rurale australiana che tratta aborigeni.

Inoltre, i singoli siti hanno viste diverse sulla tolleranza agli errori. Se abbinassi solo quando eri assolutamente sicuro , otterrai molte partite perse. Ciò causa duplicati dei dati dei pazienti, il che crea tutta un'altra serie di problemi. La maggior parte dei siti saranno disposti ad accontentarsi di abbastanza sicuri , ma quanto è abbastanza sicuro? Chiedi a 10 persone e otterrai 12 risposte.

Pertanto l'algoritmo "migliore" sarà configurabile, in modo che i tuoi clienti possano sintonizzarlo per adattarlo alle loro esigenze.

Quando si considera una partita, diversi campi offrono vari gradi di confidenza.

Gli identificatori specifici dell'assistenza sanitaria offrono la massima sicurezza, poiché il loro scopo è quello di identificare in modo univoco la persona all'interno del sistema sanitario. Gli ospedali di solito si preoccupano di assicurarsi che questi non vengano duplicati.

Esempi:

  • ID sanitario nazionale (ad es. Numero NHS del Regno Unito)
  • Numero della cartella clinica assegnato dall'ospedale.

Anche altri identificatori di pazienti possono offrire un'elevata sicurezza, a seconda del sistema. Ad esempio, un documento di identità militare è probabilmente molto rilevante in un ospedale militare.

Esempi:

  • ID militare
  • ID assicurazione
  • Numero di previdenza sociale (Negli Stati Uniti, il numero di previdenza sociale non è generalmente considerato una corrispondenza di elevata fiducia, a causa di frodi assicurative dilaganti.)

In assenza di identificatori univoci, è necessario ricorrere alle informazioni demografiche. Si sconsiglia di abbinare su un campo qualsiasi , ma più campo demografico corrisponde, più è sicura la corrispondenza.

Le cose su una persona che non cambiano spesso vanno bene per l'abbinamento:

  • Nome
  • Genere
  • Data di nascita

Ma nella partita possono essere prese in considerazione anche informazioni più malleabili per aumentare la fiducia:

  • Indirizzo
  • Numero di telefono
  • Indirizzo email

3
SSN ha anche alcune restrizioni molto rigide, ad esempio in Canada è illegale persino chiederlo a meno che tu non sia un datore di lavoro o una banca (forse anche un po 'di più, non sono un avvocato). Altri posti come la Cina lo usano per quasi tutto, anche per acquistare i biglietti del treno durante le vacanze ad alto traffico.

Le modifiche al nome sono comuni se sei una femmina. E due persone hanno spesso lo stesso nome e vivono persino nello stesso posto (padre con un figlio che prende il nome da lui per esempio).
HLGEM,

@HLGEM: completamente corretto, motivo per cui non è necessario utilizzare un singolo campo demografico per la corrispondenza. Ma quando la gente deve ricorrere a questo, i campi più statici (che tuttavia cambiano a volte) sono più affidabili dell'alternativa. Questo non li rende buoni, però.
Lynn,

7

Vale anche la pena controllare i cognomi precedenti poiché questi spesso cambiano.


+1 "spesso" è un eufemismo. :) Questo può certamente essere il caso di pazienti che non sono identificabili o senza nome, neonati, erroneamente identificati e così via. I nomi sono più difficili, ma più significativi, in un ambiente con molte transazioni.

4

A parte le combinazioni ovvie delle tre seguenti riportate nella tua domanda

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

Vorrei pensare di aggiungere phone number (Home and/or Cell)alla lista. In questi giorni è abbastanza comune e ognuno avrà un numero unico e anche se alcune volte le persone cambiano i loro numeri di telefono, i numeri di telefono più vecchi vengono ricordati dalla maggior parte delle persone, quindi possono tornare utili.

Abbiamo scoperto che l'indirizzo soffre spesso di più ortografia e di diversi modi di rendering, specialmente in paesi come l'India, dove le persone usano una lingua locale e i software di gestione dei pazienti "usano" l'inglese.


3

Il genere nei documenti sembra spesso derivare dal nome. Ho visto una maggiore varianza di genere per gli stranieri, quando non possiamo derivare il genere dal nome.

In Germania abbiamo alcune ulteriori variazioni con nomi contenenti "Umlaute" come "äöü", che a volte vengono sostituiti da "ae oe ue".


1

Il mio pensiero è nell'ordine come sotto 1). SSN, Cognome e primi 5 caratteri del nome 2). SSN, Birthdate e primi 5 caratteri di nome 3). SSN, data di nascita e cognome 4). SSN, genere, data di nascita 5). Cognome, primi 5 caratteri di nome, città e CAP


1

Questo è un problema davvero difficile negli Stati Uniti. I nomi non sono univoci e spesso cambiano durante la vita di una persona o sono presentati in modo diverso (Rob contro Robert per esempio), quindi non possono mai essere usati per identificare il paziente se non in congiunzione con alcune informazioni più realizzabili. Il numero dell'assicurazione sanitaria e il fornitore cambiano molto più frequentemente e possono essere gli stessi per più membri della famiglia. SSN è presumibilmente unico, ma c'è una frode attorno ad esso. Lo stesso vale per il numero di licenza del conducente che ovviamente non tutti avranno.

Personalmente, vorrei iniziare con il numero di polizza assicurativa e la data di nascita e la combinazione di nomi, quindi SSN e la data di nascita e la combinazione di nomi. Vorrei controllare l'indirizzo e il telefono per darmi ulteriori garanzie quando corrispondono ma non molto peso se non lo fanno. Inoltre, userei il gruppo sanguigno come fattore di esclusione se è noto (e sappiamo tutti che i vampiri dell'ospedale prenderanno campioni di sangue) poiché ciò non cambia. La corrispondenza dei nomi dovrebbe essere una corrispondenza fuzzy a causa del problema di modifica del nome. Altre cose dovrebbero generalmente cercare una corrispondenza esatta prima di una partita fuzzy se la sicurezza del nome è davvero alta (potrebbe essere stato un errore di battitura che entra nell'SSN).

Utilizzando il nostro sito, riconosci di aver letto e compreso le nostre Informativa sui cookie e Informativa sulla privacy.
Licensed under cc by-sa 3.0 with attribution required.