Elenchi di cognomi per identificare letnia dellAsia meridionale e cinese da dati secondari in Ontario, Canada: uno studio di convalida

Sviluppo degli elenchi di cognomi

Per sviluppare il Sud Elenco dei cognomi asiatici, abbiamo iniziato con lelenco canadese dei cognomi dellAsia meridionale sviluppato in precedenza utilizzando i dati del certificato di morte. Abbiamo aggiunto cognomi trovati negli elenchi telefonici della comunità e in unenciclopedia dei cognomi pubblicata dal governo indiano. Ogni nome è stato poi rivisto da almeno due ricercatori con origini dellAsia meridionale. I cognomi venivano esclusi se non erano ritenuti essere unicamente dellAsia meridionale (cioè se il cognome era comune anche ad altre popolazioni, comunità o gruppi etnici). Se cera disaccordo tra i ricercatori sullopportunità o meno di escludere un cognome, è stato esaminato da un gruppo di cinque ricercatori con origini dellAsia meridionale fino a quando non è stata raggiunta una decisione di consenso. Lelenco finale comprendeva tutti i cognomi ritenuti, per consenso, esclusivamente dellAsia meridionale.

Sebbene un elenco completo di cognomi cinesi sia stato precedentemente pubblicato e convalidato, abbiamo notato che questo elenco includeva alcuni nomi che erano non unicamente cinese (ad esempio, Diep, Jain, Kang e Sen). Pertanto, eravamo preoccupati per il valore predittivo positivo dellidentificazione di coorti di pazienti di origine cinese utilizzando questo elenco. Pertanto, abbiamo ripetuto un processo di consenso simile per i cognomi di tale elenco, per creare un elenco finale di cognomi ritenuti, per consenso, esclusivamente cinesi.

Fonti di dati amministrativi

Il LInstitute for Clinical Evaluative Sciences (ICES) è unorganizzazione di ricerca sui servizi sanitari finanziata in parte dal Ministero della salute e dellassistenza a lungo termine (MOH) dellOntario per condurre analisi dei database amministrativi sanitari provinciali per la ricerca scientifica e rilevante per le politiche. Una di queste fonti di dati amministrativi è il Registered Persons Database (RPDB), che è un registro dei numeri di tessera sanitaria assegnati a tutti gli attuali ed ex residenti della provincia dellOntario (popolazione attuale = 13 milioni). Il file nominale ricevuto dal MOH include i cognomi dei pazienti. Nellaccordo di condivisione dei dati tra il MOH e il CIEM, solo tre persone nominate hanno accesso a questo file nominale. Lo rendono anonimo prima del rilascio per uso analitico generale rimuovendo i nomi e crittografando i numeri della tessera sanitaria. Poiché questa crittografia utilizza un algoritmo riproducibile comune a tutte le fonti di dati amministrativi, le persone possono essere collegate tra i database tramite questo numero crittografato univoco.

Gli elenchi dei cognomi sono stati applicati al nominale File RPDB per creare un file di identificazione etnica. Tutti i residenti dellOntario i cui cognomi erano nellelenco dellAsia meridionale sono stati assegnati alletnia dellAsia meridionale; tutti i residenti i cui cognomi erano nellelenco cinese sono stati assegnati alletnia cinese; tutti gli altri sono stati assegnati alla popolazione generale Il file di identificazione etnica finale derivato dal cognome includeva sia il numero di tessera sanitaria criptata che lassegnazione delletnia per tutti residenti di rio. (Vedi figura 1)

Figura 1

La derivazione del file di identificazione etnica derivato dal cognome dal Database delle persone registrate.

Convalida

Abbiamo convalidato gli elenchi di cognomi rispetto alletnia auto-dichiarata dal Canadian Community Health Survey (CCHS). Il CCHS è un sondaggio telefonico nazionale trasversale ricorrente condotto da Statistics Canada, rivolto ai residenti delle famiglie di età pari o superiore a 12 anni, esclusi quelli che vivono nelle riserve indiane, basi delle forze armate canadesi, istituzioni e alcune aree remote. Prima del 2007, lindagine operava su un ciclo di raccolta di due anni, con il primo anno che esaminava la salute della popolazione generale in un ampio campione e il secondo anno incentrato su argomenti sanitari specifici in un campione più piccolo. A ogni intervistato in ogni sondaggio viene assegnato un peso a livello di persona, in modo che il peso corrisponda al numero di persone nellintera popolazione rappresentate da quel rispondente e la somma di tutti i pesi in un sondaggio di un anno è uguale alla popolazione di Canada. Per il sondaggio vengono utilizzati tre frame di campionamento e il peso finale assegnato a un individuo viene integrato dai pesi assegnati indipendentemente da ciascun frame di campionamento. I pesi sono inoltre calibrati per tenere conto di altri potenziali pregiudizi, tra cui la mancata risposta e il campionamento eccessivo delle famiglie con più linee telefoniche Luso dei pesi nelle analisi di questi dati è necessario per garantire che i risultati siano rappresentativi della popolazione, e non solo del campione di indagine.Sebbene letnia non sia specificatamente inclusa nella derivazione dei pesi degli intervistati, i partecipanti sono selezionati a caso dalla popolazione, quindi non cè motivo di sospettare che le ponderazioni rappresenterebbero sistematicamente sotto o sovrarappresenterebbero qualsiasi gruppo etnico, soprattutto perché lindagine è amministrato in oltre 20 lingue Il set di dati CCHS non include i cognomi degli intervistati, ma gli intervistati hanno dato il permesso di collegare le loro risposte al sondaggio a fonti di dati amministrativi sanitari tramite il loro numero di tessera sanitaria. Questo è stato reso anonimo utilizzando il consueto algoritmo di crittografia presso ICES, in modo che i dati CCHS possano essere collegati con le altre fonti di dati amministrativi, compreso lRPDB.

Il gold standard era letnia auto-segnalata dal CCHS. Sono state utilizzate due domande CCHS, che sono state raccolte di routine come parte del profilo demografico degli intervistati. Erano “A quali gruppi etnici appartenevano i tuoi antenati?” e “Le persone che vivono in Canada provengono da molti contesti culturali e razziali diversi. Sei …?” Sono state consentite più risposte per ogni domanda. Gli intervistati che avevano una singola risposta di “Asia meridionale” a entrambe le domande sono stati assegnati alletnia dellAsia meridionale; quelli che avevano ununica risposta di “cinese” a entrambe le domande sono stati assegnati alletnia cinese; e tutti gli altri sono stati assegnati alla popolazione generale.

Abbiamo studiato tutti gli adulti intervistati a uno qualsiasi dei cicli 2001, 2002 o 2003 del CCHS. Per ogni intervistato, letnia gold standard è stata stabilita dalle loro risposte auto-riferite al sondaggio, mentre letnia derivata dal cognome è stata derivata dal collegamento del numero di tessera sanitaria crittografata dal set di dati CCHS con la loro assegnazione di etnia nel derivato dal cognome file di identificazione etnica. La validità dellelenco dei cognomi dellAsia meridionale è stata determinata misurando la sensibilità (la percentuale di persone autoidentificate come asiatiche del sud che sono state rilevate come tali dallelenco dei cognomi), la specificità (la percentuale di persone auto-identificate come non asiatiche rilevati come tali dalla lista dei cognomi), valore predittivo positivo (la proporzione di quelli rilevati dalla lista dei cognomi come sud asiatici che si sono identificati come tali) e valore predittivo negativo (la proporzione di quelli rilevati dalla lista dei cognomi come non meridionali Asiatico che si è identificato come tale). Calcoli simili sono stati effettuati per convalidare lelenco dei cognomi cinesi. In questi calcoli, ogni intervistato è stato ponderato in base al proprio peso a livello di persona (diviso per 3, perché stavamo combinando gli intervistati di tre anni di indagine). Abbiamo confrontato lelenco dei cognomi cinesi pubblicato in precedenza con il nostro elenco dei cognomi cinesi confrontando letnia derivata dal cognome utilizzando entrambi gli elenchi con lo stesso gold standard. Infine, abbiamo confrontato il valore predittivo positivo di ciascuno dei nostri elenchi di cognomi stratificati per sesso, età e stato di immigrazione.

Etica

I dati per lo studio non sono disponibili pubblicamente, ma sono stati fornito al CIEM dal Ministero della Difesa nel quadro di un accordo di ricerca. Il CIEM è autorizzato a conservare, collegare e analizzare questi dati per scopi di ricerca come “entità prescritta” nella legge sulla privacy delle informazioni sanitarie dellOntario, lHealth Information Protection Act. Lo studio è stato approvato dal comitato di revisione istituzionale del Sunnybrook Health Sciences Center .

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *