Liste de nume pentru identificarea etniei sud-asiatice și chineze din datele secundare din Ontario, Canada: un studiu de validare

Dezvoltarea listelor de nume de familie

Pentru a dezvolta sudul Lista de nume de familie asiatice, am început cu lista canadiană dezvoltată anterior a numelor de familie din Asia de Sud dezvoltată folosind datele certificatului de deces. Am adăugat nume de familie găsite în directoarele telefonice ale comunității și într-o enciclopedie de nume de familie publicată de guvernul indian. Fiecare nume a fost apoi revizuit de cel puțin doi cercetători cu origini din Asia de Sud. Numele de familie au fost excluse dacă nu au fost considerate a fi unic din Asia de Sud (adică, dacă numele de familie a fost comun și în alte populații, comunități sau grupuri etnice). Dacă a existat un dezacord între cercetători cu privire la excluderea sau nu a unui nume de familie, acesta a fost examinat de un grup de cinci cercetători cu origini din Asia de Sud până la adoptarea unei decizii de consens. Lista finală a inclus toate numele de familie despre care se credea, prin consens, ca fiind unic din Asia de Sud.

Deși o listă cuprinzătoare de nume de familie chineze a fost publicată și validată anterior, am observat că această listă include câteva nume care erau nu unic chinezesc (de exemplu, Diep, Jain, Kang și Sen). Ca atare, am fost îngrijorați de valoarea predictivă pozitivă a identificării cohortelor de pacienți cu origine chineză folosind această listă. Prin urmare, am repetat un proces similar de consens pentru numele de familie din acea listă, pentru a crea o listă finală a numelor de familie considerate, prin consens, a fi unic chinezești.

Surse de date administrative

Institutul pentru Științe Evaluative Clinice (ICES) este o organizație de cercetare a serviciilor de sănătate finanțată parțial de Ministerul Sănătății și Îngrijirilor pe termen lung din Ontario (MOH) pentru a efectua analize ale bazelor de date administrative provinciale în domeniul sănătății pentru cercetări științifice relevante pentru politici. Una dintre aceste surse de date administrative este baza de date a persoanelor înregistrate (RPDB), care este un registru al numerelor de cărți de sănătate atribuite pentru toți rezidenții actuali și foști ai provinciei Ontario (populația actuală = 13 milioane). Fișierul nominal primit de la MS include „numele de familie ale pacienților. În acordul de partajare a datelor între MS și ICES, doar trei persoane numite au acces la acest fișier nominal. Îl anonimizează înainte de a fi lansat pentru utilizare analitică generală, eliminând numele și prin criptarea numerelor cardului de sănătate. Deoarece această criptare utilizează un algoritm reproductibil comun tuturor surselor de date administrative, persoanele pot fi legate între baze de date prin intermediul acestui număr unic criptat.

Listele de nume de familie au fost aplicate la valoarea nominală Fișier RPDB pentru a crea un fișier de identificare etnică. Toți rezidenții din Ontario ale căror nume de familie erau pe lista Asiei de Sud au fost atribuiți etniei din Asia de Sud; toți rezidenții ale căror nume de familie erau pe lista chineză au fost atribuiți etniei chineze; Fișierul final de identificare etnică derivat din numele de familie a inclus atât numărul criptat al cardului de sănătate, cât și atribuirea etniei pentru toți Onta. locuitorii din Rio. (Vedeți Figura 1.)

Figura 1

Derivarea fișierului de identificare etnică derivat din numele de familie din baza de date a persoanelor înregistrate.

Validare

Am validat listele de nume de familie împotriva etniei auto-raportate din Canadian Community Health Survey (CCHS). CCHS este un sondaj telefonic național transversal recurent realizat de Statistics Canada, care vizează rezidenții gospodăriilor cu vârsta de cel puțin 12 ani, cu excepția celor care locuiesc în rezervele indiene, bazele forțelor canadiene, instituții și unele zone îndepărtate. Înainte de 2007, sondajul opera pe un ciclu de colectare de doi ani, primul an examinând sănătatea generală a populației într-un eșantion mare, iar al doilea an concentrându-se pe subiecte specifice de sănătate într-un eșantion mai mic. Fiecărui respondent din fiecare sondaj i se atribuie o greutate la nivel de persoană, astfel încât greutatea să corespundă numărului de persoane din întreaga populație care sunt reprezentate de respectivul respondent, iar suma tuturor greutăților dintr-un sondaj de un an este egală cu populația de Canada. Trei cadre de eșantionare sunt folosite pentru sondaj, iar greutatea finală atribuită unei persoane este integrată din greutățile alocate independent de la fiecare cadru de eșantionare. Greutățile sunt, de asemenea, calibrate pentru a ține cont de alte prejudecăți potențiale, inclusiv lipsa de răspuns și eșantionarea gospodăriilor cu mai multe linii telefonice. Utilizarea ponderilor în analiza acestor date este necesară pentru a se asigura că rezultatele sunt reprezentative pentru populație și nu doar pentru eșantionul sondajului.Deși etnia nu este inclusă în mod specific în derivarea ponderilor respondenților, participanții sunt selectați aleatoriu din populație, deci nu există niciun motiv pentru a suspecta că ponderările ar reprezenta în mod sistematic sau supra-reprezenta orice grup etnic, mai ales că ancheta este administrat în peste 20 de limbi. Setul de date CCHS nu include numele de familie ale respondenților, dar respondenții au dat permisiunea ca răspunsurile la sondaj să fie legate de sursele de date administrative de sănătate prin numărul cardului de sănătate. Acest lucru a fost anonimizat utilizând algoritmul de criptare obișnuit la ICES, astfel încât datele CCHS să poată fi conectate cu celelalte surse de date administrative, inclusiv RPDB. Au fost utilizate două întrebări CCHS, care au fost colectate în mod obișnuit ca parte a profilului demografic al respondenților la sondaj. Acestea erau „La ce grupuri etnice aparțineau strămoșii tăi?” și „Oamenii care trăiesc în Canada provin din medii culturale și rasiale diferite. Ești …?” Au fost permise răspunsuri multiple pentru fiecare întrebare. Respondenții care au avut un singur răspuns de „sud-asiatic” la oricare dintre întrebări au fost repartizați etniei sud-asiatice; cei care au avut un singur răspuns de „chinez” la oricare dintre întrebări au fost atribuiți etniei chineze; și toți ceilalți au fost repartizați la populația generală.

Am studiat toți respondenții adulți la oricare dintre ciclurile din 2001, 2002 sau 2003 ale CCHS. Pentru fiecare respondent, etnia standard de aur a fost stabilită din răspunsurile lor auto-raportate la sondaj, în timp ce etnia lor derivată de numele de familie a fost derivată prin legarea numărului cardului de sănătate criptat din setul de date CCHS cu atribuirea lor de etnie în numele derivat fișier de identificare etnică. Valabilitatea listei de nume de familie din Asia de Sud a fost determinată prin măsurarea sensibilității (proporția persoanelor autoidentificate ca sud-asiatice care au fost detectate ca atare prin lista de nume de familie), specificitate (proporția persoanelor autoidentificate ca nefiind din Asia de Sud detectate ca atare prin lista de nume de familie), valoarea predictivă pozitivă (proporția celor detectate de lista de nume de familie ca sud-asiatice care s-au autoidentificat ca atare) și valoarea predictivă negativă (proporția celor detectate de lista de nume de familie ca nefiind sudică Asiatice care s-au autoidentificat ca atare). Au fost făcute calcule similare pentru validarea listei de nume chineze. În aceste calcule, fiecare respondent a fost ponderat de greutatea sa la nivel de persoană (împărțit la 3, deoarece am combinat respondenți din trei ani de studiu). Am comparat lista de nume de familii chinezești publicată anterior cu lista noastră de nume de familii chineze, comparând etnia derivată din numele de familie folosind ambele liste cu același standard de aur. În cele din urmă, am comparat valoarea predictivă pozitivă a fiecăreia dintre listele noastre de nume de familie stratificate în funcție de sex, vârstă și statutul de imigrare.

Etică

Datele studiului nu sunt disponibile publicului, dar au fost furnizat ICES de către MS în temeiul unui acord de cercetare. ICES este autorizat să dețină, să asocieze și să analizeze aceste date în scopuri de cercetare ca „entitate prescrisă” din legea privind confidențialitatea informațiilor despre sănătate din Ontario, Legea privind protecția informațiilor despre sănătate. Studiul a fost aprobat de comisia de revizuire instituțională a Sunnybrook Health Sciences Center .

Lasă un răspuns

Adresa ta de email nu va fi publicată. Câmpurile obligatorii sunt marcate cu *