Seznamy příjmení k identifikaci jihoasijského a čínského etnika ze sekundárních údajů v Ontariu v Kanadě: ověřovací studie

Vývoj seznamů příjmení

Rozvoj jihu Seznam asijských příjmení jsme začali dříve vytvořeným kanadským seznamem jihoasijských příjmení vytvořeným pomocí údajů z úmrtního listu. Přidali jsme příjmení nalezená v komunálních telefonních seznamech a v encyklopedii příjmení zveřejněnou indickou vládou. Každé jméno poté zkontrolovali nejméně dva vědci původem z jižní Asie. Příjmení byla vyloučena, pokud nebyla považována za jednoznačně jihoasijská (tj. Pokud bylo příjmení běžné i v jiných populacích, komunitách nebo etnických skupinách). Pokud mezi badateli došlo k neshodě ohledně toho, zda příjmení vyloučit, či nikoli, bylo to přezkoumáno porotou složenou z pěti výzkumníků jihoasijského původu, dokud nebylo dosaženo konsensuálního rozhodnutí. Konečný seznam zahrnoval všechna příjmení, o nichž se podle konsensu jednoznačně vědělo, že budou jednoznačně jihoasijskými.

Ačkoli byl dříve publikován a ověřen komplexní seznam čínských příjmení, poznamenali jsme, že tento seznam obsahoval některá jména, která byla ne jednoznačně čínština (např. Diep, Jain, Kang a Sen). Proto nás znepokojovala pozitivní prediktivní hodnota identifikace kohort pacientů čínského původu pomocí tohoto seznamu. Proto jsme opakovali podobný konsensuální proces pro příjmení z tohoto seznamu, abychom vytvořili konečný seznam příjmení, o nichž se podle konsensu předpokládá, že budou jednoznačně čínská.

Zdroje administrativních údajů

Institut pro klinické hodnotící vědy (ICES) je organizace zabývající se výzkumem zdravotnických služeb, která je částečně financována ministerstvem zdravotnictví a dlouhodobé péče v Ontariu (MOH) za účelem provádění analýz správních databází provinční zdravotní péče pro politicky relevantní a vědecký výzkum. Jedním z těchto zdrojů administrativních údajů je databáze registrovaných osob (RPDB), což je registr přidělených čísel zdravotních karet pro všechny současné i bývalé obyvatele provincie Ontario (současná populace = 13 milionů). Nominální soubor obdržený od MOH zahrnuje příjmení pacientů. V dohodě o sdílení údajů mezi MOH a ICES mají k tomuto nominálnímu souboru přístup pouze tři jmenovaní jednotlivci. Před jeho vydáním jej anonymizují pro obecné analytické použití odstraněním jmen a šifrováním čísel zdravotních karet. Protože toto šifrování používá reprodukovatelný algoritmus společný pro všechny zdroje administrativních dat, mohou být jednotlivci propojeni mezi databázemi prostřednictvím tohoto jedinečného šifrovaného čísla.

Seznamy příjmení byly použity na nominální Soubor RPDB k vytvoření etnického identifikačního souboru. Všichni obyvatelé Ontaria, jejichž příjmení byla na jihoasijském seznamu, byla přidělena k jihoasijskému etniku; všichni obyvatelé, jejichž příjmení byla na čínském seznamu, byla přiřazena čínskému etniku; všichni ostatní byli přiřazeni k obecné populaci skupina. Konečný etnický identifikační soubor odvozený z příjmení zahrnoval jak šifrované číslo zdravotní karty, tak přiřazení etnického původu pro všechny obyvatelé Rio. (Viz obrázek 1.)

Obrázek 1

Odvození etnického identifikačního souboru odvozeného od příjmení z databáze registrovaných osob.

Ověření

Seznamy příjmení jsme ověřili na základě etnického původu hlášeného z Kanadského průzkumu zdraví Společenství (CCHS). CCHS je opakující se průřezový národní telefonický průzkum prováděný kanadskou statistikou, zaměřený na obyvatele domácností ve věku 12 let a starší, s výjimkou těch, kteří žijí v indických rezervách, základnách kanadských sil, institucích a některých vzdálených oblastech. Před rokem 2007 průzkum probíhal ve dvouletém cyklu sběru, přičemž první rok zkoumal zdraví obecné populace ve velkém vzorku a druhý rok se zaměřil na konkrétní zdravotní témata v menším vzorku. Každému respondentovi v každém průzkumu je přiřazena váha na úrovni osoby, takže váha odpovídá počtu lidí v celé populaci, které tento respondent představuje, a součet všech váh v jednom ročním průzkumu se rovná populaci Kanada. Pro průzkum se používají tři rámce pro odběr vzorků a konečná hmotnost přiřazená jednotlivci je integrována z vah nezávisle přiřazených k jednotlivým rámcům pro odběr vzorků. Váhy jsou také kalibrovány tak, aby zohledňovaly další potenciální předsudky, včetně neodpovědí a převzorkování domácností s více telefonními linkami. Využití vah při analýze těchto údajů je nutné, aby se zajistilo, že nálezy budou reprezentativní pro populaci, nejen pro průzkumný vzorek.Přestože etnická příslušnost není konkrétně zahrnuta do odvozování vah respondentů, účastníci jsou vybíráni náhodně z populace, takže není důvod se domnívat, že by váhy systematicky nedostatečně nebo nadměrně reprezentovaly jakoukoli etnickou skupinu, zejména proto, že průzkum spravováno ve více než 20 jazycích. Datový soubor CCHS neobsahuje příjmení respondentů, respondenti však dali souhlas s propojením svých odpovědí na průzkum se zdroji administrativních údajů o zdraví prostřednictvím čísla jejich zdravotního průkazu. Toto bylo anonymizováno pomocí obvyklého šifrovacího algoritmu na ICES, aby bylo možné údaje CCHS propojit s dalšími zdroji administrativních údajů, včetně RPDB.

Zlatým standardem byla etnická příslušnost z CCHS, která sama o sobě hlásila. Byly použity dvě otázky CCHS, které byly běžně shromažďovány jako součást demografického profilu respondentů průzkumu. Byly to „Do jakých etnických skupin patřili vaši předkové?“ a „Lidé žijící v Kanadě pocházejí z mnoha různých kulturních a rasových prostředí. Jste …?“ Na každou otázku bylo povoleno více odpovědí. Respondenti, kteří na jednu otázku odpověděli „jihoasijsky“, byli přiděleni k jihoasijskému etniku; ti, kteří na jednu otázku odpověděli „čínsky“, byli přiděleni k čínskému etniku; a všichni ostatní byli přiřazeni k obecné populaci.

Studovali jsme všechny dospělé respondenty kteréhokoli z cyklů CCHS 2001, 2002 nebo 2003. U každého respondenta byla etnická příslušnost zlatého standardu stanovena na základě jejich vlastních odpovědí na průzkum, zatímco jejich etnická příslušnost odvozená od příjmení byla odvozena propojením jejich šifrovaného čísla zdravotní karty z datového souboru CCHS s přiřazením jejich etnické příslušnosti v rámci odvozeného příjmení etnický identifikační soubor. Platnost jihoasijského příjmení byla stanovena měřením citlivosti (podíl osob identifikovaných jako jihoasijský, kteří byli jako takoví zjištěni seznamem příjmení), specifičnosti (podíl osob samostatně identifikovaných jako nebyli jihoasijští, kteří byli zjištěna jako taková v seznamu příjmení), pozitivní prediktivní hodnota (podíl osob zjištěných v seznamu příjmení jako jihoasijské, kteří se jako takoví identifikovali) a negativní prediktivní hodnota (podíl osob zjištěných v seznamu příjmení jako jih Asiat, který se jako takový identifikoval). Podobné výpočty byly provedeny k ověření čínského seznamu příjmení. V těchto výpočtech byl každý respondent vážen podle váhy na úrovni své osoby (děleno 3, protože jsme kombinovali respondenty ze tří ročníků průzkumu). Porovnali jsme dříve publikovaný seznam čínských příjmení s naším seznamem čínských příjmení porovnáním etnického původu odvozeného z příjmení pomocí obou seznamů proti stejnému zlatému standardu. Nakonec jsme porovnali pozitivní prediktivní hodnotu každého z našich seznamů příjmení stratifikovaných podle pohlaví, věku a imigračního stavu.

Etika

Údaje pro tuto studii nejsou veřejně dostupné, ale byly poskytnuté ICES MOH na základě dohody o výzkumu. ICES je oprávněna uchovávat, propojovat a analyzovat tyto údaje pro výzkumné účely jako pojmenovaná „předepsaná entita“ v zákoně o ochraně osobních údajů v Ontariu, zákon o ochraně zdravotních informací. Studii schválila institucionální kontrolní komise Sunnybrook Health Sciences Center .

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *