Achternaamlijsten om Zuid-Aziatische en Chinese etniciteit te identificeren op basis van secundaire gegevens in Ontario, Canada: een validatiestudie | BMC Medical Research Methodology

Ontwikkeling van de achternaamlijsten

Om het Zuiden te ontwikkelen Aziatische achternaamlijst, we zijn begonnen met de eerder ontwikkelde Canadese lijst met Zuid-Aziatische achternamen, ontwikkeld op basis van overlijdensakte. We hebben achternamen uit telefoongidsen van de gemeenschap toegevoegd en in een encyclopedie van achternamen gepubliceerd door de Indiase overheid. Elke naam werd vervolgens beoordeeld door ten minste twee onderzoekers van Zuid-Aziatische afkomst. Familienamen werden uitgesloten als ze niet als uniek Zuid-Aziatisch werden beschouwd (d.w.z. als de achternaam ook in andere populaties, gemeenschappen of etnische groepen voorkwam). Als er onenigheid was tussen de onderzoekers over het al dan niet uitsluiten van een achternaam, werd deze beoordeeld door een panel van vijf onderzoekers van Zuid-Aziatische afkomst totdat er een consensus was bereikt. De definitieve lijst bevatte alle achternamen waarvan bij consensus werd aangenomen dat ze uniek Zuid-Aziatisch waren.

Hoewel eerder een uitgebreide lijst met Chinese achternamen is gepubliceerd en gevalideerd, hebben we opgemerkt dat deze lijst enkele namen bevat die niet uniek Chinees (bijv. Diep, Jain, Kang en Sen). Als zodanig waren we bezorgd over de positieve voorspellende waarde van het identificeren van cohorten van patiënten van Chinese afkomst met behulp van deze lijst. Daarom hebben we een soortgelijk consensusproces herhaald voor de achternamen uit die lijst, om een definitieve lijst te maken van achternamen waarvan bij consensus wordt aangenomen dat ze uniek Chinees zijn.

Administratieve gegevensbronnen

De Institute for Clinical Evaluative Sciences (ICES) is een onderzoeksorganisatie voor gezondheidsdiensten die gedeeltelijk wordt gefinancierd door het Ontario Ministry of Health and Long-Term Care (MOH) om analyses uit te voeren van provinciale administratieve databases voor gezondheidszorg voor beleidsrelevant en wetenschappelijk onderzoek. Een van deze administratieve gegevensbronnen is de Registered Personendatabase (RPDB), een register van de toegekende zorgpasnummers voor alle huidige en voormalige inwoners van de provincie Ontario (huidige bevolking = 13 miljoen). Het nominale bestand dat van de MOH is ontvangen, bevat de achternamen van de patiënten. In de overeenkomst voor het delen van gegevens tussen de MOH en ICES hebben slechts drie genoemde personen toegang tot dit nominale bestand. Ze anonimiseren het voordat het wordt vrijgegeven voor algemeen analytisch gebruik door de namen en door de nummers van de gezondheidskaart te versleutelen. Omdat deze versleuteling een reproduceerbaar algoritme gebruikt dat gemeenschappelijk is voor alle administratieve gegevensbronnen, kunnen personen via dit unieke versleutelde nummer worden gekoppeld tussen databases.

De achternamenlijsten werden toegepast op de nominale RPDB-bestand om een etnisch identificatiebestand te maken. Alle inwoners van Ontario wiens achternaam op de Zuid-Aziatische lijst stond, werden toegewezen aan de Zuid-Aziatische etniciteit; alle inwoners wiens achternaam op de Chinese lijst stond, werden toegewezen aan de Chinese etniciteit; alle anderen werden toegewezen aan de algemene bevolking Het uiteindelijke etnische identificatiebestand, afgeleid van de achternaam, bevatte zowel het versleutelde gezondheidskaartnummer als de etniciteitstoewijzing voor alle Onta inwoners van Rio. (Zie figuur 1.)

Validatie

We hebben de achternaamlijsten gevalideerd op basis van zelfgerapporteerde etniciteit van de Canadian Community Health Survey (CCHS). De CCHS is een terugkerende transversale nationale telefonische enquête die wordt uitgevoerd door Statistics Canada, gericht op inwoners van huishoudens van 12 jaar of ouder, met uitzondering van degenen die in Indian Reserves, Canadian Forces Bases, instellingen en sommige afgelegen gebieden wonen. Vóór 2007 werkte de enquête volgens een verzamelcyclus van twee jaar, waarbij het eerste jaar de algemene volksgezondheid in een grote steekproef onderzocht en het tweede jaar gericht was op specifieke gezondheidsonderwerpen in een kleinere steekproef. Elke respondent in elke enquête krijgt een persoonlijk gewicht toegewezen, zodat het gewicht overeenkomt met het aantal mensen in de gehele populatie dat door die respondent wordt vertegenwoordigd, en de som van alle gewichten in de enquête van één jaar gelijk is aan de populatie van Canada. Er worden drie steekproefkaders gebruikt voor de enquête en het uiteindelijke gewicht dat aan een individu wordt toegewezen, wordt geïntegreerd met de gewichten die onafhankelijk van elk steekproefkader zijn toegewezen. Gewichten worden ook gekalibreerd om rekening te houden met andere mogelijke vooroordelen, waaronder non-respons en overbemonstering van huishoudens met meerdere telefoonlijnen Het gebruik van de gewichten bij analyses van deze gegevens is vereist om ervoor te zorgen dat de bevindingen representatief zijn voor de populatie, en niet alleen voor de steekproef.Hoewel etniciteit niet specifiek is meegenomen in de afleiding van de gewichten van respondenten, worden de deelnemers willekeurig uit de populatie geselecteerd, dus er is geen reden om te vermoeden dat de wegingen systematisch een etnische groep onder- of oververtegenwoordigen, vooral omdat de enquête beheerd in meer dan 20 talen De CCHS-dataset bevat niet de achternamen van de respondenten, maar de respondenten gaven wel toestemming om hun enquêtereacties te koppelen aan gezondheidsadministratieve databronnen via hun gezondheidskaartnummer. Dit werd geanonimiseerd met behulp van het bij ICES gebruikelijke coderingsalgoritme, zodat de CCHS-gegevens kunnen worden gekoppeld aan de andere administratieve gegevensbronnen, waaronder de RPDB.

De gouden standaard was de zelfgerapporteerde etniciteit van de CCHS. Er werden twee CCHS-vragen gebruikt, die routinematig werden verzameld als onderdeel van het demografische profiel van de respondenten in de enquête. Dit waren: “Tot welke etnische groepen behoorden uw voorouders?” en “Mensen die in Canada wonen, hebben veel verschillende culturele en raciale achtergronden. Bent u …?” Voor elke vraag waren meerdere antwoorden toegestaan. De respondenten die op een van beide vragen één antwoord van “Zuid-Aziatisch” hadden, werden toegewezen aan de Zuid-Aziatische etniciteit; degenen die één antwoord van “Chinees” op beide vragen hadden, werden toegewezen aan Chinese etniciteit; en alle anderen werden toegewezen aan de algemene bevolking.

We bestudeerden alle volwassen respondenten in een van de cycli van 2001, 2002 of 2003 van de CCHS. Voor elke respondent werd de gouden standaard etniciteit vastgesteld op basis van hun zelfgerapporteerde antwoorden op de enquête, terwijl hun achternaam afgeleide etniciteit werd afgeleid door een koppeling van hun gecodeerde gezondheidskaartnummer uit de CCHS-dataset met hun etniciteitstoewijzing in de achternaam afgeleide etnisch identificatiebestand. De geldigheid van de Zuid-Aziatische achternaamlijst werd bepaald door het meten van gevoeligheid (het percentage mensen dat zichzelf identificeerde als Zuid-Aziatische en als zodanig werd gedetecteerd door de achternaamlijst), specificiteit (het percentage mensen dat zichzelf identificeerde als niet Zuid-Aziatische als zodanig gedetecteerd door de achternaamlijst), positief voorspellende waarde (het aandeel van degenen die door de achternaamlijst worden gedetecteerd als Zuid-Aziatisch die zichzelf als zodanig hebben geïdentificeerd) en negatief voorspellende waarde (het aandeel van degenen die door de achternaamlijst worden gedetecteerd als niet Zuid-Aziatisch Aziaat die zichzelf als zodanig identificeerde). Soortgelijke berekeningen werden gemaakt om de Chinese achternaamlijst te valideren. In deze berekeningen werd elke respondent gewogen naar zijn of haar persoonlijkheidsgewicht (gedeeld door 3, omdat we respondenten uit drie onderzoeksjaren combineerden). We vergeleken de eerder gepubliceerde Chinese achternaamlijst met onze Chinese achternaamlijst door de achternaam-afgeleide etniciteit met behulp van beide lijsten te vergelijken met dezelfde gouden standaard. Ten slotte hebben we de positief voorspellende waarde van elk van onze achternaamlijsten vergeleken, gestratificeerd naar geslacht, leeftijd en immigratiestatus.

Ethiek

De gegevens voor het onderzoek zijn niet openbaar, maar waren verstrekt aan ICES door de MOH in het kader van een onderzoeksovereenkomst. ICES mag deze gegevens voor onderzoeksdoeleinden bewaren, koppelen en analyseren als een “voorgeschreven entiteit” in de privacywet inzake gezondheidsinformatie van Ontario, de Health Information Protection Act. De studie werd goedgekeurd door de institutionele beoordelingsraad van Sunnybrook Health Sciences Centre .

Ontwikkeling van de achternaamlijsten

Administratieve gegevensbronnen

Validatie

Ethiek

Geef een reactie Antwoord annuleren