Familiennamenlisten zur Identifizierung der südasiatischen und chinesischen Ethnizität anhand von Sekundärdaten in Ontario, Kanada: eine Validierungsstudie

Entwicklung der Familiennamenlisten

Entwicklung des Südens Asiatische Familiennamenliste, wir begannen mit der zuvor entwickelten kanadischen Liste südasiatischer Familiennamen, die unter Verwendung von Sterbeurkundendaten entwickelt wurden. Wir haben Familiennamen hinzugefügt, die in Community-Telefonverzeichnissen und in einer von der indischen Regierung veröffentlichten Enzyklopädie von Familiennamen enthalten sind. Jeder Name wurde dann von mindestens zwei Forschern südasiatischer Herkunft überprüft. Nachnamen wurden ausgeschlossen, wenn sie nicht als eindeutig südasiatisch empfunden wurden (d. H. Wenn der Nachname auch in anderen Bevölkerungsgruppen, Gemeinschaften oder ethnischen Gruppen üblich war). Wenn zwischen den Forschern Meinungsverschiedenheiten darüber bestanden, ob ein Nachname ausgeschlossen werden sollte oder nicht, wurde dies von einem Gremium aus fünf Forschern südasiatischer Herkunft überprüft, bis eine Konsensentscheidung getroffen wurde. Die endgültige Liste enthielt alle Nachnamen, von denen einvernehmlich angenommen wurde, dass sie eindeutig südasiatisch sind.

Obwohl zuvor eine umfassende Liste chinesischer Nachnamen veröffentlicht und validiert wurde, stellten wir fest, dass diese Liste einige Namen enthielt, die es waren nicht ausschließlich chinesisch (z. B. Diep, Jain, Kang und Sen). Aus diesem Grund waren wir besorgt über den positiven prädiktiven Wert der Identifizierung von Kohorten von Patienten chinesischer Herkunft anhand dieser Liste. Daher haben wir einen ähnlichen Konsensprozess für die Nachnamen aus dieser Liste wiederholt, um eine endgültige Liste der Nachnamen zu erstellen, von denen angenommen wird, dass sie eindeutig chinesisch sind.

Administrative Datenquellen

Die Das Institute for Clinical Evaluative Sciences (ICES) ist eine Forschungsorganisation für das Gesundheitswesen, die zum Teil vom Ministerium für Gesundheit und Langzeitpflege (MOH) in Ontario finanziert wird, um Analysen der Verwaltungsdatenbanken des Gesundheitswesens der Provinz für politikrelevante und wissenschaftliche Forschung durchzuführen. Eine dieser administrativen Datenquellen ist die Registered Persons Database (RPDB), bei der es sich um ein Register der zugewiesenen Gesundheitskartennummern für alle derzeitigen und ehemaligen Einwohner der Provinz Ontario handelt (derzeitige Bevölkerung = 13 Millionen). Die vom MOH erhaltene Nenndatei enthält die Nachnamen der Patienten. In der Vereinbarung zum Datenaustausch zwischen dem MOH und dem ICES haben nur drei benannte Personen Zugriff auf diese Nenndatei. Sie anonymisieren sie vor ihrer Freigabe für die allgemeine analytische Verwendung, indem sie die Namen und entfernen Durch Verschlüsselung der Gesundheitskartennummern. Da diese Verschlüsselung einen reproduzierbaren Algorithmus verwendet, der allen administrativen Datenquellen gemeinsam ist, können Personen über diese eindeutige verschlüsselte Nummer zwischen Datenbanken verknüpft werden.

Die Nachnamenlisten wurden auf den Nominalwert angewendet RPDB-Datei zum Erstellen einer ethnischen Identifikationsdatei. Alle Einwohner von Ontario, deren Nachnamen auf der südasiatischen Liste standen, wurden der südasiatischen Ethnizität zugeordnet. Alle Einwohner, deren Nachnamen auf der chinesischen Liste standen, wurden der chinesischen Ethnizität zugeordnet. Alle anderen wurden der allgemeinen Bevölkerung zugeordnet Gruppe. Die endgültige vom Nachnamen abgeleitete ethnische Identifikationsdatei enthielt sowohl die verschlüsselte Gesundheitskartennummer als auch die ethnische Zugehörigkeit für alle Onta Rio Bewohner. (Siehe Abbildung 1.)

Abbildung 1

Die Ableitung der vom Nachnamen abgeleiteten ethnischen Identifikationsdatei aus der Datenbank für registrierte Personen.

Validierung

Wir haben die Familiennamenlisten anhand der selbst gemeldeten ethnischen Zugehörigkeit aus der Canadian Community Health Survey (CCHS) validiert. Das CCHS ist eine wiederkehrende nationale Telefonumfrage im Querschnitt, die von Statistics Canada durchgeführt wurde und sich an Haushaltsbewohner ab 12 Jahren richtet, mit Ausnahme derjenigen, die in Indianerreservaten, Stützpunkten der kanadischen Streitkräfte, Institutionen und einigen abgelegenen Gebieten leben. Vor 2007 wurde die Umfrage in einem zweijährigen Erfassungszyklus durchgeführt, wobei das erste Jahr die allgemeine Gesundheit der Bevölkerung in einer großen Stichprobe untersuchte und das zweite Jahr sich auf bestimmte Gesundheitsthemen in einer kleineren Stichprobe konzentrierte. Jedem Befragten in jeder Umfrage wird ein Gewicht auf Personenebene zugewiesen, sodass das Gewicht der Anzahl der Personen in der Gesamtbevölkerung entspricht, die von diesem Befragten vertreten werden, und die Summe aller Gewichte in der Umfrage eines Jahres der Bevölkerung von entspricht Kanada. Für die Umfrage werden drei Stichprobenrahmen verwendet, und das einer Person zugewiesene Endgewicht wird aus den Gewichten integriert, die unabhängig von jedem Stichprobenrahmen zugewiesen wurden. Die Gewichte werden auch kalibriert, um andere potenzielle Verzerrungen zu berücksichtigen, einschließlich Nichtantwort und Überabtastung von Haushalten mit mehreren Telefonleitungen. Die Verwendung der Gewichte bei der Analyse dieser Daten ist erforderlich, um sicherzustellen, dass die Ergebnisse für die Bevölkerung und nicht nur für die Stichprobe repräsentativ sind.Obwohl die ethnische Zugehörigkeit nicht speziell in die Ableitung der Gewichte der Befragten einbezogen wird, werden die Teilnehmer nach dem Zufallsprinzip aus der Bevölkerung ausgewählt, sodass kein Grund zu der Annahme besteht, dass die Gewichtungen eine ethnische Gruppe systematisch unter- oder überrepräsentieren würden, insbesondere seit der Umfrage Der CCHS-Datensatz enthält keine Nachnamen der Befragten. Die Befragten gaben jedoch die Erlaubnis, ihre Umfrageantworten über ihre Gesundheitskartennummer mit Datenquellen der Gesundheitsverwaltung verknüpfen zu lassen. Dies wurde unter Verwendung des auf dem ICES üblichen Verschlüsselungsalgorithmus anonymisiert, damit die CCHS-Daten mit den anderen administrativen Datenquellen, einschließlich der RPDB, verknüpft werden können.

Der Goldstandard war eine selbst gemeldete ethnische Zugehörigkeit des CCHS. Es wurden zwei CCHS-Fragen verwendet, die routinemäßig im Rahmen des demografischen Profils der Befragten gesammelt wurden. Dies waren „Zu welchen ethnischen Gruppen gehörten Ihre Vorfahren?“ und „Die in Kanada lebenden Menschen kommen aus vielen verschiedenen kulturellen und rassischen Verhältnissen. Sind Sie …?“ Für jede Frage waren mehrere Antworten zulässig. Die Befragten, die auf beide Fragen eine einzige Antwort von „Südasiatisch“ hatten, wurden der südasiatischen Ethnizität zugeordnet. Diejenigen, die eine einzige Antwort von „Chinesisch“ auf eine der beiden Fragen hatten, wurden der chinesischen Ethnizität zugeordnet. und alle anderen wurden der allgemeinen Bevölkerung zugeordnet.

Wir untersuchten alle erwachsenen Befragten in einem der Zyklen 2001, 2002 oder 2003 des CCHS. Für jeden Befragten wurde die Goldstandard-Ethnizität aus den selbst gemeldeten Antworten auf die Umfrage ermittelt, während die vom Nachnamen abgeleitete Ethnizität durch Verknüpfung ihrer verschlüsselten Gesundheitskartennummer aus dem CCHS-Datensatz mit ihrer Ethnizitätszuordnung im vom Nachnamen abgeleiteten abgeleitet wurde ethnische Identifikationsdatei. Die Gültigkeit der südasiatischen Familiennamenliste wurde durch Messung der Sensitivität (der Anteil der Personen, die selbst als südasiatisch identifiziert wurden und in der Familiennamenliste als solche identifiziert wurden), der Spezifität (der Anteil der Personen, die selbst als nicht südasiatisch identifiziert wurden) bestimmt von der Familiennamenliste als solche erkannt), positiver Vorhersagewert (der Anteil derjenigen, die von der Familiennamenliste als südasiatisch erkannt wurden und sich als solche identifizierten) und negativer Vorhersagewert (der Anteil derjenigen, die von der Familiennamenliste als nicht südlich erkannt wurden) Asiaten, die sich selbst als solche identifizierten). Ähnliche Berechnungen wurden durchgeführt, um die chinesische Familiennamenliste zu validieren. Bei diesen Berechnungen wurde jeder Befragte mit seinem Gewicht auf Personenebene gewichtet (geteilt durch 3, da wir Befragte aus drei Umfragejahren kombiniert haben). Wir haben die zuvor veröffentlichte chinesische Familiennamenliste mit unserer chinesischen Familiennamenliste verglichen, indem wir die von Familiennamen abgeleitete ethnische Zugehörigkeit unter Verwendung beider Listen mit demselben Goldstandard verglichen haben. Schließlich haben wir den positiven Vorhersagewert jeder unserer Familiennamenlisten nach Geschlecht, Alter und Einwanderungsstatus verglichen.

Ethik

Die Daten für die Studie sind nicht öffentlich verfügbar, waren es aber dem MES vom MOH im Rahmen einer Forschungsvereinbarung zur Verfügung gestellt. Der ICES darf diese Daten zu Forschungszwecken als benannte „vorgeschriebene Einheit“ im Gesundheitsschutzgesetz von Ontario, dem Health Information Protection Act, speichern, verknüpfen und analysieren. Die Studie wurde vom institutionellen Überprüfungsausschuss des Sunnybrook Health Sciences Center genehmigt .

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert.