Listas de apellidos para identificar la etnia china y del sur de Asia a partir de datos secundarios en Ontario, Canadá: un estudio de validación

Desarrollo de listas de apellidos

Para desarrollar el sur Lista de apellidos asiáticos, comenzamos con la lista canadiense previamente desarrollada de apellidos del sur de Asia elaborada a partir de los datos del certificado de defunción. Agregamos apellidos que se encuentran en directorios telefónicos comunitarios y en una enciclopedia de apellidos publicada por el gobierno indio. Luego, cada nombre fue revisado por al menos dos investigadores con orígenes del sur de Asia. Se excluyeron los apellidos si no se consideraba que fueran únicamente del sur de Asia (es decir, si el apellido era común también en otras poblaciones, comunidades o grupos étnicos). Si hubo desacuerdo entre los investigadores sobre la exclusión o no de un apellido, fue revisado por un panel de cinco investigadores con orígenes del sur de Asia hasta que se llegó a una decisión por consenso. La lista final incluía todos los apellidos que se creía, por consenso, que eran únicamente del sur de Asia.

Aunque se ha publicado y validado previamente una lista completa de apellidos chinos, notamos que esta lista incluía algunos nombres que eran no exclusivamente chinos (por ejemplo, Diep, Jain, Kang y Sen). Como tal, nos preocupaba el valor predictivo positivo de identificar cohortes de pacientes de origen chino utilizando esta lista. Por lo tanto, repetimos un proceso de consenso similar para los apellidos de esa lista, para crear una lista final de apellidos que se cree, por consenso, que son exclusivamente chinos.

Fuentes de datos administrativos

El El Instituto de Ciencias de Evaluación Clínica (ICES) es una organización de investigación de servicios de salud financiada en parte por el Ministerio de Salud y Atención a Largo Plazo de Ontario (MOH) para realizar análisis de las bases de datos administrativas provinciales de atención médica para investigaciones científicas y relevantes para las políticas. Una de estas fuentes de datos administrativos es la Base de datos de personas registradas (RPDB), que es un registro de los números de tarjetas de salud asignados para todos los residentes actuales y anteriores de la provincia de Ontario (población actual = 13 millones). El archivo nominal recibido del Ministerio de Salud incluye los apellidos de los pacientes. En el acuerdo de intercambio de datos entre el Ministerio de Salud y el ICES, solo tres personas nombradas tienen acceso a este archivo nominal. Lo anonimizan antes de su publicación para uso analítico general eliminando los nombres y cifrando los números de la tarjeta sanitaria. Debido a que este cifrado utiliza un algoritmo reproducible común a todas las fuentes de datos administrativos, las personas pueden vincularse entre bases de datos a través de este número cifrado único.

Las listas de apellidos se aplicaron al nominal RPDB para crear un archivo de identificación étnica. Todos los residentes de Ontario cuyos apellidos estaban en la lista del sur de Asia fueron asignados a la etnia del sur de Asia; todos los residentes cuyos apellidos estaban en la lista de chinos fueron asignados a la etnia china; todos los demás fueron asignados a la población general El archivo final de identificación étnica derivado del apellido incluía tanto el número de tarjeta de salud encriptado como la asignación de etnia para todos los Onta residentes de rio. (Vea la Figura 1.)

Figura 1

La derivación del archivo de identificación étnica derivado del apellido de la base de datos de personas registradas.

Validación

Validamos las listas de apellidos contra la etnia autoinformada de la Encuesta de salud comunitaria canadiense (CCHS). El CCHS es una encuesta telefónica nacional transversal recurrente realizada por Statistics Canada, dirigida a residentes de hogares de 12 años o más, excluyendo a aquellos que viven en Reservas Indias, Bases de Fuerzas Canadienses, instituciones y algunas áreas remotas. Antes de 2007, la encuesta operaba en un ciclo de recolección de dos años, con el primer año examinando la salud de la población general en una muestra grande y el segundo año enfocándose en temas de salud específicos en una muestra más pequeña. A cada encuestado en cada encuesta se le asigna un peso a nivel de persona, de modo que el peso corresponde al número de personas en toda la población que están representadas por ese encuestado, y la suma de todos los pesos en la encuesta de un año es igual a la población de Canadá. Se utilizan tres marcos de muestreo para la encuesta y la ponderación final asignada a una persona se integra a partir de las ponderaciones asignadas independientemente de cada marco de muestreo. Las ponderaciones también se calibran para tener en cuenta otros posibles sesgos, como la falta de respuesta y el sobremuestreo de hogares con múltiples líneas telefónicas El uso de las ponderaciones en el análisis de estos datos es necesario para garantizar que los hallazgos sean representativos de la población y no solo de la muestra de la encuesta.Aunque la etnia no se incluye específicamente en la derivación de las «ponderaciones de los encuestados», los participantes se seleccionan al azar de la población, por lo que no hay razón para sospechar que las ponderaciones representarían sistemáticamente por debajo o por encima de cualquier grupo étnico, sobre todo porque la encuesta es administrado en más de 20 idiomas. El conjunto de datos de CCHS no incluye los «apellidos de los encuestados, pero los encuestados dieron permiso para que sus respuestas de la encuesta se vinculen con fuentes de datos administrativos de salud a través de su número de tarjeta de salud. Esto se anonimizó utilizando el algoritmo de cifrado habitual en ICES, de modo que los datos de CCHS se puedan vincular con las otras fuentes de datos administrativos, incluida la RPDB.

El estándar de oro fue la etnia autoinformada por el CCHS. Se utilizaron dos preguntas de CCHS, que se recopilaron de forma rutinaria como parte del perfil demográfico de los encuestados. Estos eran «¿A qué grupos étnicos pertenecían sus antepasados?» y «Las personas que viven en Canadá provienen de diferentes orígenes culturales y raciales. ¿Eres …?» Se permitieron múltiples respuestas para cada pregunta. A los encuestados que tenían una única respuesta de «Asia meridional» a cualquiera de las preguntas se les asignó la etnia del sur de Asia; aquellos que tenían una sola respuesta de «chino» a cualquiera de las preguntas fueron asignados a la etnia china; y todos los demás fueron asignados a la población general.

Estudiamos a todos los adultos que respondieron a cualquiera de los ciclos de 2001, 2002 o 2003 de la CCHS. Para cada encuestado, la etnia estándar de oro se estableció a partir de sus respuestas autoinformadas a la encuesta, mientras que su etnia derivada del apellido se obtuvo mediante la vinculación de su número de tarjeta de salud encriptado del conjunto de datos de CCHS con su asignación de etnia en el apellido derivado. expediente de identificación étnica. La validez de la lista de apellidos del sur de Asia se determinó midiendo la sensibilidad (la proporción de personas que se identificaron a sí mismas como sudasiáticas que fueron detectadas como tales por la lista de apellidos), la especificidad (la proporción de personas que se identificaron a sí mismas como no sudasiáticas que fueron detectado como tal por la lista de apellidos), valor predictivo positivo (la proporción de los detectados por la lista de apellidos como del sur de Asia que se autoidentificaron como tales) y valor predictivo negativo (la proporción de los detectados por la lista de apellidos como no del sur Asiático que se autoidentifica como tal). Se hicieron cálculos similares para validar la lista de apellidos chinos. En estos cálculos, cada encuestado fue ponderado por su peso a nivel de persona (dividido por 3, porque estábamos combinando encuestados de tres años de encuesta). Comparamos la lista de apellidos chinos publicada anteriormente con nuestra lista de apellidos chinos comparando la etnia derivada del apellido usando ambas listas con el mismo estándar de oro. Finalmente, comparamos el valor predictivo positivo de cada una de nuestras listas de apellidos estratificadas por sexo, edad y estado migratorio.

Ética

Los datos del estudio no están disponibles públicamente, pero fueron proporcionado al ICES por el Ministerio de Salud en virtud de un acuerdo de investigación. El ICES tiene permitido retener, vincular y analizar estos datos con fines de investigación como una «entidad prescrita» en la ley de privacidad de la información de salud de Ontario, la Ley de Protección de la Información de Salud. El estudio fue aprobado por la junta de revisión institucional del Sunnybrook Health Sciences Center .

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *