Listas de sobrenomes para identificar etnias do sul da Ásia e da China a partir de dados secundários em Ontário, Canadá: um estudo de validação

Desenvolvimento das listas de sobrenomes

Para desenvolver o sul Lista de sobrenomes asiáticos, começamos com a lista canadense de sobrenomes do sul da Ásia desenvolvida usando dados de atestados de óbito. Adicionamos sobrenomes encontrados em listas telefônicas comunitárias e em uma enciclopédia de sobrenomes publicada pelo governo indiano. Cada nome foi então revisado por pelo menos dois pesquisadores com origens do sul da Ásia. Sobrenomes foram excluídos se não fossem considerados exclusivamente do sul da Ásia (ou seja, se o sobrenome fosse comum também em outras populações, comunidades ou grupos étnicos). Se houvesse divergência entre os pesquisadores sobre a exclusão ou não do sobrenome, o mesmo era analisado por um painel de cinco pesquisadores de origem sul-asiática até que se chegasse a uma decisão de consenso. A lista final incluía todos os sobrenomes que se acreditava, por consenso, serem exclusivamente do sul da Ásia.

Embora uma lista abrangente de sobrenomes chineses tenha sido publicada e validada anteriormente, observamos que essa lista incluía alguns nomes que eram não exclusivamente chinês (por exemplo, Diep, Jain, Kang e Sen). Como tal, estávamos preocupados com o valor preditivo positivo de identificar coortes de pacientes de origem chinesa usando esta lista. Portanto, repetimos um processo de consenso semelhante para os sobrenomes dessa lista, para criar uma lista final de sobrenomes considerados, por consenso, exclusivamente chineses.

Fontes de dados administrativos

O O Instituto de Ciências Clínicas de Avaliação (ICES) é uma organização de pesquisa de serviços de saúde financiada em parte pelo Ministério da Saúde e Cuidados de Longo Prazo de Ontário (MOH) para conduzir análises de bancos de dados administrativos de cuidados de saúde provinciais para pesquisa científica e relevante para políticas. Uma dessas fontes de dados administrativos é o Banco de Dados de Pessoas Registradas (RPDB), que é um registro dos números dos cartões de saúde atribuídos a todos os atuais e ex-residentes da província de Ontário (população atual = 13 milhões). O arquivo nominal recebido do MS inclui os sobrenomes dos pacientes. No acordo de compartilhamento de dados entre o MS e o ICES, apenas três indivíduos nomeados têm acesso a este arquivo nominal. Eles o tornam anônimo antes de sua liberação para uso analítico geral, removendo os nomes e criptografando os números do cartão de saúde. Como essa criptografia usa um algoritmo reproduzível comum a todas as fontes de dados administrativos, os indivíduos podem ser vinculados entre os bancos de dados por meio desse número criptografado exclusivo.

As listas de sobrenomes foram aplicadas ao nominal Arquivo RPDB para criar um arquivo de identificação étnica. Todos os residentes de Ontário cujos sobrenomes estavam na lista do sul da Ásia foram atribuídos à etnia do sul da Ásia; todos os residentes cujos sobrenomes estavam na lista da China foram atribuídos à etnia chinesa; todos os outros foram atribuídos à população geral O arquivo final de identificação étnica derivado do sobrenome incluía o número do cartão de saúde criptografado e a atribuição de etnia para todos os Onta residentes do rio. (Veja a Figura 1.)

Figura 1

A derivação do arquivo de identificação étnica derivado do sobrenome do banco de dados de pessoas registradas.

Validação

Nós validamos as listas de sobrenomes em relação à etnia autorrelatada do Canadian Community Health Survey (CCHS). O CCHS é uma pesquisa telefônica nacional de corte transversal recorrente conduzida pela Statistics Canada, voltada para residentes domiciliares com 12 anos ou mais, excluindo aqueles que vivem em reservas indígenas, bases das forças canadenses, instituições e algumas áreas remotas. Antes de 2007, a pesquisa operava em um ciclo de coleta de dois anos, com o primeiro ano examinando a saúde da população geral em uma grande amostra e o segundo ano enfocando tópicos específicos de saúde em uma amostra menor. Cada respondente em cada pesquisa é atribuído a um peso de nível de pessoa, de modo que o peso corresponda ao número de pessoas em toda a população que são representadas por aquele entrevistado, e a soma de todos os pesos na pesquisa de um ano é igual à população de Canadá. Três bases de amostragem são usadas para a pesquisa, e o peso final atribuído a um indivíduo é integrado a partir dos pesos atribuídos independentemente de cada base de amostragem. Os pesos também são calibrados para levar em conta outros vieses potenciais, incluindo não resposta e sobreamostragem de domicílios com múltiplas linhas telefônicas.O uso dos pesos nas análises desses dados é necessário para garantir que os resultados sejam representativos da população, e não apenas da amostra da pesquisa.Embora a etnia não seja especificamente incluída na derivação dos pesos dos entrevistados, os participantes são selecionados aleatoriamente da população, então não há razão para suspeitar que os pesos sistematicamente sub ou super-representem qualquer grupo étnico, especialmente porque a pesquisa é administrado em mais de 20 idiomas. O conjunto de dados CCHS não inclui os sobrenomes dos entrevistados, mas os entrevistados deram permissão para que suas respostas da pesquisa fossem vinculadas a fontes de dados administrativos de saúde por meio do número do cartão de saúde. Isso foi tornado anônimo usando o algoritmo de criptografia usual no ICES, para que os dados do CCHS possam ser vinculados a outras fontes de dados administrativos, incluindo o RPDB.

O padrão ouro foi a etnia autorrelatada pelo CCHS. Duas questões do CCHS, que eram coletadas rotineiramente como parte do perfil demográfico dos entrevistados, foram usadas. Essas perguntas foram “A quais grupos étnicos seus ancestrais pertenciam?” e “As pessoas que vivem no Canadá vêm de diferentes origens culturais e raciais. Você é …?” Múltiplas respostas foram permitidas para cada pergunta. Os entrevistados que tiveram uma única resposta de “sul-asiático” para qualquer uma das perguntas foram atribuídos à etnia sul-asiática; aqueles que tiveram uma única resposta de “chinês” para qualquer uma das perguntas foram atribuídos à etnia chinesa; e todos os outros foram atribuídos à População Geral.

Estudamos todos os adultos entrevistados em qualquer um dos ciclos de 2001, 2002 ou 2003 do CCHS. Para cada entrevistado, a etnia padrão-ouro foi estabelecida a partir de suas respostas autorrelatadas à pesquisa, enquanto sua etnia derivada do sobrenome foi derivada por meio da ligação do número do cartão de saúde criptografado do conjunto de dados CCHS com sua atribuição de etnia no derivado do sobrenome arquivo de identificação étnica. A validade da lista de sobrenomes do sul da Ásia foi determinada medindo a sensibilidade (a proporção de pessoas autoidentificadas como sul-asiáticas que foram detectadas como tal pela lista de sobrenomes), especificidade (a proporção de pessoas auto-identificadas como não sendo sul-asiáticas que eram detectado como tal pela lista de sobrenomes), valor preditivo positivo (a proporção daqueles detectados pela lista de sobrenomes como sul-asiáticos que se auto-identificaram como tal) e valor preditivo negativo (a proporção daqueles detectados pela lista de sobrenomes como não sendo do sul Asiáticos que se autoidentificam como tal). Cálculos semelhantes foram feitos para validar a lista de sobrenomes chineses. Nesses cálculos, cada respondente foi ponderado por seu peso pessoal (dividido por 3, porque estávamos combinando respondentes de três anos de pesquisa). Comparamos a lista de sobrenomes chineses publicada anteriormente com nossa lista de sobrenomes chineses, comparando a etnia derivada do sobrenome usando ambas as listas em relação ao mesmo padrão ouro. Finalmente, comparamos o valor preditivo positivo de cada uma de nossas listas de sobrenomes estratificadas por sexo, idade e status de imigração.

Ética

Os dados do estudo não estão disponíveis publicamente, mas foram fornecidos ao CIEM pelo MS ao abrigo de um acordo de investigação. O ICES está autorizado a manter, vincular e analisar esses dados para fins de pesquisa como uma “entidade prescrita” na lei de privacidade de informações de saúde de Ontário, a Lei de Proteção de Informações de Saúde. O estudo foi aprovado pelo conselho de revisão institucional do Sunnybrook Health Sciences Center .

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *