캐나다 온타리오의 2 차 데이터에서 남아시아 및 중국 민족을 식별하기위한 성 목록 : 검증 연구


성 목록 개발

남쪽 개발 아시아 성 목록, 우리는 사망 증명서 데이터를 사용하여 개발 된 남아시아 성의 이전에 개발 된 캐나다 목록으로 시작했습니다. 우리는 지역 사회 전화 번호부와 인도 정부가 발행 한 성 백과 사전에 성을 추가했습니다. 그런 다음 남아시아 출신의 최소 두 명의 연구원이 각 이름을 검토했습니다. 고유하게 남아시아 인이라고 느껴지지 않는 성은 제외되었습니다 (즉, 다른 인구, 지역 사회 또는 민족 집단에서도 성이 흔한 경우). 성을 제외할지 여부에 대해 연구자들 사이에 의견이 일치하지 않는 경우, 합의 결정에 도달 할 때까지 남아시아 출신 연구원 5 명으로 구성된 패널이 검토했습니다. 최종 목록에는 합의에 따라 고유하게 남아시아 인 것으로 여겨지는 모든 성이 포함되었습니다.

중국 성의 포괄적 인 목록이 이전에 게시되고 유효성이 확인되었지만이 목록에는 일부 이름이 포함되어 있습니다. 중국어 (예 : Diep, Jain, Kang 및 Sen)가 아닙니다. 따라서 우리는이 목록을 사용하여 중국인 환자의 코호트를 식별하는 긍정적 인 예측 값에 대해 우려했습니다. 따라서 우리는 해당 목록의성에 대해 유사한 합의 프로세스를 반복하여 합의에 의해 고유 한 중국인 성의 최종 목록을 생성했습니다.

관리 데이터 소스

The Institute for Clinical Evaluative Sciences (ICES)는 정책 관련 및 과학 연구를 위해 주정부 의료 관리 데이터베이스 분석을 수행하기 위해 온타리오 보건 장기 의료부 (MOH)가 부분적으로 자금을 지원하는 의료 서비스 연구 기관입니다. 이러한 관리 데이터 소스 중 하나는 RPDB (Registered Persons Database)로, 온타리오주의 모든 현재 및 이전 거주자 (현재 인구 = 1,300 만)에 대해 할당 된 의료 카드 번호의 레지스트리입니다. MOH에서받은 명목 파일에는 환자의 성이 포함되어 있습니다. MOH와 ICES 간의 데이터 공유 계약에서 세 명의 지명 된 개인 만이이 명목 파일에 액세스 할 수 있습니다. 일반 분석 용으로 공개되기 전에 이름과 이름을 제거하여 익명으로 처리합니다. 이 암호화는 모든 관리 데이터 소스에 공통적 인 재현 가능한 알고리즘을 사용하기 때문에 개인은이 고유 한 암호화 된 번호를 통해 데이터베이스간에 연결할 수 있습니다.

성 목록은 명목에 적용되었습니다. RPDB 파일을 사용하여 민족 식별 파일을 생성합니다. 성이 남아시아 인 목록에 포함 된 온타리오 주민은 모두 남아시아 민족에 할당되었습니다. 성이 중국인 목록에있는 모든 거주자는 중국 민족에 할당되었으며 나머지는 모두 일반 인구에 할당되었습니다. 최종 성에서 파생 된 민족 식별 파일에는 암호화 된 의료 카드 번호와 모든 Onta에 대한 민족 할당이 모두 포함되어 있습니다. 리오 거주자. (그림 1 참조)

그림 1

등록자 데이터베이스에서 파생 된 성에서 파생 된 민족 식별 파일입니다.

검증

캐나다 지역 사회 건강 설문 조사 (CCHS)에서 자체보고 된 인종에 대해 성 목록을 검증했습니다. CCHS는 캐나다 통계청에서 실시하는 반복적 인 전국 전화 설문 조사로, 인도 예비군, 캐나다 군 기지, 기관 및 일부 외딴 지역에 거주하는 사람들을 제외하고 12 세 이상의 가구 거주자를 대상으로합니다. 2007 년 이전에 설문 조사는 2 년의 수집 주기로 운영되었으며, 첫해에는 큰 표본에서 일반 인구 건강을 조사하고 두 번째 해에는 작은 표본에서 특정 건강 주제에 초점을 맞추 었습니다. 각 설문 조사의 각 응답자에게는 개인 수준 가중치가 할당되므로 가중치는 해당 응답자가 대표하는 전체 모집단의 사람 수에 해당하고 1 년 동안 모든 가중치의 합은 인구와 동일합니다. 캐나다. 세 개의 샘플링 프레임이 설문 조사에 사용되며 개인에게 할당 된 최종 가중치는 각 샘플링 프레임에서 독립적으로 할당 된 가중치에서 통합됩니다. 가중치는 또한 가구의 무응답 및 오버 샘플링을 포함하여 다른 잠재적 인 편향을 설명하기 위해 보정됩니다. 이러한 데이터를 분석 할 때 가중치를 사용하여 조사 결과가 단순히 설문 조사 샘플이 아닌 인구를 대표하는지 확인해야합니다.인종이 응답자 가중치의 도출에 구체적으로 포함되지는 않지만 참가자는 모집단에서 무작위로 선택되므로 가중치가 특정 민족 그룹을 체계적으로 과소 또는 과대 대표 할 것이라고 의심 할 이유가 없습니다. 20 개 이상의 언어로 관리됩니다. CCHS 데이터 세트에는 응답자의 성이 포함되어 있지 않지만 응답자는 건강 카드 번호를 통해 건강 관리 데이터 소스와 연결되는 설문 조사 응답을 허용했습니다. 이것은 ICES의 일반적인 암호화 알고리즘을 사용하여 익명화되었으므로 CCHS 데이터는 RPDB를 포함한 다른 관리 데이터 소스와 연결될 수 있습니다.

골드 표준은 CCHS에서 자체보고 된 민족이었습니다. 설문 조사 응답자의 인구 통계 학적 프로필의 일부로 일상적으로 수집 된 두 가지 CCHS 질문이 사용되었습니다. 이것은 “당신의 조상은 어떤 민족에 속했습니까?”였습니다. 그리고 “캐나다에 사는 사람들은 다양한 문화적, 인종적 배경을 가지고 있습니다. 당신은 …?” 각 질문에 대해 여러 응답이 허용되었습니다. 두 질문 중 하나에 대해 “남아시아 인”이라는 단일 응답을받은 응답자는 남아시아 민족에 할당되었습니다. 두 질문 중 하나에 “중국인”이라는 단일 응답을 가진 사람들은 중국 민족에 할당되었습니다. 그리고 나머지는 모두 일반 인구에 배정되었습니다.

우리는 CCHS의 2001, 2002 또는 2003주기에 대한 모든 성인 응답자를 조사했습니다. 각 응답자에 대해 설문 조사에 대한 자체보고 응답에서 금 표준 민족이 설정되었으며, 성에서 파생 된 민족성은 CCHS 데이터 세트에서 암호화 된 의료 카드 번호와 성에서 파생 된 민족 할당을 연결하여 파생되었습니다. 민족 식별 파일. 남아시아 성 목록의 유효성은 민감도 (성 목록에서 발견 된 남아시아 인으로 자체 식별 된 사람들의 비율), 특이성 (남아시아 인이 아닌 것으로 스스로 식별 된 사람들의 비율)을 측정하여 결정되었습니다. 성 목록에 의해 감지 됨), 양의 예측 값 (남아시아 인으로서 성 목록에서 감지 된 비율) 및 음의 예측 값 (성 목록에서 남이 아닌 것으로 감지 된 비율) 자신을 식별 한 아시아 인). 중국 성 목록을 확인하기 위해 유사한 계산이 이루어졌습니다. 이 계산에서 각 응답자는 자신의 개인 수준 가중치 (3 개 설문 조사 연도의 응답자를 결합했기 때문에 3으로 나눈 값)로 가중치를 부여했습니다. 우리는 이전에 발표 된 중국 성 목록과 우리의 중국 성 목록을 비교했습니다. 두 목록을 사용하여 동일한 금 표준에 대해 성에서 파생 된 민족성을 비교했습니다. 마지막으로 성별, 연령 및 이민 신분으로 분류 된 각 성 목록의 긍정적 인 예측 값을 비교했습니다.

윤리

연구에 대한 데이터는 공개되지 않았지만 연구 계약에 따라 MOH가 ICES에 제공했습니다. ICES는 온타리오의 건강 정보 개인 정보 보호법 인 건강 정보 보호법에 명시된 “규정 법인”으로 연구 목적으로 이러한 데이터를 보유, 연결 및 분석 할 수 있습니다.이 연구는 Sunnybrook Health Sciences Center의 기관 검토위원회의 승인을 받았습니다. .

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다