カナダのオンタリオ州の二次データから南アジアと中国の民族性を特定するための名前リスト:検証研究


名前リストの作成

南を開発するアジアの名前リスト、死亡診断書データを使用して開発された以前に開発された南アジアの名前のカナダのリストから始めました。コミュニティの電話ディレクトリとインド政府が発行した名前の百科事典にある名前を追加しました。次に、それぞれの名前は、南アジアを起源とする少なくとも2人の研究者によってレビューされました。家系の名前が南アジア特有のものであると感じられなかった場合(つまり、家系の名前が他の集団、コミュニティ、または民族グループでも一般的であった場合)は除外されました。家系の名前を除外するかどうかについて研究者間で意見の相違があった場合、コンセンサスの決定に達するまで、南アジア出身の5人の研究者のパネルによってレビューされました。最終的なリストには、コンセンサスによって南アジア独自であると信じられていたすべての名前が含まれていました。

中国の名前の包括的なリストは以前に公開および検証されていますが、このリストにはいくつかの名前が含まれていることに注意してください。中国語だけではありません(例:Diep、Jain、Kang、Sen)。そのため、このリストを使用して中国出身の患者のコホートを特定することの肯定的な予測値について懸念していました。そのため、そのリストの名前について同様のコンセンサスプロセスを繰り返し、コンセンサスによって一意に中国人であると信じられる名前の最終リストを作成しました。

管理データソース

Institute for Clinical Evaluative Sciences(ICES)は、オンタリオ州保健長期ケア省(MOH)から資金提供を受けている医療サービス研究組織であり、政策関連および科学研究のために州の医療行政データベースの分析を行っています。これらの管理データソースの1つは、登録者データベース(RPDB)です。これは、オンタリオ州の現在および以前のすべての居住者(現在の人口= 1,300万人)に割り当てられたヘルスカード番号のレジストリです。 MOHから受け取った名目上のファイルには、患者の名前が含まれています。MOHとICESの間のデータ共有契約では、この名目上のファイルにアクセスできるのは3人の指名された個人のみです。彼らは、リリース前に名前を削除して匿名化し、ヘルスカード番号を暗号化することにより。この暗号化はすべての管理データソースに共通の再現可能なアルゴリズムを使用するため、この一意の暗号化番号を介して個人をデータベース間でリンクできます。

名前リストは名目上に適用されました民族識別ファイルを作成するためのRPDBファイル。名前が南アジアのリストにあるすべてのオンタリオ州の居住者は南アジアの民族に割り当てられました。名前が中国のリストにあるすべての居住者は中国の民族に割り当てられました。その他はすべて一般人口に割り当てられました。グループ。最終的な名前から派生した民族識別ファイルには、暗号化されたヘルスカード番号とすべてのOntaの民族割り当ての両方が含まれていました。リオの住民。 (図1を参照)

図1

登録者データベースからの名前から派生した民族識別ファイルの派生。

検証

カナダのコミュニティ健康調査(CCHS)からの自己申告による民族性に対して、名前リストを検証しました。 CCHSは、カナダ統計局が実施する定期的な横断的全国電話調査であり、カナダの居留地、カナダ軍基地、機関、および一部の遠隔地に住む人々を除く、12歳以上の世帯居住者を対象としています。 2007年以前は、調査は2年間の収集サイクルで行われ、1年目は大きなサンプルで一般的な人口の健康を調査し、2年目は小さなサンプルで特定の健康トピックに焦点を当てました。各調査の各回答者には個人レベルの重みが割り当てられているため、重みはその回答者が表す母集団全体の人数に対応し、1年間の調査のすべての重みの合計はカナダ。調査には3つのサンプリングフレームが使用され、個人に割り当てられた最終的な重みは、各サンプリングフレームから個別に割り当てられた重みから統合されます。重みは、無応答や世帯のオーバーサンプリングなど、他の潜在的なバイアスを考慮して調整されます。複数の電話回線を使用します。これらのデータの分析で重みを使用することは、調査結果が調査サンプルだけでなく、母集団を表すことを保証するために必要です。回答者の重みの導出には民族性は特に含まれていませんが、参加者は母集団からランダムに選択されるため、特に調査では、重みが民族グループを体系的に過小または過大に表していると疑う理由はありません。 CCHSデータセットには回答者の姓は含まれていませんが、回答者は調査回答をヘルスカード番号を介して健康管理データソースにリンクすることを許可しました。これはICESの通常の暗号化アルゴリズムを使用して匿名化されたため、CCHSデータをRPDBを含む他の管理データソースとリンクできます。

ゴールドスタンダードは、CCHSから自己申告された民族でした。調査回答者の人口統計プロファイルの一部として定期的に収集された2つのCCHS質問が使用されました。これらは「あなたの先祖はどの民族に属していましたか?」でした。 「カナダに住む人々は、さまざまな文化的および人種的背景から来ています。あなたは…?」質問ごとに複数の回答が許可されました。いずれかの質問に対して「南アジア」という単一の回答があった回答者は、南アジアの民族に割り当てられました。どちらかの質問に対して「中国人」という単一の回答があった人は、中国人の民族に割り当てられました。その他はすべて一般集団に割り当てられました。

2001年、2002年、または2003年のCCHSサイクルのいずれかに対するすべての成人回答者を調査しました。各回答者について、ゴールドスタンダードの民族性は、調査への自己申告の回答から確立されましたが、名前由来の民族性は、CCHSデータセットからの暗号化されたヘルスカード番号と、名前由来の民族性の割り当てとのリンクによって導き出されました。民族識別ファイル。南アジアの名前リストの有効性は、感度(名前リストによってそのように検出された南アジア人として自己識別された人々の割合)、特異性(南アジア人ではないと自己識別された人々の割合)を測定することによって決定されました。家系の名前リストによってそのように検出された)、正の予測値(そのように自己識別した南アジア人として名前リストによって検出されたものの割合)および負の予測値(南アジアではないと名前リストによって検出されたものの割合)そのように自己識別したアジア人)。中国の姓名リストを検証するために、同様の計算が行われました。これらの計算では、各回答者は個人レベルの重みで重み付けされています(3つの調査年の回答者を組み合わせているため、3で除算されています)。以前に公開された中国の名前リストを、同じゴールドスタンダードに対して両方のリストを使用して名前から派生した民族性を比較することにより、中国の名前リストと比較しました。最後に、性別、年齢、移民ステータスで階層化された各名前リストの肯定的な予測値を比較しました。

倫理

この調査のデータは公開されていませんが、研究協定に基づいてMOHからICESに提供された。 ICESは、オンタリオ州の健康情報プライバシー法である健康情報保護法の「規定されたエンティティ」として、研究目的でこれらのデータを保持、リンク、分析することを許可されています。この調査は、Sunnybrook Health SciencesCenterの機関審査委員会によって承認されました。 。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です