Sukunimiluettelot etelä-aasialaisen ja kiinalaisen etnisen alkuperän tunnistamiseksi toissijaisista tiedoista Ontariossa, Kanadassa: validointitutkimus

Sukunimiluetteloiden kehittäminen

Etelä-alueen kehittäminen Aasian sukunimiluettelo, aloitimme aiemmin kehitetystä kanadalaisesta luettelosta Etelä-Aasian sukunimistä, joka on kehitetty käyttämällä kuolintodistustietoja. Lisäsimme sukunimet, jotka löytyvät yhteisön puhelinluetteloista ja Intian hallituksen julkaisemasta sukunimien tietosanakirjasta. Ainakin kaksi eteläaasialaista alkuperää olevaa tutkijaa tarkasteli sitten kutakin nimeä. Sukunimet suljettiin pois, jos niiden ei katsottu olevan ainutlaatuisia eteläaasialaisia (eli jos sukunimi oli yleinen myös muissa väestöissä, yhteisöissä tai etnisissä ryhmissä). Jos tutkijoiden välillä oli erimielisyyttä sukunimen poissulkemisesta vai ei, sitä tarkasteli viisi eteläaasialaista alkuperää olevaa tutkijaa käsittelevä paneeli, kunnes yhteisymmärrykseen päästiin. Lopullinen luettelo sisälsi kaikki sukunimet, joiden uskottiin yksimielisesti olevan ainutlaatuisen eteläaasialaisia.

Vaikka kattava luettelo kiinalaisista sukunimistä on aiemmin julkaistu ja vahvistettu, huomasimme, että luettelossa oli joitain nimiä, jotka olivat ei ainutlaatuisesti kiinalainen (esim. Diep, Jain, Kang ja Sen). Sellaisena olimme huolestuneita kiinalaisesta alkuperästä kärsivien potilaiden kohorttien tunnistamisen positiivisesta ennustearvosta tämän luettelon avulla. Siksi toistimme samanlaisen yksimielisyysprosessin luettelossa olevista sukunimistä luodaksemme lopullisen luettelon sukunimistä, joiden uskotaan yksimielisesti olevan ainutlaatuisesti kiinalaisia.

Hallinnolliset tietolähteet

Institute for Clinical Evaluative Sciences (ICES) on terveydenhuollon tutkimusorganisaatio, jonka osittain rahoittaa Ontarion terveys- ja pitkäaikaishoidon ministeriö (MOH) analysoimaan maakunnan terveydenhuollon hallinnollisia tietokantoja politiikan kannalta merkityksellistä ja tieteellistä tutkimusta varten. Yksi näistä hallinnollisista tietolähteistä on Rekisteröityjen henkilöiden tietokanta (RPDB), joka on rekisteri annettujen terveystietokorttien numeroista kaikille nykyisille ja entisille Ontarion maakunnan asukkaille (nykyinen väestö = 13 miljoonaa). MOH: lta saatu nimellinen tiedosto sisältää potilaiden sukunimet. MOH: n ja ICES: n välisessä tietojenjakosopimuksessa vain kolmella nimetyllä henkilöllä on pääsy tähän nimelliseen tiedostoon. He anonymisoivat sen ennen julkaisua yleiseen analyyttiseen käyttöön poistamalla nimet ja salaamalla sairaanhoitokorttien numerot. Koska tässä salauksessa käytetään toistettavaa algoritmia, joka on yhteinen kaikille hallinnollisille tietolähteille, henkilöt voidaan linkittää tietokantojen välillä tämän ainutlaatuisen salatun numeron kautta.

Sukunimiluetteloita sovellettiin nimellisiin RPDB-tiedosto etnisen tunnistustiedoston luomiseksi. Kaikki Ontarion asukkaat, joiden sukunimet olivat Etelä-Aasian luettelossa, määritettiin Etelä-Aasian etnisyyteen; kaikille asukkaille, joiden sukunimet olivat Kiinan luettelossa, määrättiin kiinalainen etnisyys; kaikki muut osoitettiin yleiseen väestöön Lopullinen sukunimestä johdettu etninen tunnistetiedosto sisälsi sekä salatun sairaanhoitokortin numeron että kaikkien Onta-ryhmien etnisen tehtävän. rion asukkaat. (Katso kuva 1.)

Kuva 1

Sukunimestä johdetun etnisen tunnistetiedoston johtaminen rekisteröityjen henkilöiden tietokannasta.

Vahvistus

Vahvistimme sukunimiluettelot itse ilmoitetun etnisen alkuperän mukaan Kanadan yhteisön terveystutkimuksesta (CCHS). CCHS on toistuva poikkileikkauksellinen kansallinen puhelintutkimus, jonka Kanadan tilastokeskus on kohdistanut vähintään 12-vuotiaille kotitalouksien asukkaille, lukuun ottamatta Intian suojelualueilla, Kanadan joukkojen tukikohdissa, laitoksissa ja eräillä syrjäisillä alueilla asuvia. Ennen vuotta 2007 kysely toteutettiin kaksivuotisessa keräysjaksossa, ja ensimmäisenä vuonna väestön yleistä terveyttä tarkasteltiin suuressa otoksessa ja toisena vuonna keskityttiin tiettyihin terveysaiheisiin pienemmässä otoksessa. Jokaiselle kyselylle jokaiselle vastaajalle on määritetty henkilötasoinen paino siten, että paino vastaa kyseisen vastaajan edustamien ihmisten määrää koko väestössä, ja yhden vuoden kyselyn kaikkien painojen summa on sama kuin Kanada. Kolme näytteenottokehystä käytetään tutkimuksessa, ja yksilölle annettu lopullinen paino integroidaan jokaisesta näytekehyksestä itsenäisesti määritetyistä painoista. Painot kalibroidaan myös muiden mahdollisten poikkeamien huomioon ottamiseksi, mukaan lukien kotitalouksien vastaamattomuus ja ylinäyte Painojen käyttöä näiden tietojen analysoinnissa vaaditaan sen varmistamiseksi, että havainnot edustavat väestöä eikä pelkästään tutkimuksen otosta.Vaikka etnisyys ei ole nimenomaisesti sisällytetty vastaajien painojen laskentaan, osallistujat valitaan satunnaisesti populaatiosta, joten ei ole syytä epäillä, että painotukset edustaisivat järjestelmällisesti mitä tahansa etnistä ryhmää tai olisivat sitä liian suuria, etenkin koska tutkimus CCHS-tietojoukko ei sisällä vastaajien sukunimiä, mutta vastaajat antoivat luvan liittää kyselyvastauksensa terveydenhuollon hallinnollisiin tietolähteisiin sairauskorttinumeronsa kautta. Tämä anonymisoitiin käyttämällä ICES: n tavanomaista salausalgoritmia, jotta CCHS-tiedot voidaan linkittää muihin hallinnollisiin tietolähteisiin, mukaan lukien RPDB.

Kultainen standardi oli CCHS: n itsensä ilmoittama etnisyys. Käytettiin kahta CCHS-kysymystä, jotka kerättiin rutiininomaisesti osana kyselyyn vastanneiden väestöprofiilia. Nämä olivat ”mihin etnisiin ryhmiin esi-isäsi kuuluivat?” ja ”Kanadassa asuvat ihmiset tulevat monista erilaisista kulttuurisista ja rodullisista taustoista. Oletko …?” Jokaiseen kysymykseen sallittiin useita vastauksia. Ne vastaajat, joilla oli yksi ”eteläaasialainen” vastaus jompaankumpaan kysymykseen, osoitettiin eteläaasialaisiin etnisiin ryhmiin ne, joilla oli ainoa ”kiinalaisen” vastaus jompaankumpaan kysymykseen, osoitettiin kiinalaisuuteen; ja kaikki muut määrättiin väestöön.

Tutkimme kaikkia aikuisia vastaajia mihin tahansa CCHS: n vuosien 2001, 2002 tai 2003 jaksoon. Kullekin vastaajalle kultakantaan perustuva etninen alkuperä määritettiin heidän itsensä ilmoittamien kyselyyn antamien vastausten perusteella, kun taas heidän sukunimestä johtuvan etnisen alkuperänsä johdettiin yhdistämällä heidän CCHS-tietojoukosta salattu terveystodistuksen numero heidän etnisyysmääritykseen sukunimestä johdetussa muodossa. etninen tunnistetiedosto. Etelä-Aasian sukunimiluettelon pätevyys määritettiin mittaamalla herkkyys (eteläaasialaisiksi itse tunnistettujen henkilöiden osuus, jotka sukunimiluettelon perusteella havaittiin sellaisina), spesifisyys (niiden ihmisten osuus, jotka itse tunnistivat olevansa eteläaasialaisia ja jotka olivat tunnistettu sellaisenaan), positiivinen ennustearvo (etelä-aasialaisiksi sukunimiluettelossa havaittujen osuus) ja negatiivinen ennustearvo (sukunimiluettelon havaitsemien eteläosattomien osuus) Aasialaiset, jotka ovat itse tunnistaneet itsensä sellaisiksi). Vastaavat laskelmat tehtiin kiinalaisten sukunimiluettelon vahvistamiseksi. Näissä laskelmissa jokainen vastaaja painotettiin henkilökohtaisella painollaan (jaettuna 3: lla, koska yhdistimme kolmen kyselyvuoden vastaajia). Verrattiin aiemmin julkaistua kiinalaista sukunimiluetteloa kiinalaiseen sukunimiluetteloon vertaamalla sukunimestä johdettua etnistä alkuperää käyttämällä molempia luetteloita samaan kultastandardiin. Lopuksi verrattiin jokaisen sukunimiluettelomme positiivista ennustavaa arvoa kerrostettuna sukupuolen, iän ja maahanmuuttotilan mukaan.

Etiikka

Tutkimuksen tietoja ei ole julkisesti saatavilla, mutta ne olivat MOH: n ICES: lle toimittama tutkimussopimus. ICES: llä on lupa hallita, linkittää ja analysoida näitä tietoja tutkimustarkoituksiin nimettyinä ”määrättyinä yksiköinä” Ontarion terveystietosuojalaissa, terveystietosuojalaissa. Tutkimuksen hyväksyi Sunnybrook Health Sciences Centerin institutionaalinen arviointilautakunta. .

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *