PMC
Diskussion
Ved hjælp af fødselsregisterdata fra staten Michigan fandt vi, at ANA er meget specifik, men kun moderat følsom som middel til at påvise arabisk herkomst sammenlignet med selvrapporteret herkomst, som, så vidt vi ved, staten Michigan udelukkende medtager i formularerne til civilstandsstatistik. Efterhånden som koncentrationen af arabisk-amerikanere i en undersøgelseslokalitet steg, steg ANA’s følsomhed og PPV, mens algoritmens specificitet og NPV faldt. NPV’en var høj: 93,5 % eller højere i alle stratificeringer uanset prævalensen af arabisk afstamning.
Så vidt vi ved, er dette det første forsøg på at validere en algoritme for arabiske efternavne til brug i sundhedsforskning. Der er blevet udviklet og valideret en Middle East Surname List (MESL), der omfatter efternavne fra arabiske lande samt lande i Mellemøsten, hvor arabisk etnicitet er ualmindelig, (Nasseri 2007). MESL blev udledt ved hjælp af navnedata fra Social Security Administration, California Cancer Registry og ekspertudtalelser, idet fødselslandet blev anvendt som standard for bestemmelse af mellemøstlig status; det blev rapporteret, at den var relativt præcis til at bestemme fødsel i et land i Mellemøsten (Nasseri 2007). MESL’s følsomhed ved bestemmelse af fødested i Mellemøsten blandt patienter i Californiens kræftregister var 88,62 %; specificiteten var 99,46 %; PPV var 68,54 %; og NPV var 99,85 %. MESL-metodologien adskiller sig fra vores ANA på tre grundlæggende måder. For det første omfatter MESL navne fra lande i “Mellemøsten”, herunder Iran, Afghanistan, Pakistan og Armenien. For det andet blev der anvendt flere kilder ved udarbejdelsen af den endelige MESL. For det tredje blev MESL testet ved hjælp af mellemøstligt fødeland som “guldstandard”, snarere end selvrapporteret herkomst, som systematisk udelukker indfødte mellemøstlige personer (Stronks et al. 2008).
Vi fandt væsentligt højere falsk positive og falsk negative satser forbundet med ANA blandt mænd sammenlignet med kvinder. Ved hjælp af ANA var det sandsynligt, at flere arabisk-amerikanske mænd blev identificeret som ikke-arabisk-amerikanske end arabisk-amerikanske kvinder, og at flere ikke-arabisk-amerikanske mænd blev identificeret som arabisk-amerikanske end ikke-arabisk-amerikanske kvinder. Vores resultater kan afspejle systematiske forskelle i forfædres selvrapportering mellem mænd og kvinder.
I forbindelse med evaluering af screeningstest i kliniske situationer forventer man, at en tests sensitivitet og specificitet er konstant i alle populationer, og at PPV og NPV varierer med prævalensen af tilstanden, idet PPV er højere i grupper med højere prævalens af tilstanden. Mens vi fandt, at PPV’en var højere i strata med større andel af arabisk-amerikanere, fandt vi, at ANA-testens sensitivitet var meget højere i områder med større arabisk-amerikansk koncentration og blandt kvinder, selv om den ikke var så høj som andre efternavnealgoritmer (Nasseri 2007). Dette peger på forskelle i den arabisk-amerikanske befolkning mellem områder med høj og lav befolkningstæthed. Arabisk-amerikanere, der bor i lokaliteter med høj arabisk-amerikansk koncentration, eller enklaver, har sandsynligvis en lavere socioøkonomisk status (SES) end arabisk-amerikanere i lokaliteter med lavere arabisk-amerikansk koncentration og er også mere tilbøjelige til at være muslimer (Logan et al. 2002, Abudabbeh 1996, Abu-Laban og Suleiman 1989, El-Badry 1994, Naff 1985, Naff 1985, Amer og Hovey 2007). Vi opstiller den hypotese, at vores fund delvist kan forklares af forholdet mellem kristne arabisk-amerikanere og muslimske arabisk-amerikanere i områder med høj arabisk-amerikansk koncentration sammenlignet med områder med lav arabisk-amerikansk koncentration. Fordi bibelske navne er almindelige blandt kristne arabere, er det mindre sandsynligt, at de har navne, der er etnisk karakteristiske og indgår i ANA. Derfor kan en del af årsagen til ANA-undersøgelsens falsk-negative procentdel skyldes, at kristne arabisk-amerikanere med navne, der ikke er etnisk særprægede, ikke kan genkendes som arabisk-amerikanere af efternavn. En anden mulighed er, at der kan være relativt flere personer med delvis snarere end fuldt arabisk afstamning uden for de etniske enklaver, og selv om de tilslutter sig spørgsmålet om arabisk afstamning, kan en sådan afstamning være begrænset til moderens side og ikke afspejles i deres efternavne. Af fortrolighedshensyn var de faktiske efternavne i fødselsregistrene ikke tilgængelige til brug for os. Vi var derfor ikke i stand til at teste vores hypoteser om kristne arabiske navne og delvis herkomst.
Specificiteten var lavere i de områder med højere arabisk-amerikansk koncentration, hvilket betyder, at en højere andel af ikke-arabisk-amerikanere fejlagtigt blev identificeret som arabisk-amerikanere. Da multietniske menigheder er almindelige blandt muslimske samfund i USA (Haniff 2003), og da arabisk-amerikanere i USA er uforholdsmæssigt mange muslimer (Arab American Institute Foundation 2008), kan der være højere andele af muslimer af andre etniciteter i sammenhænge med høj arabisk-amerikansk tæthed. En kilde til de observerede falske positive resultater kan være, at nogle navne i ANA tilhører muslimer med andre forfædre, f.eks. sydasiatiske eller afroamerikanske konvertitter til islam. Selv om ANA-listen hos Social Security Administration blev udarbejdet med henblik på at identificere navne, der var karakteristiske for arabiske lande, er der medtaget nogle navne, som er langt mere almindelige i arabiske lande, men som ikke desto mindre optræder i andre befolkningsgrupper med en høj andel af muslimer. Disse navne ville kunne identificere nogle personer med andre forfædre.
Ved fortolkningen af resultaterne af denne undersøgelse er det vigtigt at erkende, at vores analyse kun omfatter forældre, som varierer i alder fra ældre teenagere til midaldrende voksne, hvilket måske ikke er repræsentativt for hele den arabisk-amerikanske befolkning. Brug af data om forældre kan overrepræsentere første generation af arabisk-amerikanere, som kan være mere eller mindre tilbøjelige til at have etnisk særprægede navne end den generelle befolkning. En anden begrænsning, der skal tages i betragtning, er, at den standard for måling, som ANA blev sammenlignet med, er selvidentificeret arabisk afstamning snarere end etnicitet. Da begrebet afstamning kan fortolkes anderledes end etnicitet, kan vores resultater muligvis ikke generaliseres til algoritmens evne til at bestemme etnicitet. Så vidt vi ved, er der ikke foretaget nogen validering af spørgsmålet om selvrapporteret arabisk afstamning. Endelig er det vigtigt at overveje formålet med en navnealgoritme i sundhedsforskning om etniske minoritetspopulationer. Den vigtigste anvendelse af ANA er måske ikke dens evne til at opdage den største andel af arabisk-amerikanere, men i dens evne til at identificere en stikprøve af denne befolkning, som med stor sandsynlighed er arabisk-amerikansk, og som ikke adskiller sig systematisk fra den generelle arabisk-amerikanske befolkning. Shin og Yu foreslog f.eks., at fordi 22 % af den koreanske befolkning delte efternavnet “Kim”, kunne målinger blandt kun dem med Kim-navnet generaliseres til den koreansk-amerikanske befolkning (Shin og Yu 1984). Hvis ANA er i stand til at definere en repræsentativ stikprøve af arabisk-amerikanere, kan den være veludrustet til brug i sundhedsforskning på trods af kun moderat følsomhed. ANA’s NPV, som viste sig at være ensartet høj, kan derfor være vigtigere end dens følsomhed til brug ved vurdering af sundhedsmålinger blandt den arabisk-amerikanske befolkning.
Ana er et meget specifikt, men kun moderat følsomt potentielt værktøj for undersøgere, der er interesseret i at identificere arabisk-amerikanere med henblik på sundhedsforskning. ANA’s ydeevne med hensyn til at identificere arabisk afstamning afhænger af andelen af arabisk-amerikanere i undersøgelsespopulationen; ANA var mest følsom i undersøgelsespopulationer med høje andele af arabisk-amerikanere, men havde faktisk en lidt højere specificitet i områder med lavere koncentrationer af arabisk-amerikanere. På grund af sin høje specificitet kan ANA være nyttig som et middel til at vurdere sundhedsmålinger blandt den arabisk-amerikanske befolkning; der er imidlertid behov for forskning for at sammenligne de faktiske sundhedskarakteristika blandt arabisk-amerikanske befolkninger defineret ved arabisk afstamning og dem defineret ved ANA.
Nøglebudskaber
Sværeheden ved at identificere arabisk-amerikanere ved hjælp af vitale statistikker, registre eller administrative data er en hindring for sundhedsforskning om denne gruppe. Algoritmen for arabiske navne er et meget specifikt, men kun moderat følsomt middel til at påvise arabisk afstamning til brug i sundhedsforskning om arabisk-amerikanere. Efterhånden som koncentrationen af arabisk-amerikanere i en undersøgelseslokalitet steg, steg ANA’s falsk-positive rate og faldt den falsk-negative rate. Fremtidig forskning bør sammenligne sundhedskarakteristika blandt arabisk-amerikanske befolkninger defineret ved arabisk afstamning og dem defineret ved ANA.