PMC
Diskussion
Med hjälp av uppgifter från födelseregistret i delstaten Michigan fann vi att ANA är mycket specifik men endast måttligt känslig för att upptäcka arabisk härstamning jämfört med självrapporterad härstamning, som, såvitt vi vet, endast ingår i delstaten Michigan i formulär för befolkningsstatistik. När koncentrationen av arabamerikaner i en undersökningsort ökade, ökade ANA:s känslighet och PPV, medan algoritmens specificitet och NPV minskade. NPV var hög: 93,5 % eller högre i alla stratifieringar oavsett förekomsten av arabisk härstamning.
Såvitt vi vet är detta det första försöket att validera en algoritm för arabiska efternamn för användning i hälsorelaterad forskning. En Middle East Surname List (MESL) som innehåller efternamn från arabiska länder samt länder i Mellanöstern där arabisk etnicitet är ovanlig har utvecklats och validerats (Nasseri 2007). MESL togs fram med hjälp av namnuppgifter från Social Security Administration, California Cancer Registry och expertutlåtanden, med födelseland som standard för att fastställa Mellanösternstatus; den rapporterades vara relativt exakt när det gäller att fastställa födelse i ett land i Mellanöstern (Nasseri 2007). Känsligheten för MESL vid bestämning av födelseort i Mellanöstern bland patienter i Kaliforniens cancerregister var 88,62 %, specificiteten var 99,46 %, PPV var 68,54 % och NPV var 99,85 %. MESL-metodiken skiljer sig från vår ANA på tre grundläggande sätt. För det första omfattar MESL namn från länder i ”Mellanöstern”, inklusive Iran, Afghanistan, Pakistan och Armenien. För det andra användes flera källor vid sammanställningen av den slutliga MESL. För det tredje testades MESL med födelseland i Mellanöstern som ”guldstandard”, snarare än självrapporterad härstamning, som systematiskt utelämnar infödda personer från Mellanöstern (Stronks et al. 2008).
Vi fann väsentligt högre falskt positiva och falskt negativa siffror i samband med ANA bland män jämfört med kvinnor. Med hjälp av ANA var det troligt att fler arabisk-amerikanska män identifierades som icke-arabisk-amerikanska än arabisk-amerikanska kvinnor, och fler icke-arabisk-amerikanska män identifierades troligen som arabisk-amerikanska än icke-arabisk-amerikanska kvinnor. Våra resultat kan avspegla systematiska skillnader mellan män och kvinnor när det gäller självrapportering från förfäder.
När man utvärderar screeningtest i kliniska situationer förväntar man sig att känsligheten och specificiteten för ett test ska vara konstanta i alla populationer och att PPV och NPV ska variera med förekomsten av tillståndet, med PPV högre i grupper med högre förekomst av tillståndet. Även om vi fann att PPV var högre i strata med högre andelar arabamerikaner, fann vi att ANA:s känslighet var mycket högre i områden med större arabamerikansk koncentration och bland kvinnor, även om den inte var lika hög som andra efternamnsalgoritmer (Nasseri 2007). Detta pekar på skillnader i den arabisk-amerikanska befolkningen mellan områden med hög och låg befolkningstäthet. Arabamerikaner som bor på orter med hög arabisk-amerikansk koncentration, eller enklaver, har sannolikt lägre socioekonomisk status (SES) än arabamerikaner på orter med lägre arabisk-amerikansk koncentration och har också större sannolikhet att vara muslimer (Logan et al. 2002, Abudabbeh 1996, Abu-Laban och Suleiman 1989, El-Badry 1994, Naff 1985, Naff 1985, Amer och Hovey 2007). Vi antar att vårt resultat delvis kan förklaras av förhållandet mellan kristna arabamerikaner och muslimska arabamerikaner i områden med hög arabisk-amerikansk koncentration jämfört med områden med låg arabisk-amerikansk koncentration. Eftersom bibliska namn är vanliga bland kristna araber är det mindre sannolikt att de har namn som är etniskt särskiljande och ingår i ANA. Därför kan en del av orsaken till ANA:s falskt negativa resultat bero på att kristna arabamerikaner med namn som inte är etniskt distinkta inte är igenkännbara arabamerikaner till efternamn. En annan möjlighet är att det kan finnas relativt fler personer med delvis snarare än helt arabisk härstamning utanför de etniska enklaverna, och även om de ställer sig bakom frågan om arabisk härstamning kan denna härstamning vara begränsad till moderns sida och inte återspeglas i deras efternamn. Av sekretesskäl var de faktiska efternamnen i födelseregistren inte tillgängliga för oss. Vi kunde därför inte testa våra hypoteser om kristna arabiska namn och partiell härstamning.
Specificiteten var lägre i de områden med högre arabisk-amerikansk koncentration, vilket innebär att en högre andel icke-arabiska amerikaner felaktigt identifierades som arabiska amerikaner. Eftersom multietniska församlingar är vanliga bland muslimska samfund i USA (Haniff 2003), och arabamerikaner i USA är oproportionerligt muslimska (Arab American Institute Foundation 2008), kan det finnas högre andelar muslimer av andra etniciteter i sammanhang med hög arabamerikansk täthet. En källa till observerade falska positiva resultat kan vara att vissa namn i ANA tillhör muslimer med andra anor, t.ex. sydasiatiska eller afroamerikanska konvertiter till islam. Även om framställningen av ANA-listan vid Social Security Administration var utformad för att identifiera namn som var utmärkande för arabländerna, ingår vissa namn som är mycket vanligare i arabländerna men som ändå förekommer i andra populationer med en hög andel muslimer. Dessa namn skulle kunna identifiera vissa personer med andra härstamningar.
När man tolkar resultaten av den här studien är det viktigt att inse att vår analys endast omfattar föräldrar, som är i åldrarna från äldre ungdomar till medelålders vuxna, vilket kanske inte är representativt för hela den arabisk-amerikanska befolkningen. Att använda uppgifter om föräldrar kan överrepresentera första generationens arabamerikaner, som kan vara mer eller mindre benägna att ha etniskt särskiljande namn än den allmänna befolkningen. En annan begränsning att beakta är att den mätstandard som ANA jämfördes med är självidentifierad arabisk härstamning, snarare än etnicitet. Eftersom begreppet anor kan tolkas annorlunda än etnicitet kan våra resultat kanske inte generaliseras till algoritmens förmåga att fastställa etnicitet. Såvitt vi vet har det inte gjorts någon validering av frågan om självrapporterad arabisk härstamning. Slutligen är det viktigt att beakta syftet med en namnalgoritm i hälsoforskning om etniska minoritetspopulationer. Den viktigaste användningen av ANA kanske inte är dess förmåga att upptäcka den största andelen arabamerikaner, utan i dess förmåga att identifiera ett urval av denna population som med stor sannolikhet är arabamerikaner och som inte skiljer sig systematiskt från den allmänna arabamerikanska befolkningen. Shin och Yu föreslog t.ex. att eftersom 22 % av den koreanska befolkningen delade efternamnet ”Kim”, kunde mätningar bland endast de som hade Kim som efternamn generaliseras till den koreansk-amerikanska befolkningen (Shin och Yu 1984). Om ANA kan definiera ett representativt urval av arabamerikaner kan det vara väl rustat för användning i hälsoundersökningar trots endast måttlig känslighet. ANA:s NPV, som befanns vara enhetligt hög, kan därför vara viktigare än dess känslighet för användning vid bedömning av hälsomätningar bland den arabisk-amerikanska befolkningen.
ANA är ett mycket specifikt, men endast måttligt känsligt potentiellt verktyg för utredare som är intresserade av att identifiera arabisk-amerikaner i syfte att bedriva hälsoforskning. ANA:s prestanda när det gäller att identifiera arabisk härstamning är beroende av andelen arabamerikaner i studiepopulationen; ANA var känsligast i studiepopulationer med höga andelar arabamerikaner, men hade faktiskt en något högre specificitet i områden med lägre arabisk-amerikanska koncentrationer. På grund av sin höga specificitet kan ANA vara användbart som ett sätt att bedöma hälsomått bland den arabisk-amerikanska befolkningen; det behövs dock forskning för att jämföra de faktiska hälsoegenskaperna bland arabisk-amerikanska befolkningar som definieras av arabisk härstamning och de som definieras av ANA.
Nyckelbudskap
Svårigheterna med att identifiera arabiska amerikaner genom att använda sig av befolkningsstatistik, register- eller administrativa uppgifter är ett hinder för hälsoundersökningar om denna grupp. Algoritmen för arabiska namn är ett mycket specifikt, men endast måttligt känsligt sätt att upptäcka arabisk härstamning för användning i hälsoundersökningar om arabamerikaner. I takt med att koncentrationen av arabamerikaner på en undersökningsort ökade, ökade ANA:s falskt positiva frekvens och den falskt negativa frekvensen minskade. Framtida forskning bör jämföra hälsoegenskaper bland arabamerikanska befolkningar som definieras genom arabisk härstamning och de som definieras genom ANA.