PMC
Discussione
Utilizzando i dati del registro delle nascite dallo stato del Michigan, abbiamo trovato che l’ANA è altamente specifico ma solo moderatamente sensibile come mezzo per rilevare l’ascendenza araba quando confrontato con l’ascendenza auto dichiarata, che, a nostra conoscenza, lo stato del Michigan include solo nei moduli delle statistiche vitali. Man mano che la concentrazione di arabi-americani in una località di studio aumentava, la sensibilità e il PPV dell’ANA aumentavano e la specificità e il NPV dell’algoritmo diminuivano. Il NPV era alto: 93,5% o superiore in tutte le stratificazioni, indipendentemente dalla prevalenza dell’ascendenza araba.
Al meglio delle nostre conoscenze, questo è il primo tentativo di convalidare un algoritmo di cognome arabo per l’uso nella ricerca sanitaria. È stata sviluppata e convalidata una Middle East Surname List (MESL) che include i cognomi dei paesi arabi e dei paesi del Medio Oriente dove l’etnia araba non è comune (Nasseri 2007). Il MESL è stato derivato usando i dati dei nomi dalla Social Security Administration, il California Cancer Registry, e l’opinione di esperti, usando il paese di nascita come standard per determinare lo status mediorientale; è stato riportato che è relativamente accurato nel determinare la nascita in un paese del Medio Oriente (Nasseri 2007). La sensibilità del MESL nel determinare il luogo di nascita mediorientale tra i pazienti del Registro Tumori della California è stata dell’88,62%; la specificità del 99,46%; il PPV del 68,54% e il NPV del 99,85%. La metodologia MESL differisce dal nostro ANA in tre modi fondamentali. In primo luogo il MESL include nomi da paesi “mediorientali”, tra cui Iran, Afghanistan, Pakistan e Armenia. In secondo luogo, sono state utilizzate più fonti nella compilazione del MESL finale. In terzo luogo, il MESL è stato testato utilizzando il paese di nascita mediorientale come “gold standard”, piuttosto che l’ascendenza auto dichiarata, che omette sistematicamente i mediorientali nati in patria (Stronks et al. 2008).
Abbiamo trovato tassi sostanzialmente più alti di falsi positivi e falsi negativi associati all’ANA tra gli uomini rispetto alle donne. Usando l’ANA, più uomini arabo-americani avevano la probabilità di essere identificati come non arabo-americani allora donne arabo-americane, e più uomini non arabo-americani avevano la probabilità di essere identificati come arabo-americani allora donne non arabo-americane. I nostri risultati possono riflettere differenze sistematiche nell’autodenuncia ancestrale tra uomini e donne.
Nella valutazione dei test di screening in situazioni cliniche, ci si aspetta che la sensibilità e la specificità di un test siano costanti in tutte le popolazioni, e che il PPV e il NPV varino con la prevalenza della condizione, con PPV più alto nei gruppi con maggiore prevalenza della condizione. Mentre abbiamo trovato che il PPV è più alto negli strati con proporzioni più alte di arabi-americani, abbiamo trovato che la sensibilità dell’ANA era molto più alta nelle aree con maggiore concentrazione arabo-americana e tra le donne, anche se non così alta come altri algoritmi cognitivi (Nasseri 2007). Questo indica differenze nella popolazione arabo-americana tra aree ad alta e bassa densità. Gli arabo-americani che vivono in località ad alta concentrazione arabo-americana, o enclavi, hanno probabilmente uno status socioeconomico (SES) più basso rispetto agli arabo-americani in località a bassa concentrazione arabo-americana e hanno anche maggiori probabilità di essere musulmani (Logan et al. 2002, Abudabbeh 1996, Abu-Laban e Suleiman 1989, El-Badry 1994, Naff 1985, Naff 1985, Amer e Hovey 2007). Noi ipotizziamo che la nostra scoperta possa essere parzialmente spiegata dal rapporto tra arabi americani cristiani e arabi americani musulmani nelle aree ad alta concentrazione arabo-americana rispetto alle aree a bassa concentrazione arabo-americana. Poiché i nomi biblici sono comuni tra gli arabi cristiani, è meno probabile che essi abbiano nomi etnicamente distintivi e inclusi nell’ANA. Pertanto, parte della ragione del tasso di falsi negativi dell’ANA può verificarsi perché gli arabi-americani cristiani con nomi non etnicamente distintivi non sono riconoscibilmente arabi-americani per cognome. Un’altra possibilità è che ci possono essere relativamente più persone con ascendenze arabe parziali piuttosto che complete al di fuori delle enclavi etniche e, anche se sottoscrivono la domanda di ascendenza araba, tale ascendenza può essere confinata al lato materno e non riflettersi nei loro cognomi. Per ragioni di riservatezza, i cognomi reali sui registri di nascita non erano disponibili per il nostro uso. Non siamo stati quindi in grado di testare le nostre ipotesi sui nomi arabi cristiani e sull’ascendenza parziale.
La specificità era più bassa nelle aree a più alta concentrazione arabo-americana, il che significa che una percentuale più alta di non arabi-americani è stata erroneamente identificata come arabo-americana. Poiché le congregazioni multietniche sono comuni tra le comunità musulmane negli Stati Uniti (Haniff 2003), e gli arabo-americani negli Stati Uniti sono sproporzionatamente musulmani (Arab American Institute Foundation 2008), potrebbero esserci proporzioni più alte di musulmani di altre etnie in contesti ad alta densità arabo-americana. Una fonte di falsi positivi osservati può essere che alcuni nomi nell’ANA appartengono a musulmani con altre origini, come gli asiatici del sud o gli afro-americani convertiti all’Islam. Anche se la derivazione della lista ANA presso la Social Security Administration è stata progettata per identificare i nomi che erano distintivi per i paesi arabi, alcuni nomi sono inclusi che sono molto più comuni nei paesi arabi, ma tuttavia appaiono in altre popolazioni con un’alta percentuale di musulmani. Questi nomi potrebbero identificare alcune persone con altre origini.
Quando si interpretano i risultati di questo studio è importante riconoscere che la nostra analisi include solo i genitori, che vanno in età da adolescenti anziani ad adulti di mezza età, che potrebbero non essere rappresentativi dell’intera popolazione arabo-americana. L’utilizzo dei dati sui genitori potrebbe sovrarappresentare gli arabo-americani di prima generazione, che potrebbero avere più o meno probabilità di avere nomi etnicamente distinti rispetto alla popolazione generale. Un’altra limitazione da considerare è che lo standard di misurazione con cui è stato confrontato l’ANA è l’ascendenza araba autoidentificata, piuttosto che l’etnia. Poiché il concetto di ascendenza può essere interpretato diversamente dall’etnia, i nostri risultati potrebbero non essere generalizzati alla capacità dell’algoritmo di determinare l’etnia. Non c’è stata, a nostra conoscenza, alcuna convalida della domanda sull’ascendenza araba auto-riferita. Infine, è importante considerare lo scopo di un algoritmo di nomi nella ricerca sanitaria sulle popolazioni di minoranza etnica. L’uso più importante dell’ANA potrebbe non essere la sua capacità di rilevare la più grande proporzione di arabi-americani, ma nella sua capacità di identificare un campione di quella popolazione che è molto probabile essere arabo-americano e che non differisce sistematicamente dalla popolazione arabo-americana generale. Per esempio, Shin e Yu suggerirono che, poiché il 22% della popolazione coreana condivideva il cognome “Kim”, le metriche tra i soli individui con il cognome Kim erano generalizzabili alla popolazione coreano-americana (Shin e Yu 1984). Se l’ANA è in grado di definire un campione rappresentativo di arabo-americani, potrebbe essere ben attrezzato per l’uso nella ricerca sanitaria nonostante la sensibilità solo moderata. Il NPV dell’ANA, che è stato trovato uniformemente alto, può quindi essere più importante della sua sensibilità per l’uso nella valutazione dei parametri di salute tra la popolazione arabo-americana.
L’ANA è uno strumento potenziale altamente specifico, ma solo moderatamente sensibile per i ricercatori interessati a identificare gli arabo-americani ai fini della ricerca sanitaria. La performance dell’ANA nell’identificare l’ascendenza araba dipende dalla proporzione di arabi-americani nella popolazione di studio; l’ANA era più sensibile nelle popolazioni di studio con alte proporzioni di arabi-americani, ma in realtà aveva una specificità leggermente superiore nelle aree con concentrazioni di arabi-americani inferiori. A causa della sua alta specificità, l’ANA può essere utile come mezzo per valutare le metriche di salute tra la popolazione arabo-americana; tuttavia, la ricerca è necessaria per confrontare le caratteristiche effettive di salute tra le popolazioni arabo-americane definite dall’ascendenza araba e quelle definite dall’ANA.
Messaggi chiave
La difficoltà di identificare gli arabo-americani utilizzando le statistiche vitali, i registri o i dati amministrativi è una barriera alla ricerca sanitaria su questo gruppo. L’algoritmo dei nomi arabi è un mezzo altamente specifico, ma solo moderatamente sensibile per rilevare l’ascendenza araba per l’uso nella ricerca sanitaria sugli arabo-americani. All’aumentare della concentrazione di arabi-americani in una località di studio, il tasso di falsi positivi ANA è aumentato e il tasso di falsi negativi è diminuito. La ricerca futura dovrebbe confrontare le caratteristiche di salute tra le popolazioni arabo-americane definite dall’ascendenza araba e quelle definite dall’ANA.