PMC
Discussion
En utilisant les données du registre des naissances de l’État du Michigan, nous avons constaté que l’ANA est hautement spécifique mais seulement modérément sensible comme moyen de détecter l’ascendance arabe par rapport à l’ascendance autodéclarée, que, à notre connaissance, l’État du Michigan inclut uniquement dans les formulaires de statistiques vitales. Plus la concentration d’Arabes américains dans une localité étudiée augmente, plus la sensibilité et la VPP de l’ANA augmentent et plus la spécificité et la VPN de l’algorithme diminuent. La VPN était élevée : 93,5 % ou plus dans toutes les stratifications, quelle que soit la prévalence de l’ascendance arabe.
À notre connaissance, il s’agit de la première tentative de validation d’un algorithme de nom de famille arabe pour une utilisation dans la recherche en santé. Une liste de noms de famille du Moyen-Orient (MESL) qui comprend des noms de famille de pays arabes, ainsi que de pays du Moyen-Orient où l’ethnicité arabe est peu commune, a été développée et validée (Nasseri 2007). La MESL a été établie à partir de données nominatives provenant de la Social Security Administration, du California Cancer Registry et de l’opinion d’experts, en utilisant le pays de naissance comme norme pour déterminer le statut de personne originaire du Moyen-Orient ; elle s’est avérée relativement précise pour déterminer la naissance dans un pays du Moyen-Orient (Nasseri 2007). La sensibilité de la MESL pour déterminer le lieu de naissance au Moyen-Orient chez les patients du California Cancer Registry était de 88,62 % ; la spécificité était de 99,46 % ; la VPP était de 68,54 % ; et la VPN de 99,85 %. La méthodologie de la MESL diffère de notre ANA de trois manières fondamentales. Premièrement, la MESL inclut des noms provenant de pays du « Moyen-Orient », notamment l’Iran, l’Afghanistan, le Pakistan et l’Arménie. Deuxièmement, de multiples sources ont été utilisées dans la compilation de la LMES finale. Troisièmement, la MESL a été testée en utilisant le pays de naissance du Moyen-Orient comme « étalon-or », plutôt que l’ascendance autodéclarée, qui omet systématiquement les Moyen-Orientaux nés dans le pays (Stronks et al. 2008).
Nous avons trouvé des taux de faux positifs et de faux négatifs sensiblement plus élevés associés à l’ANA chez les hommes par rapport aux femmes. En utilisant l’ANA, plus d’hommes arabo-américains étaient susceptibles d’être identifiés comme non arabo-américains que de femmes arabo-américaines, et plus d’hommes non arabo-américains étaient susceptibles d’être identifiés comme arabo-américains que de femmes non arabo-américaines. Nos résultats peuvent refléter des différences systématiques dans l’autodéclaration ancestrale entre les hommes et les femmes.
En évaluant les tests de dépistage dans des situations cliniques, on s’attend à ce que la sensibilité et la spécificité d’un test soient constantes dans toutes les populations, et à ce que la VPP et la VPN varient avec la prévalence de la condition, la VPP étant plus élevée dans les groupes ayant une prévalence plus élevée de la condition. Alors que nous avons constaté que la VPP était plus élevée dans les strates présentant une plus grande proportion d’Arabo-Américains, nous avons constaté que la sensibilité de l’ANA était beaucoup plus élevée dans les zones à plus forte concentration d’Arabo-Américains et chez les femmes, bien qu’elle ne soit pas aussi élevée que celle des autres algorithmes de patronyme (Nasseri 2007). Cela indique des différences dans la population arabo-américaine entre les zones à forte et à faible densité. Les Arabes américains qui vivent dans des localités à forte concentration arabo-américaine, ou enclaves, sont susceptibles d’avoir un statut socio-économique (SSE) inférieur à celui des Arabes américains vivant dans des localités à faible concentration arabo-américaine et sont également plus susceptibles d’être musulmans (Logan et al. 2002, Abudabbeh 1996, Abu-Laban et Suleiman 1989, El-Badry 1994, Naff 1985, Naff 1985, Amer et Hovey 2007). Nous émettons l’hypothèse que notre résultat peut s’expliquer en partie par le rapport entre les Arabes américains chrétiens et les Arabes américains musulmans dans les zones à forte concentration d’Arabes américains par rapport aux zones à faible concentration d’Arabes américains. Les noms bibliques étant courants chez les Arabes chrétiens, ils sont moins susceptibles d’avoir des noms ethniquement distinctifs et inclus dans l’ANA. Par conséquent, le taux de faux négatifs de l’ANA peut s’expliquer en partie par le fait que les Arabes chrétiens américains dont les noms ne sont pas ethniquement distinctifs ne sont pas reconnaissables comme Arabes américains par leur nom de famille. Une autre possibilité est qu’il y ait relativement plus de personnes ayant une ascendance arabe partielle plutôt que complète en dehors des enclaves ethniques et que, bien qu’elles approuvent la question de l’ascendance arabe, cette ascendance soit limitée au côté maternel et ne se reflète pas dans leurs noms de famille. Pour des raisons de confidentialité, nous n’avons pas pu utiliser les noms de famille figurant sur les registres de naissance. Nous n’avons donc pas été en mesure de tester nos hypothèses sur les noms arabes chrétiens et l’ascendance partielle.
La spécificité était plus faible dans les zones à forte concentration arabo-américaine, ce qui signifie qu’une proportion plus élevée de non-arabes américains a été identifiée à tort comme arabo-américaine. Comme les congrégations multiethniques sont courantes parmi les communautés musulmanes aux États-Unis (Haniff 2003), et que les Arabes américains aux États-Unis sont musulmans de manière disproportionnée (Arab American Institute Foundation 2008), il peut y avoir des proportions plus élevées de musulmans d’autres ethnies dans les contextes à forte densité arabo-américaine. L’une des sources de faux positifs observés peut être que certains noms dans l’ANA appartiennent à des musulmans ayant d’autres ascendances, comme des Sud-Asiatiques ou des Afro-Américains convertis à l’Islam. Bien que la dérivation de la liste ANA à la Social Security Administration ait été conçue pour identifier les noms caractéristiques des pays arabes, certains noms inclus sont beaucoup plus courants dans les pays arabes mais apparaissent néanmoins dans d’autres populations ayant une forte proportion de musulmans. Ces noms permettraient d’identifier certaines personnes ayant d’autres ascendances.
Lorsque l’on interprète les résultats de cette étude, il est important de reconnaître que notre analyse ne comprend que les parents, dont l’âge va des grands adolescents aux adultes d’âge moyen, ce qui peut ne pas être représentatif de l’ensemble de la population arabo-américaine. L’utilisation de données sur les parents peut surreprésenter les Arabes américains de première génération, qui peuvent être plus ou moins susceptibles d’avoir des noms ethniquement distincts que la population générale. Une autre limite à prendre en compte est que la norme de mesure à laquelle l’ANA a été comparé est l’ascendance arabe auto-identifiée, plutôt que l’ethnicité. Comme le concept d’ascendance peut être interprété différemment de celui d’ethnicité, nos résultats peuvent ne pas être généralisés à la capacité de l’algorithme à déterminer l’ethnicité. Il n’y a pas eu, à notre connaissance, de validation de la question de l’ascendance arabe autodéclarée. Enfin, il est important de considérer l’objectif d’un algorithme de noms dans la recherche en santé sur les populations de minorités ethniques. L’utilisation la plus importante de l’ANA ne réside peut-être pas dans sa capacité à détecter la plus grande proportion d’Arabes américains, mais dans sa capacité à identifier un échantillon de cette population qui est très probablement arabo-américain et qui ne diffère pas systématiquement de la population arabo-américaine générale. Par exemple, Shin et Yu ont suggéré que, puisque 22% de la population coréenne partageait le nom de famille « Kim », les mesures effectuées parmi les seules personnes portant le nom de famille « Kim » étaient généralisables à la population coréenne-américaine (Shin et Yu 1984). Si l’ANA est capable de définir un échantillon représentatif d’Arabo-Américains, il pourrait être bien équipé pour être utilisé dans la recherche sur la santé malgré une sensibilité modérée. La VAN de l’ANA, qui s’est avérée être uniformément élevée, peut donc être plus importante que sa sensibilité pour l’utilisation dans l’évaluation des paramètres de santé parmi la population arabo-américaine.
L’ANA est un outil potentiel hautement spécifique, mais seulement modérément sensible pour les enquêteurs intéressés à identifier les Arabes-Américains aux fins de la recherche sur la santé. La performance de l’ANA dans l’identification de l’ascendance arabe dépend de la proportion d’Arabo-Américains dans la population étudiée ; l’ANA était le plus sensible dans les populations étudiées avec des proportions élevées d’Arabo-Américains, mais avait en fait une spécificité légèrement plus élevée dans les zones avec de plus faibles concentrations d’Arabo-Américains. En raison de sa spécificité élevée, l’ANA peut être utile comme moyen d’évaluer les métriques de santé parmi la population arabo-américaine ; cependant, des recherches sont nécessaires pour comparer les caractéristiques de santé réelles parmi les populations arabo-américaines définies par l’ascendance arabe et celles définies par l’ANA.
Messages clés
La difficulté d’identifier les Arabes-Américains à l’aide de statistiques vitales, de registres ou de données administratives est un obstacle à la recherche sur la santé concernant ce groupe. L’algorithme des noms arabes est un moyen très spécifique, mais seulement modérément sensible, de détecter l’ascendance arabe pour l’utiliser dans la recherche sur la santé concernant les Arabes-Américains. Plus la concentration d’Arabo-Américains dans une localité étudiée augmente, plus le taux de faux positifs ANA augmente et plus le taux de faux négatifs diminue. Les recherches futures devraient comparer les caractéristiques de santé parmi les populations arabo-américaines définies par l’ascendance arabe et celles définies par l’ANA.