PMC
Diskussion
Unter Verwendung von Geburtenregisterdaten aus dem Bundesstaat Michigan haben wir festgestellt, dass der ANA hochspezifisch, aber nur mäßig empfindlich ist, wenn es um die Feststellung der arabischen Abstammung geht, verglichen mit der selbst angegebenen Abstammung, die unseres Wissens nach nur im Bundesstaat Michigan in den Formularen für die Vitalstatistiken erfasst wird. Mit zunehmender Konzentration arabischer Amerikaner in einem Untersuchungsgebiet nahmen die Sensitivität und der PPV des ANA zu und die Spezifität und der NPV des Algorithmus ab. Der NPV war hoch: 93,5 % oder höher in allen Stratifikationen, unabhängig von der Prävalenz der arabischen Abstammung.
So weit wir wissen, ist dies der erste Versuch, einen Algorithmus für arabische Nachnamen zur Verwendung in der Gesundheitsforschung zu validieren. Es wurde eine Middle East Surname List (MESL) entwickelt und validiert, die Nachnamen aus arabischen Ländern sowie aus Ländern des Nahen Ostens enthält, in denen die arabische Ethnizität unüblich ist (Nasseri 2007). Die MESL wurde anhand von Namensdaten der Sozialversicherungsbehörde, des kalifornischen Krebsregisters und von Expertenmeinungen abgeleitet, wobei das Geburtsland als Standard für die Bestimmung des Nahost-Status herangezogen wurde. Es wurde berichtet, dass die MESL bei der Bestimmung der Geburt in einem Land des Nahen Ostens relativ genau ist (Nasseri 2007). Die Sensitivität des MESL bei der Bestimmung des Geburtsortes im Nahen Osten unter den Patienten des kalifornischen Krebsregisters betrug 88,62 %, die Spezifität 99,46 %, der PPV 68,54 % und der NPV 99,85 %. Die MESL-Methode unterscheidet sich von unserer ANA in drei wesentlichen Punkten. Erstens enthält die MESL Namen aus Ländern des „Nahen Ostens“, einschließlich Iran, Afghanistan, Pakistan und Armenien. Zweitens wurden bei der Zusammenstellung der endgültigen MESL mehrere Quellen verwendet. Drittens wurde die MESL anhand des Geburtslandes des Nahen Ostens als „Goldstandard“ getestet und nicht anhand der selbst angegebenen Abstammung, die systematisch die im Nahen Osten Geborenen ausschließt (Stronks et al. 2008).
Wir fanden wesentlich höhere falsch-positive und falsch-negative Raten im Zusammenhang mit dem ANA bei Männern im Vergleich zu Frauen. Mit Hilfe des ANA wurden mehr arabisch-amerikanische Männer als nicht-arabisch-amerikanisch identifiziert als arabisch-amerikanische Frauen, und mehr nicht-arabisch-amerikanische Männer als arabisch-amerikanisch identifiziert als nicht-arabisch-amerikanische Frauen. Unsere Ergebnisse spiegeln möglicherweise systematische Unterschiede in der Selbsteinschätzung der Vorfahren von Männern und Frauen wider.
Bei der Bewertung von Screening-Tests in klinischen Situationen erwartet man, dass die Sensitivität und Spezifität eines Tests in allen Populationen konstant sind und dass der PPV und NPV mit der Prävalenz der Erkrankung variieren, wobei der PPV in Gruppen mit höherer Prävalenz der Erkrankung höher ist. Während wir feststellten, dass der PPV in Schichten mit einem höheren Anteil an Arabisch-Amerikanern höher war, stellten wir fest, dass die Sensitivität des ANA in Gebieten mit einer höheren arabisch-amerikanischen Konzentration und bei Frauen viel höher war, wenn auch nicht so hoch wie bei anderen Nachname-Algorithmen (Nasseri 2007). Dies deutet auf Unterschiede in der arabisch-amerikanischen Bevölkerung zwischen Gebieten mit hoher und niedriger Dichte hin. Arabische Amerikaner, die in Gegenden mit hoher arabisch-amerikanischer Konzentration oder Enklaven leben, haben wahrscheinlich einen niedrigeren sozioökonomischen Status (SES) als arabische Amerikaner in Gegenden mit geringerer arabisch-amerikanischer Konzentration und sind auch eher Muslime (Logan et al. 2002, Abudabbeh 1996, Abu-Laban und Suleiman 1989, El-Badry 1994, Naff 1985, Naff 1985, Amer und Hovey 2007). Wir stellen die Hypothese auf, dass unser Ergebnis teilweise durch das Verhältnis von christlichen zu muslimischen Arabisch-Amerikanern in Gebieten mit hoher arabisch-amerikanischer Konzentration im Vergleich zu Gebieten mit niedriger arabisch-amerikanischer Konzentration erklärt werden kann. Da biblische Namen unter christlichen Arabern weit verbreitet sind, ist es weniger wahrscheinlich, dass sie Namen haben, die ethnisch charakteristisch sind und in die ANA aufgenommen wurden. Die falsch-negative Rate des ANA kann daher zum Teil darauf zurückzuführen sein, dass christliche arabische Amerikaner mit nicht ethnisch eindeutigen Namen nicht als arabische Amerikaner erkennbar sind. Eine weitere Möglichkeit besteht darin, dass es außerhalb der ethnischen Enklaven relativ viele Personen mit teilweiser und nicht vollständiger arabischer Abstammung gibt, die zwar die Frage nach der arabischen Abstammung bejahen, deren Abstammung sich aber auf die mütterliche Seite beschränkt und sich nicht in ihren Nachnamen widerspiegelt. Aus Gründen der Vertraulichkeit standen uns die tatsächlichen Nachnamen in den Geburtsregistereinträgen nicht zur Verfügung. Wir waren daher nicht in der Lage, unsere Hypothesen über christliche arabische Namen und partielle Abstammung zu testen.
Die Spezifität war in den Gebieten mit höherer arabisch-amerikanischer Konzentration geringer, was bedeutet, dass ein höherer Anteil von Nicht-Arab-Amerikanern fälschlicherweise als arabisch-amerikanisch identifiziert wurde. Da in den muslimischen Gemeinden in den USA multiethnische Gemeinden weit verbreitet sind (Haniff 2003) und die arabischen Amerikaner in den USA überproportional muslimisch sind (Arab American Institute Foundation 2008), könnte der Anteil der Muslime anderer Ethnien in Gebieten mit hoher arabisch-amerikanischer Dichte höher sein. Eine Ursache für die beobachteten falsch-positiven Ergebnisse könnte darin liegen, dass einige Namen im ANA zu Muslimen mit anderen Vorfahren gehören, z. B. südasiatischen oder afroamerikanischen Konvertiten zum Islam. Obwohl die Ableitung der ANA-Liste bei der Social Security Administration darauf abzielte, Namen zu identifizieren, die für arabische Länder charakteristisch sind, sind einige Namen enthalten, die in arabischen Ländern viel häufiger vorkommen, aber dennoch in anderen Bevölkerungsgruppen mit einem hohen Anteil an Muslimen auftauchen. Diese Namen würden einige Personen mit anderen Vorfahren identifizieren.
Bei der Interpretation der Ergebnisse dieser Studie ist es wichtig zu erkennen, dass unsere Analyse nur Eltern umfasst, deren Alter von älteren Jugendlichen bis zu Erwachsenen mittleren Alters reicht, was möglicherweise nicht repräsentativ für die gesamte arabisch-amerikanische Bevölkerung ist. Die Verwendung von Daten über die Eltern kann dazu führen, dass Arabisch-Amerikaner der ersten Generation überrepräsentiert sind, bei denen es wahrscheinlicher ist, dass sie ethnisch markante Namen haben als in der Allgemeinbevölkerung. Eine weitere Einschränkung ist darin zu sehen, dass der Messstandard, mit dem die ANA verglichen wurde, die selbst angegebene arabische Abstammung und nicht die ethnische Zugehörigkeit ist. Da das Konzept der Abstammung möglicherweise anders interpretiert wird als die ethnische Zugehörigkeit, lassen sich unsere Ergebnisse möglicherweise nicht auf die Fähigkeit des Algorithmus zur Bestimmung der ethnischen Zugehörigkeit verallgemeinern. Unseres Wissens wurde die Frage nach der selbst angegebenen arabischen Abstammung noch nicht validiert. Schließlich ist es wichtig, den Zweck eines Namensalgorithmus in der Gesundheitsforschung über ethnische Minderheiten zu berücksichtigen. Der wichtigste Nutzen des ANA liegt vielleicht nicht in seiner Fähigkeit, den größten Anteil der arabischen Amerikaner zu ermitteln, sondern in seiner Fähigkeit, eine Stichprobe dieser Bevölkerung zu identifizieren, die mit hoher Wahrscheinlichkeit arabisch-amerikanisch ist und sich nicht systematisch von der allgemeinen arabisch-amerikanischen Bevölkerung unterscheidet. Shin und Yu schlugen beispielsweise vor, dass aufgrund der Tatsache, dass 22 % der koreanischen Bevölkerung den Nachnamen „Kim“ trugen, die Messwerte nur derjenigen, die den Nachnamen Kim trugen, auf die koreanisch-amerikanische Bevölkerung verallgemeinert werden konnten (Shin und Yu 1984). Wenn der ANA in der Lage ist, eine repräsentative Stichprobe der arabischen Amerikaner zu definieren, könnte er trotz seiner nur mäßigen Sensitivität für die Gesundheitsforschung gut geeignet sein. Der Nettogegenwartswert des ANA, der sich als einheitlich hoch erwies, könnte daher wichtiger sein als seine Sensitivität für die Bewertung von Gesundheitsmetriken in der arabisch-amerikanischen Bevölkerung.
Der ANA ist ein hochspezifisches, aber nur mäßig empfindliches potenzielles Instrument für Forscher, die daran interessiert sind, Arabisch-Amerikaner für die Zwecke der Gesundheitsforschung zu identifizieren. Die Leistung des ANA bei der Identifizierung der arabischen Abstammung hängt vom Anteil der Arabisch-Amerikaner in der Studienpopulation ab; der ANA war am empfindlichsten in Studienpopulationen mit einem hohen Anteil an Arabisch-Amerikanern, wies aber in Gebieten mit einer geringeren Konzentration von Arabisch-Amerikanern eine etwas höhere Spezifität auf. Aufgrund seiner hohen Spezifität kann der ANA als Mittel zur Bewertung von Gesundheitsmerkmalen in der arabisch-amerikanischen Bevölkerung nützlich sein; es sind jedoch Forschungsarbeiten erforderlich, um die tatsächlichen Gesundheitsmerkmale in den arabisch-amerikanischen Populationen, die durch die arabische Abstammung definiert sind, mit denen zu vergleichen, die durch den ANA definiert sind.
Schlüsselbotschaften
Die Schwierigkeit, Arabisch-Amerikaner anhand von Vitalstatistiken, Registern oder Verwaltungsdaten zu identifizieren, stellt ein Hindernis für die Gesundheitsforschung über diese Gruppe dar. Der Algorithmus für arabische Namen ist ein hochspezifisches, aber nur mäßig empfindliches Mittel zur Ermittlung der arabischen Abstammung für die Gesundheitsforschung über Arabisch-Amerikaner. Mit zunehmender Konzentration arabischer Amerikaner in einem Untersuchungsgebiet steigt die ANA-Falsch-Positiv-Rate und sinkt die Falsch-Negativ-Rate. Zukünftige Forschungen sollten die Gesundheitsmerkmale zwischen den arabisch-amerikanischen Populationen, die durch die arabische Abstammung definiert sind, und denen, die durch den ANA definiert sind, vergleichen.