PMC
Dyskusja
Używając danych rejestru urodzeń ze stanu Michigan, stwierdziliśmy, że ANA jest wysoce specyficzne, ale tylko umiarkowanie czułe jako środek do wykrywania pochodzenia arabskiego w porównaniu z samodzielnie zgłoszonym pochodzeniem, które, zgodnie z naszą wiedzą, stan Michigan wyjątkowo zawiera w formularzach statystyk życiowych. Wraz ze wzrostem koncentracji Arabów-amerykanów w badanej miejscowości, czułość i PPV dla ANA wzrastały, a swoistość i NPV algorytmu malały. NPV była wysoka: 93,5% lub wyższa we wszystkich stratyfikacjach niezależnie od częstości występowania arabskiego rodowodu.
Według naszej najlepszej wiedzy jest to pierwsza próba walidacji algorytmu arabskiego nazwiska do użytku w badaniach zdrowotnych. A Middle East Surname List (MESL), który zawiera nazwiska z krajów arabskich, jak również krajów Bliskiego Wschodu, gdzie arabskie pochodzenie etniczne jest rzadkie, został opracowany i zatwierdzony (Nasseri 2007). MESL został opracowany na podstawie danych o nazwiskach pochodzących z Social Security Administration, California Cancer Registry oraz opinii ekspertów, z wykorzystaniem kraju urodzenia jako standardu dla określenia statusu Bliskiego Wschodu; stwierdzono, że jest on stosunkowo dokładny w określaniu urodzenia w kraju Bliskiego Wschodu (Nasseri 2007). Czułość MESL w określaniu miejsca urodzenia na Bliskim Wschodzie wśród pacjentów w California Cancer Registry wynosiła 88,62%; swoistość 99,46%; PPV 68,54%; a NPV 99,85%. Metodologia MESL różni się od naszej ANA na trzy zasadnicze sposoby. Po pierwsze, MESL obejmuje nazwiska z krajów „Bliskiego Wschodu”, w tym z Iranu, Afganistanu, Pakistanu i Armenii. Po drugie, do opracowania ostatecznej wersji MESL wykorzystano wiele źródeł. Po trzecie, MESL został przetestowany przy użyciu bliskowschodniego kraju urodzenia jako „złotego standardu”, a nie samodzielnie zgłoszonego pochodzenia, które systematycznie pomija rodowitych mieszkańców Bliskiego Wschodu (Stronks et al. 2008).
Znaleźliśmy znacznie wyższe fałszywie pozytywne i fałszywie negatywne wskaźniki związane z ANA wśród mężczyzn w porównaniu do kobiet. Używając ANA, więcej arabsko-amerykańskich mężczyzn prawdopodobnie zostanie zidentyfikowanych jako nie-arabskich, a następnie arabsko-amerykańskich kobiet, a więcej nie-arabskich mężczyzn prawdopodobnie zostanie zidentyfikowanych jako arabsko-amerykańskich, a następnie nie-arabskich kobiet. Nasze ustalenia mogą odzwierciedlać systematyczne różnice w samo-raportowaniu przodków między mężczyznami i kobietami.
W ocenie testów przesiewowych w sytuacjach klinicznych oczekuje się, że czułość i swoistość testu będą stałe we wszystkich populacjach, a PPV i NPV będą się różnić w zależności od częstości występowania stanu, z PPV wyższym w grupach o wyższej częstości występowania stanu. Podczas gdy PPV było wyższe w warstwach z wyższym odsetkiem Arab-Amerykanów, stwierdziliśmy, że czułość ANA była znacznie wyższa w obszarach o większej koncentracji Arab-Amerykanów i wśród kobiet, chociaż nie tak wysoka jak w przypadku innych algorytmów nazwisk (Nasseri 2007). Wskazuje to na różnice w populacji arabsko-amerykańskiej pomiędzy obszarami o wysokiej i niskiej gęstości zaludnienia. Arabowie-Amerykanie, którzy mieszkają w miejscowościach o wysokiej koncentracji Arabów-Amerykanów, lub enklawach, prawdopodobnie mają niższy status społeczno-ekonomiczny (SES) niż Arabowie-Amerykanie w miejscowościach o niższej koncentracji Arabów-Amerykanów, a także częściej są muzułmanami (Logan et al. 2002, Abudabbeh 1996, Abu-Laban i Suleiman 1989, El-Badry 1994, Naff 1985, Amer i Hovey 2007). Postawiliśmy hipotezę, że nasze odkrycie może być częściowo wyjaśnione przez stosunek chrześcijańskich Arab-Amerykanów do muzułmańskich Arab-Amerykanów w obszarach o wysokiej koncentracji Arab-Amerykanów w porównaniu do obszarów o niskiej koncentracji Arab-Amerykanów. Ponieważ imiona biblijne są powszechne wśród chrześcijańskich Arabów, są oni mniej skłonni do posiadania imion, które są etnicznie charakterystyczne i zawarte w ANA. Dlatego część przyczyn fałszywie ujemnego wyniku ANA może wynikać z tego, że chrześcijańscy Arabowie-Amerykanie o nieetnicznie charakterystycznych nazwiskach nie są rozpoznawalnie arabsko-amerykańscy po nazwisku. Inną możliwością jest to, że może być stosunkowo więcej osób z częściowym, a nie pełnym arabskim rodowodem poza etnicznymi enklawami i chociaż popierają pytanie o arabski rodowód, taki rodowód może być ograniczony do strony matczynej i nie odzwierciedlony w ich nazwiskach. Ze względu na poufność, rzeczywiste nazwiska w rejestrach urodzeń nie były dostępne do naszego użytku. Nie byliśmy zatem w stanie przetestować naszych hipotez dotyczących chrześcijańskich nazwisk arabskich i częściowego rodowodu.
Specyficzność była niższa w wyższych obszarach koncentracji arabsko-amerykańskiej, co oznacza, że wyższy odsetek nie-Arab-amerykanów został błędnie zidentyfikowany jako arabsko-amerykański. Ponieważ wieloetniczne kongregacje są powszechne wśród społeczności muzułmańskich w USA (Haniff 2003), a Arabowie-Amerykanie w USA są nieproporcjonalnie muzułmańscy (Arab American Institute Foundation 2008), może istnieć wyższy odsetek muzułmanów innych narodowości w kontekstach o wysokiej gęstości arabsko-amerykańskiej. Jednym ze źródeł zaobserwowanych fałszywych pozytywów może być fakt, że niektóre nazwiska w ANA należą do muzułmanów o innym pochodzeniu, takich jak południowoazjatyccy lub afroamerykańscy konwertyci na islam. Chociaż tworzenie listy ANA w Social Security Administration miało na celu zidentyfikowanie nazwisk, które były charakterystyczne dla krajów arabskich, niektóre nazwiska są zawarte, które są znacznie bardziej powszechne w krajach arabskich, ale mimo to pojawiają się w innych populacjach z wysokim odsetkiem muzułmanów. Te nazwy mogłyby zidentyfikować niektóre osoby z innymi rodowodami.
Przy interpretacji wyników tego badania ważne jest, aby uznać, że nasza analiza obejmuje tylko rodziców, którzy wahają się w wieku od starszych nastolatków do dorosłych w średnim wieku, co może nie być reprezentatywne dla całej populacji arabsko-amerykańskiej. Wykorzystanie danych o rodzicach może spowodować nadreprezentację pierwszego pokolenia Arab-Amerykanów, którzy mogą być bardziej lub mniej skłonni do posiadania etnicznie charakterystycznych imion niż ogół populacji. Innym ograniczeniem, które należy rozważyć, jest to, że standardem pomiaru, do którego porównywano ANA, jest samoidentyfikujący się arabski rodowód, a nie pochodzenie etniczne. Ponieważ pojęcie pochodzenia może być interpretowane inaczej niż pochodzenie etniczne, nasze wyniki mogą nie być uogólnione na zdolność algorytmu do określania pochodzenia etnicznego. Zgodnie z naszą wiedzą, nie przeprowadzono walidacji pytania o samozgłaszany arabski rodowód. Wreszcie, ważne jest, aby rozważyć cel algorytmu nazw w badaniach zdrowotnych dotyczących populacji mniejszości etnicznych. Najważniejszym zastosowaniem ANA może nie być jego zdolność do wykrycia największego odsetka Arabów-Amerykanów, ale jego zdolność do identyfikacji próbki tej populacji, która z dużym prawdopodobieństwem jest arabsko-amerykańska i która nie różni się systematycznie od ogólnej populacji arabsko-amerykańskiej. Na przykład, Shin i Yu zasugerowali, że ponieważ 22% populacji koreańskiej ma wspólne nazwisko „Kim”, metryka wśród tylko tych z nazwiskiem Kim była generalizowalna dla populacji koreańsko-amerykańskiej (Shin i Yu 1984). Jeśli ANA jest w stanie zdefiniować reprezentatywną próbę Arab-Amerykanów, może być dobrze przygotowany do wykorzystania w badaniach nad zdrowiem, pomimo jedynie umiarkowanej czułości. NPV ANA, która okazała się jednolicie wysoka, może być zatem ważniejsza niż jej czułość do wykorzystania w ocenie metryk zdrowotnych wśród populacji arabsko-amerykańskiej.
ANA jest wysoce specyficznym, ale tylko umiarkowanie czułym potencjalnym narzędziem dla badaczy zainteresowanych identyfikacją Arabów-Amerykanów dla celów badań zdrowotnych. Wydajność ANA w identyfikacji arabskiego rodowodu zależy od proporcji Arab-Amerykanów w badanej populacji; ANA było najbardziej czułe w badanych populacjach z wysokim odsetkiem Arab-Amerykanów, ale w rzeczywistości miało nieco wyższą specyficzność w obszarach o niższych koncentracjach Arab-Amerykanów. Ze względu na wysoką swoistość, ANA może być użyteczny jako środek oceny wskaźników zdrowotnych wśród populacji arabsko-amerykańskiej; jednakże, potrzebne są badania w celu porównania rzeczywistych cech zdrowotnych wśród populacji arabsko-amerykańskich określonych przez arabskie pochodzenie i tych określonych przez ANA.
Key Messages
Trudność w identyfikacji Arabów-amerykanów przy użyciu statystyk życiowych, rejestrów lub danych administracyjnych jest barierą dla badań zdrowotnych dotyczących tej grupy. Algorytm Imion Arabskich jest wysoce specyficznym, ale tylko umiarkowanie czułym sposobem wykrywania arabskiego rodowodu do wykorzystania w badaniach zdrowotnych nad Arabami-Amerykanami. Wraz ze wzrostem koncentracji Arabów-amerykanów w badanej miejscowości wzrastał odsetek wyników fałszywie dodatnich przy jednoczesnym spadku odsetka wyników fałszywie ujemnych. Przyszłe badania powinny porównać charakterystyki zdrowotne wśród populacji arabsko-amerykańskich zdefiniowanych na podstawie arabskiego rodowodu i tych zdefiniowanych na podstawie ANA.
.