Learn About Multinomial Logit in Stata With Data From the Behavioral Risk Factor Surveillance System (2013)

Mai 15, 2021
admin
2.2 Exploring the Stata Output

Die Ergebnisse des multinomialen logistischen Regressionsmodells sind in Abbildung 3 dargestellt.

Die Ausgabe des logistischen Regressionsmodells sieht wie folgt aus:

Zeile 1: dot mlogit active 1 female under 30 age 65 plus arthritis

Zeile 2: Iteration 0: log Likelihood ist gleich negativ 379353.27

Zeile 3: Iteration 1: log Likelihood ist gleich negativ 357272.01

Zeile 4: Iteration 2: log Likelihood ist gleich negativ 356455.81

Zeile 5: Iteration 3: log Likelihood ist gleich negativ 356439.91

Zeile 6: Iteration 4: log Likelihood ist gleich negativ 356439.9

Zeile 7: Multinomiale logistische Regression; Anzahl der Beobachtungen ist gleich 359.925

Zeile 8: LR chi2 (8) ist gleich 45826,74

Zeile 9: Wahrscheinlichkeit größer als chi2 gleich 0,0000

Zeile 10: Log Likelihood gleich negativ 356439,9; Pseudo R2 gleich 0,0604

Unter diesen Angaben erscheint eine Tabelle, in der verschiedene Werte für „aktiv 1“ wie folgt dargestellt sind:

Zeile 1: Kein Unterstrich oder Unterstrich unter Unterstrich mäßig, weiblich: Koeffizient, negativ 0,0137624; Standardfehler, 0,0081021; z, negativ 1,70; P größer als der absolute Wert von z, 0,089; 95 Prozent Konfidenzintervall, negativ 0,0296422, 0,0021173.

Zeile 2: Kein Unterstrich oder Unterstrich unter Unterstrich mäßig, unter 30: Koeffizient, negativ 0,2132395; Standardfehler, 0,0136507; z, negativ 15,62; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, 0,7998839, 0,8377535.

Reihe 3: Keine Unterstreichung oder Unterstreichung unter Unterstreichung mäßig, Alter 65 plus: Koeffizient, 0,8188187; Standardfehler, 0,0096608; z, 84,76; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, 0,7998839, 0,8377535.

Reihe 4: Kein Unterstrich oder Unterstrich unter Unterstrich mäßig, Arthritis: Koeffizient, 0,4168419; Standardfehler, 0,008863; z, 47,03; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, 0,3994706, 0,4342131.

Reihe 5: Kein Unterstrich oder Unterstrich unter Unterstrich mäßig, Unterstrich cons: Koeffizient, negativ 0,7812104; Standardfehler, 0,007175; z, negativ 108,88; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, negativ 0,7952731, 0,7671477.

Reihe 6: Mäßig, Basisergebnis

Reihe 7: Stark, weiblich: Koeffizient, negativ 0,0456556; Standardfehler, 0,0090931; z, negativ 5,02; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, negativ 0,0634778, 0,0278334.

Reihe 8: Stark, unter 30: Koeffizient, negativ 1,333241; Standardfehler, 0,0247722; z, negativ 53,82; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, negativ 1,381794, negativ 1,284689.

Reihe 9: Vigorous, Alter 65 plus: Koeffizient, 1,663682; Standardfehler, 0,0099416; z, 167,35; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, 1,644197, 1,683167.

Reihe 10: Starke Aktivität, Arthritis: Koeffizient, 0,0555993; Standardfehler, 0,0098662; z, 5,64; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, 0,036262, 0,0749366.

Reihe 11: Stark, Unterstreichung cons: Koeffizient, negativ 1,168047; Standardfehler, 0,0081195; z, negativ 143,86; P größer als der absolute Wert von z, 0,000; 95 Prozent Konfidenzintervall, negativ 1,183961, negativ 1,152133.

Abbildung 3: Multinomiale logistische Regression der Anstrengung der körperlichen Aktivität in den letzten 30 Tagen auf Geschlecht, Alter und ob der Befragte Arthritis hat oder nicht, BRFSS 2013.

Ein Screenshot zeigt die logistische Regression der Anstrengung der sportlichen Aktivität in den letzten 30 Tagen auf das Geschlecht, das Alter und die Frage, ob der Befragte an Arthritis leidet oder nicht.

Multinomiale logistische Regression schätzt Modelle für alle Kategorien der abhängigen Variable außer einer. Standardmäßig lässt Stata das häufigste Ergebnis aus und verwendet es als Basis für den Vergleich mit den anderen Kategorien.

Die Ergebnisse enthalten eine Vielzahl von Informationen. In diesem Beispiel konzentrieren wir uns auf die einzelnen Koeffizientenschätzungen, die die unabhängigen Variablen mit der abhängigen Variable verbinden, sowie auf das entsprechende statistische Signifikanzniveau. Wir können sehen, dass jede Koeffizientenschätzung statistisch signifikant von Null verschieden ist. Dies würde uns dazu veranlassen, die Nullhypothese, dass ein Koeffizient gleich Null ist, für alle Schätzungen abzulehnen.

Die Interpretation der Ergebnisse eines multinomialen Logit-Modells erfordert mehr als nur die Untersuchung der Richtung und des Niveaus der statistischen Signifikanz für die Koeffizientenschätzungen selbst.

Die gebräuchlichste Art, die Ergebnisse eines multinomialen Logit-Modells zu interpretieren, ist die Berechnung der vorhergesagten Wahrscheinlichkeiten auf der Grundlage der Ergebnisse der Analyse. Da die vorhergesagte Wahrscheinlichkeit, in eine der Kategorien der abhängigen Variablen zu fallen, eine nichtlineare Funktion der unabhängigen Variablen ist, erfordert die Berechnung der vorhergesagten Wahrscheinlichkeiten, dass jede unabhängige Variable auf einen bestimmten Wert gesetzt wird. Stellen Sie sich das so vor, dass Sie ein beschreibendes Profil für einen Fall im Datensatz erstellen und eine vorhergesagte Wahrscheinlichkeit dafür berechnen, dass jemand mit diesem Profil die drei verschiedenen hier beschriebenen Aktivitätsebenen einnimmt. Sie können bewerten, wie sich verschiedene unabhängige Variablen auf die Veränderungen der vorhergesagten Wahrscheinlichkeiten auswirken, indem Sie die Merkmale des Profils ändern und diese Wahrscheinlichkeiten neu berechnen.

Als Beispiel berechnen wir die vorhergesagten Wahrscheinlichkeiten, dass die Befragten mit und ohne Arthritis in jeden Grad der Anstrengung fallen. Dabei setzen wir den Wert der weiblichen Indikatorvariable auf ihren Mittelwert und die beiden Altersvariablen auf Null, so dass diese Profile Befragte im Alter von 30 bis 64 Jahren beschreiben.

Um die vorhergesagte Wahrscheinlichkeit für die Zugehörigkeit zu den einzelnen Aktivitätsniveaus für Personen mit Arthritis zu berechnen, geben Sie den folgenden Befehl in das Stata-Befehlsfenster ein:

margins, at(mean(female) under30=(0) age65plus=(0) arthritis=(1))

Drücken Sie die Eingabetaste, um die vorhergesagte Wahrscheinlichkeit für die Zugehörigkeit zu den einzelnen Aktivitätsniveaugruppen zu ermitteln.

Für Personen ohne Arthritis sieht der Code wie folgt aus:

Ränder, at(mean(female) under30=(0) age65plus=(0) arthritis=(0))

Drücken Sie die Eingabetaste, um die vorhergesagte Wahrscheinlichkeit für die Zugehörigkeit zu den einzelnen Aktivitätsgruppen zu ermitteln.

Um diese vorhergesagten Wahrscheinlichkeiten stattdessen mit Hilfe der Menüoptionen zu berechnen, wählen Sie nach der Ausführung des multinomialen logistischen Regressionsmodells die folgenden Optionen aus dem Menü in Stata aus:

Statistik → Postestimation

In dem sich öffnenden Dialogfeld „Postestimation Selector“, das in Abbildung 4 dargestellt ist, erweitern Sie „Marginal analysis“. Unter „Marginale Effekte aller Kovariaten“ markieren Sie „Benutzerdefinierte und hochdimensionale Analysen“, indem Sie darauf klicken.

Drücken Sie auf „Starten“, um das Dialogfeld „Ränder – Marginale Mittelwerte, prädiktive Ränder und marginale Effekte“ zu öffnen.

Das Dialogfeld mit dem Titel „Postestimation Selector“ besteht aus einer Liste von Befehlen unter dem Titel „Postestimation commands“. Die Elemente erscheinen wie folgt:

  • Marginale Analyse (erweiterte Ansicht)
    • Marginale Mittelwerte und marginale Effekte, Grundlegende Analysen
    • Mittelwerte und Interaktionsanalyse (zusammengeklappte Ansicht)
    • Kontraste der marginalen Mittelwerte (zusammengeklappte Ansicht)
    • Marginale Effekte einer Kovariate bei Werten einer anderen Kovariate (erweiterte Ansicht)
      • Populationsdurchschnitt (durchschnittliche Überschätzung der Stichprobe)
      • Bei Stichprobenmittelwerten
    • Marginale Effekte aller Kovariaten (erweiterte Ansicht)
      • Benutzerdefinierte und hochdimensionalen Analysen (hervorgehoben)
      • Profildiagramme nach marginaler Analyse
  • Tests, Kontraste und Vergleiche von Parameterschätzungen (kollabierte Ansicht)
  • Spezifikation, diagnost, und Anpassungsgüteanalysen (eingeklappte Ansicht)
  • Vorhersagen (eingeklappte Ansicht)
  • Sonstige Berichte (eingeklappte Ansicht)
  • Verwalten von Schätzergebnissen (eingeklappte Ansicht)

Eine Schaltfläche „Starten“ und eine Schaltfläche „Abbrechen“ erscheinen in der oberen rechten Ecke bzw. in der unteren rechten Ecke des Fensters.

Abbildung 4: Verwenden des Dialogfelds „Postestimation Selector“ aus dem Statistikmenü in Stata.

Ein Screenshot zeigt das Dialogfeld

Wählen Sie oben im Dialogfeld „Ränder – Randmittelwerte, prädiktive Ränder und marginale Effekte“ die Registerkarte „Bei“. Auf der Registerkarte „Bei“ sollte die Schaltfläche neben „Alle Kovariaten bei beobachteten Werten in der Stichprobe“ hervorgehoben sein.

Klicken Sie auf die Schaltfläche „Erstellen“ weiter unten, und ein neues Dialogfeld „Spezifikation 1“ wird geöffnet.

Im Abschnitt „Statistik“ oben im Dialogfeld „Spezifikation 1“ können Sie die relevanten Variablen auf ihren Mittelwert setzen, in diesem Fall weiblich. Kreuzen Sie „1“ an, indem Sie auf das Kästchen links daneben klicken, und das Textfeld „Statistik“ rechts daneben enthält einen Pfeil mit einem Dropdown-Menü. Wählen Sie „Mittelwerte“. Wählen Sie im Feld „Kovariaten“ mit Hilfe der Dropdown-Optionen „weiblich“ aus.

Im Abschnitt „Festwerte“ können Sie die Werte für die übrigen Variablen festlegen. Klicken Sie auf das Kästchen neben der Zahl 1. Wählen Sie unter30 aus der Liste der Variablen in den Dropdown-Optionen „Kovariate“. Geben Sie im Textfeld „Zahlenliste“ den Wert der Variable manuell auf „0“ ein. In Feld 2 setzen Sie age65plus auf „0“. Setzen Sie schließlich in Feld 3 den Wert von arthritis auf „1“.

Abbildung 5 zeigt, wie dies in Stata aussieht.

Das Dialogfeld mit dem Titel „Spezifikation 1“ kann in drei Abschnitte mit den Titeln „Statistik“, „Festwerte“ und „Ausdrücke“ unterteilt werden. Der obere Bereich „Statistik“ ist in zwei Felder unterteilt, links und rechts, die wie folgt aussehen.

Linke Tafel, Statistik:

  • (angekreuztes Kontrollkästchen) 1: Text „Mittelwerte“, (Dropdown-Schaltfläche)
  • (leeres Kontrollkästchen) 2: leere Textleiste, 50 (Dropdown-Schaltfläche), im Graustufenmodus
  • (leeres Kontrollkästchen) 3: leere Textleiste, 50 (Dropdown-Schaltfläche), im Graustufenmodus
  • (leeres Kontrollkästchen) 4: leere Textleiste, 50 (Dropdown-Schaltfläche), im Graustufenmodus

Rechtes Feld, Kovariaten:

  • Text „weiblich“, Dropdown-Schaltfläche
  • Leeres Textfeld, Dropdown-Schaltfläche
  • Leeres Textfeld, Dropdown-Schaltfläche
  • Leeres Textfeld, Dropdown-Schaltfläche

Ein Hinweis am unteren Rand lautet: „Kovariaten können auch Unterstrich alle (alle Kovariaten) Punkt Unterstrich Faktor (alle Faktor-Kovariaten) Punkt und Unterstrich kontinuierlich (alle kontinuierlichen Kovariaten) sein.“

Der mittlere Abschnitt mit der Überschrift „Feste Werte“ ist weiter in zwei Felder, links und rechts, unterteilt, die wie folgt aussehen:

Linkes Feld, Kovariate:

  • (angekreuztes Kästchen) 1: unter 30 (Dropdown-Button)
  • (angekreuztes Kästchen) 2: Alter 65 plus (Dropdown-Button)
  • (angekreuztes Kästchen) 3: Arthritis (Dropdown-Schaltfläche)
  • (leeres Kontrollkästchen) 4: leere Textleiste (Dropdown-Schaltfläche)

Rechtes Feld, Ziffernliste:

  • 0
  • 0
  • 1 (Textleiste ausgewählt)
  • Leere Textleiste

Der untere Abschnitt mit der Überschrift „Ausdrücke“ ist weiter in zwei Felder unterteilt, links und rechts, die wie folgt aussehen.

Linker Bereich, Kovariate:

  • (leeres Kontrollkästchen) 1: leere Textleiste (Dropdown-Button)
  • (leeres Kontrollkästchen) 2: leere Textleiste (Dropdown-Button)
  • (leeres Kontrollkästchen) 3: Leere Textleiste (Dropdown-Schaltfläche)
  • (leeres Ankreuzfeld) 4: Leere Textleiste (Dropdown-Schaltfläche)

Rechtes Feld, Ausdruck:

  • Leere Textleiste, mit Schaltfläche „Erstellen“ im Graustufenmodus
  • Leere Textleiste, mit Schaltfläche „Erstellen“ im Graustufenmodus
  • Leere Textleiste, mit Schaltfläche „Erstellen“ im Graustufenmodus
  • Leere Textleiste, mit der Schaltfläche „Erstellen“ im Graustufenmodus

Unten rechts im Dialogfeld erscheinen zwei Schaltflächen, „OK“ und „Abbrechen“, wobei die Schaltfläche „OK“ im ausgewählten Modus erscheint.

Abbildung 5: Auswählen von Werten für Kovariaten mithilfe des Dialogfelds „Spezifikation“ aus dem Dialogfeld „Ränder – Marginaler Mittelwert, prädiktive Ränder und marginale Effekte“ in Stata.

Ein Screenshot zeigt das Dialogfeld

Klicken Sie auf „OK“, um zum Dialogfeld „Ränder – Marginaler Mittelwert, prädiktive Ränder und marginale Effekte“ zurückzukehren. Im Feld „Bei Spezifikationen (Einstellungen von oben ändern)“ sollte nun „Spezifikation 1“ angezeigt werden, mit einer Beschreibung der Spezifikationsdetails darunter.

Klicken Sie erneut auf die Schaltfläche „Erstellen“ und ein weiteres Dialogfeld „Spezifikation 2“ wird geöffnet. Verwenden Sie die Optionen wie zuvor, wobei Sie diesmal den Wert von arthritis auf 0 setzen.

Klicken Sie erneut auf „OK“, um zum Dialogfeld „Ränder – Marginale Mittelwerte, prädiktive Ränder und marginale Effekte“ zurückzukehren. Jetzt werden „Spezifikation 1“ und „Spezifikation 2“ im Feld „Bei Spezifikationen (Einstellungen von oben ändern)“ angezeigt.

Abbildung 6 zeigt, wie dies in Stata aussieht.

Das Dialogfeld trägt den Titel „Ränder – Marginale Mittelwerte, prädiktive Ränder und marginale Effekte“. Unmittelbar unter der Titelleiste erscheint eine Reihe von 10 Registerkarten: „Main“, „At“, „if or in or over“, „Within“, „Contrast“, „Pairwise comparisons“, „Weights“, „SE“, „Advanced“ und „Reporting“, wobei „At“ der ausgewählte Modus ist. Der Inhalt des Dialogfelds sieht ferner wie folgt aus:

  • (Ausgewähltes Optionsfeld) Alle Kovariaten zu den beobachteten Werten in der Stichprobe
  • (Leeres Optionsfeld) Alle Kovariaten zu ihren Mittelwerten in der Stichprobe
  • (Leeres Optionsfeld) Für jede andere Faktorvariable, alle Stufen so behandeln, als ob sie gleich wahrscheinlich wären (überschreibt die beiden obigen Einstellungen für die Faktorvariablen)

Darüber hinaus wird ein Listenfeld mit dem Titel „Bei Spezifikationen (Einstellungen von oben ändern)“ angezeigt, das die beiden folgenden Punkte enthält:

  • Spezifikation 1
  • Spezifikation 2 (ausgewählt)

Auf der rechten Seite des Feldes befindet sich eine Reihe von vier Registerkarten: „Erstellen“, „Bearbeiten“, „Deaktivieren“ und „Aktivieren“, wobei „Erstellen“, „Bearbeiten“ und „Deaktivieren“ im aktiven Modus und „Aktivieren“ im Graustufenmodus sind. Ein Text am unteren Rand lautet: „bei linker Elternschaft linke Elternschaft mittlere rechte Elternschaft weiblich unter 30 gleich linke Elternschaft 0 rechte Elternschaft Alter 65 plus gleich linke Elternschaft 0 rechte Elternschaft Arthritis gleich linke Elternschaft 0 rechte Elternschaft rechte Elternschaft.“

Drei Schaltflächen, „OK“, „Abbrechen“ und „Absenden“, erscheinen in der rechten unteren Ecke des Dialogfelds, wobei die Schaltfläche „OK“ den ausgewählten Modus darstellt.

Abbildung 6: Das Dialogfeld „Ränder – Marginale Mittelwerte, prädiktive Ränder und marginale Effekte“ in Stata.

Ein Screenshot zeigt das Dialogfeld

Klicken Sie erneut auf „OK“, um die Ergebnisse zu erhalten, die in Abbildung 7 gezeigt werden.

Die Ergebnisse, die sich aus der vorhergesagten Wahrscheinlichkeit jeder Gruppe für die Anstrengung der körperlichen Aktivität in den letzten 30 Tagen für die Befragten ergeben, sehen wie folgt aus:

Linie 1: Bereinigte Vorhersagen; Anzahl der Beobachtungen gleich 359.925

Zeile 2: Modell VCE Doppelpunkt OIM

Zeile 3: 1 Punkt Unterstrich predict colon Pr left-parenthesis active 1 equals equals None underscore or underscore Below underscore moderate right-parenthesis, predict left-parenthesis pr outcome left-parenthesis 0 right-parenthesis right-parenthesis.

Line 4: 2 Punkt Unterstrich predict colon Pr left-parenthesis active 1 equals equals Moderate right-parenthesis, predict left-parenthesis pr outcome left-parenthesis 1 right-parenthesis right-parenthesis.

Zeile 5: 3 Punkt Unterstrich am Doppelpunkt Pr vorhersagen links-parenthesis aktiv 1 gleich gleich stark rechts-parenthesis, vorhersagen links-parenthesis pr Ergebnis links-parenthesis 2 rechts-parenthesis rechts-parenthesis.

Zeile 6: 1 Punkt Unterstrich am Doppelpunkt weiblich gleich 0.5679239 (Mittelwert)

Zeile 7: unter 30 gleich 0

Zeile 8: Alter 65 plus gleich 0

Zeile 9: Arthritis 1 gleich 1

Zeile 10: 2 Punkt Unterstrich am Doppelpunkt weiblich gleich 0.5679239 (Mittelwert)

Zeile 11: unter 30 gleich 0

Zeile 12: Alter 65 plus gleich 0

Zeile 13: aktiv 1 gleich 0

Eine weitere Tabelle zeigt die Werte von „Margin“, „Delta-Methode Standardfehler“, „z“, „Wahrscheinlichkeit größer als z“ und 95 Prozent Konfidenzintervall.“ Die verschiedenen Werte für die Vorhersagewahrscheinlichkeit jeder Gruppe von anstrengender körperlicher Aktivität in den letzten 30 Tagen für die Befragten sind wie folgt:

Zeile 1: Unterstrich vorhersagen 1 1: Marge, 0,3429731; Delta-Methode Standardfehler, 0,0016608; z, 206.51; Wahrscheinlichkeit größer als z, 0,000; 95 Prozent Konfidenzintervall, 0,339718, 0,3462283.

Reihe 2: Unterstrich vorhersagen 1 Unterstrich bei 2: Marge, 0,258514; Delta-Methode Standardfehler, 0,0010418; z, 248,14; Wahrscheinlichkeit größer als z, 0.000; 95 Prozent Konfidenzintervall, 0.256472, 0.2605559.

Reihe 3: Unterstrich prädiktiert 2 Unterstrich bei 1: Marge, 0.49762; Delta-Methode Standardfehler, 0.0017772; z, 280.00; Wahrscheinlichkeit größer als z, 0.000; 95 Prozent Konfidenzintervall, 0.4941367, 0.5011032.

Reihe 4: Unterstrich Vorhersage 2 Unterstrich bei 2: Marge, 0.5690545; Delta-Methode Standardfehler, 0.0011953; z, 476.06; Wahrscheinlichkeit größer als z, 0.000; 95 Prozent Konfidenzintervall, 0.5667117, 0.57133973.

Zeile 5: Unterstreichungen sagen 3 Unterstreichungen bei 1 voraus: Marge, 0,1594069; Delta-Methode Standardfehler, 0,00117; z, 136,25; Wahrscheinlichkeit größer als z, 0,000; 95 Prozent Konfidenzintervall, 0,1571138, 0,1617.

Zeile 6: Unterstrich sagt 3 Unterstriche bei 2 voraus: Marge, 0,1724315; Delta-Methode Standardfehler, 0,0008886; z, 194,05; Wahrscheinlichkeit größer als z, 0,000; 95 Prozent Konfidenzintervall, 0,17068991, 0,1741731.

Abbildung 7: Vorausgesagte Wahrscheinlichkeit, in den letzten 30 Tagen in jede Gruppe der Anstrengung der körperlichen Aktivität zu fallen, für Befragte mit und ohne Arthritis, im Alter von 30-64 Jahren, mit anderen Variablen, die ihre Mittelwerte beibehalten, BRFSS 2013.

Eine Tabelle zeigt die vorhergesagte Wahrscheinlichkeit, in den letzten 30 Tagen für Befragte mit und ohne Arthritis im Alter von 30-64 Jahren in jede Gruppe von anstrengender körperlicher Aktivität zu fallen.

Die linke Spalte in der Tabelle unten hat zwei Zahlenkolonnen unter den Worten „_predict#_at“. Die Zahlen 1-3 auf der linken Seite sind jeweils die Kategorien für verschiedene Anstrengungsgrade der Tätigkeit. Die Zahlen 1 und 2 auf der rechten Seite sind die beiden verschiedenen Profile, die wir erstellt haben, um festzustellen, ob ein Befragter an Arthritis leidet oder nicht. Einzelheiten zu diesen Profilen finden Sie in den Informationen über der Tabelle.

Die vorhergesagten Wahrscheinlichkeiten und ihre Konfidenzintervalle wurden mit Hilfe der Postestimationssimulation geschätzt. Eine vollständige Erörterung dieses Prozesses würde den Rahmen dieses Beispiels sprengen, aber kurz gesagt, berechnet der Prozess 1.000 Sätze vorhergesagter Wahrscheinlichkeiten durch Simulation von Werten für die Modellkoeffizienten auf der Grundlage ihrer geschätzten Werte, Varianzen und Kovarianzen. Weitere Informationen finden Sie in „Making the Most of Statistical Analyses: Improving Interpretation and Presentation“ von King, Tomz und Wittenberg (American Journal of Political Science, 44(2), 341-355).

Änderungen der vorhergesagten Wahrscheinlichkeiten bei einer unabhängigen Variable mit mehr als zwei Werten lassen sich am besten anhand einer Abbildung wie der in Abbildung 8 darstellen. Abbildung 8 zeigt die vorhergesagte Wahrscheinlichkeit, in eines der drei Aktivitätsniveaus zu fallen, für die Befragten in jeder der drei Altersgruppen, während die anderen beiden unabhängigen Variablen im Modell auf ihren jeweiligen Mittelwerten gehalten werden. Die Höhe der einzelnen Balken gibt die Größe der vorhergesagten Wahrscheinlichkeit an.

Das erste Balkendiagramm trägt die Überschrift „unter 30 gleich Nein, über 65 Jahre gleich Nein“. Die vertikale Achse bezeichnet die Wahrscheinlichkeit im Bereich von 0 bis 0,6 und die horizontale Achse die BMI-Kategorisierung im Bereich von 0 bis 2.

Die geschätzte vorhergesagte Wahrscheinlichkeit der Befragten bei verschiedenen BMI-Klassifizierungen ist wie folgt: (0, 0,28); (1, 0,55); (2, 0,18).

Das zweite Balkendiagramm trägt die Überschrift „unter 30 gleich Nein, Alter 65 plus gleich Ja“. Die geschätzte Vorhersagewahrscheinlichkeit der Befragten bei verschiedenen BMI-Klassifizierungen ist wie folgt: (0, 0,30); (1, 0,25); (2, 0,41).

Das dritte Balkendiagramm trägt die Überschrift „unter 30 ist gleich Ja, Alter 65 plus ist gleich Nein“. Die geschätzte Vorhersagewahrscheinlichkeit der Befragten bei verschiedenen BMI-Klassifizierungen ist wie folgt: (0, 0,28); (1, 0,66); (2, 0,05).

Abbildung 8: Vorhergesagte Wahrscheinlichkeit, dass die Befragten in jede der drei Kategorien der abhängigen Variable bei verschiedenen Werten des Alters fallen, während alle anderen unabhängigen Variablen im Modell bei ihren jeweiligen Mittelwerten bleiben, BRFSS 2013.

Ein Satz von drei Balkendiagrammen stellt die vorhergesagte Wahrscheinlichkeit dar, dass die Befragten in jede der drei Kategorien der abhängigen Variable über verschiedene Werte des Alters fallen.

Um dieses Diagramm zu erstellen, kehren Sie zum Dialogfeld „Postestimation Selector“ zurück, das noch geöffnet sein sollte. Vergewissern Sie sich, dass „Benutzerdefinierte und hochdimensionale Analysen“ immer noch hervorgehoben ist.

Drücken Sie auf „Starten“, um das Dialogfeld „Ränder – Randmittelwerte, prädiktive Ränder und marginale Effekte“ erneut zu öffnen.

Wählen Sie erneut die Registerkarte „Bei“ wie zuvor. Sie sehen die beiden vorherigen Angaben im Feld „Bei Angaben (Einstellungen von oben ändern)“. Markieren Sie sie nacheinander durch Anklicken und deaktivieren Sie sie über die Schaltfläche „Deaktivieren“ rechts daneben. Klicken Sie auf „Erstellen“, um ein neues Dialogfeld „Spezifikation“ zu öffnen.

Wie zuvor verwenden wir dieses, um die Werte der Variablen für das gewählte Profil einzugeben. Im Abschnitt „Statistik“ oben im Dialogfeld „Spezifikation 1“ können Sie die relevanten Variablen (in diesem Fall weiblich und Arthritis) auf ihre Mittelwerte setzen. Kreuzen Sie „1“ an, indem Sie auf das Kästchen links daneben klicken, und das Textfeld „Statistik“ rechts daneben enthält einen Pfeil mit einem Dropdown-Menü. Wählen Sie „Mittelwerte“. Wählen Sie im Feld „Kovariaten“ über die Dropdown-Optionen „weiblich“ aus. Machen Sie dasselbe für Arthritis in der Zeile darunter.

Wählen Sie anschließend im Abschnitt „Feste Werte“ wie zuvor die Werte für unter 30-Jährige und über 65-Jährige aus. Da wir die Veränderung der vorhergesagten Wahrscheinlichkeiten über drei Alterskategorien hinweg betrachten, müssen wir drei Spezifikationen für jede der Altersgruppen erstellen, wobei die Alter auf die folgenden Werte gesetzt werden:

  • Unter 30-unter30 1 age65plus 0
  • 30-64-unter30 0 age65plus 0
  • 65 und über-unter30 0 age65plus 1

Die erste dieser Spezifikationen ist in Abbildung 9 dargestellt.

Wenn alle drei neuen Spezifikationen im Dialogfeld „Ränder – Marginale Mittelwerte, prädiktive Ränder und marginale Effekte“ angezeigt werden, klicken Sie auf OK, um die vorhergesagten Wahrscheinlichkeiten zu erstellen.

Um den Befehl direkt in das Stata-Befehlsfenster einzugeben, lautet der Code wie folgt:

Margins, at((mean) female (mean) arthritis under30=(1) age65plus=(0)) at((mean) female (mean) arthritis under30=(0) age65plus=(0)) at((mean) female (mean) arthritis under30=(0) age65plus=(1))

Drücken Sie die Eingabetaste, um die vorhergesagten Wahrscheinlichkeiten für die ausgewählten Profile zu erstellen.

Das Dialogfeld „Spezifikation 3“ kann in drei Abschnitte unterteilt werden: „Statistik“, „Festwerte“ und „Ausdrücke“. Der obere Abschnitt mit dem Titel „Statistik“ ist in zwei Felder unterteilt, links und rechts, die wie folgt aussehen:

Linkes Feld, Statistik:

  • (angekreuztes Kontrollkästchen) 1: Text „Mittelwerte“, (Dropdown-Schaltfläche)
  • (angekreuztes Kontrollkästchen) 2: Text „Mittelwerte“, (Dropdown-Schaltfläche)
  • (leeres Kontrollkästchen) 3: leere Textleiste, 50 (Dropdown-Schaltfläche), im Graustufenmodus
  • (leeres Kontrollkästchen) 4: leere Textleiste, 50 (Dropdown-Schaltfläche), im Graustufenmodus

Rechtes Feld, Kovariaten:

  • Text „weiblich“, Dropdown-Schaltfläche
  • Text „Arthritis“, Dropdown-Schaltfläche
  • Leeres Textfeld, Dropdown-Schaltfläche
  • Leeres Textfeld, Dropdown-Schaltfläche

Ein Hinweis am unteren Rand lautet: „Kovariaten können auch Unterstrich alle (alle Kovariaten) Punkt Unterstrich Faktor (alle Faktor-Kovariaten) Punkt und Unterstrich kontinuierlich (alle kontinuierlichen Kovariaten) sein.“

Der mittlere Abschnitt mit der Überschrift „Feste Werte“ ist weiter in zwei Felder unterteilt, links und rechts, die wie folgt aussehen:

Linkes Feld, Kovariate:

  • (angekreuzte Checkbox) 1: unter 30 Jahre (Drop-Down-Button)
  • (angekreuztes Kästchen) 2: Alter 65 plus (Drop-Down-Button)
  • (leeres Kästchen) 3: leere Textleiste (Drop-Down-Button)
  • (leeres Kästchen) 4: Leere Textleiste (Dropdown-Schaltfläche)

Rechtes Feld, Ziffernliste:

  • 1
  • 0 (Textleiste ausgewählt)
  • Leere Textleiste
  • Leere Textleiste

Der untere Bereich mit der Überschrift „Ausdrücke“ ist weiter in zwei Bereiche unterteilt, links und rechts, die wie folgt aussehen:

Linker Bereich, Kovariate:

  • (leeres Kontrollkästchen) 1: leere Textleiste (Dropdown-Schaltfläche)
  • (leeres Kontrollkästchen) 2: leere Textleiste (Dropdown-Schaltfläche)
  • (leeres Kontrollkästchen) 3: leere Textleiste (Dropdown-Schaltfläche)
  • (leeres Kontrollkästchen) 4: leere Textleiste (Dropdown-Schaltfläche)

Rechter Bereich, Ausdruck:

  • Leere Textleiste, mit Schaltfläche „Erstellen“ im Graustufenmodus
  • Leere Textleiste, mit Schaltfläche „Erstellen“ im Graustufenmodus
  • Leere Textleiste, mit Schaltfläche „Erstellen“ im Graustufenmodus
  • Leere Textleiste, mit der Schaltfläche „Erstellen“ im Graustufenmodus

Unten rechts im Dialogfeld erscheinen zwei Schaltflächen, „OK“ und „Abbrechen“, wobei die Schaltfläche „OK“ im ausgewählten Modus erscheint.

Abbildung 9: Auswählen von Werten für jede der Altersgruppen, wobei andere Variablen auf ihren Mittelwerten gehalten werden, unter Verwendung des Dialogfelds „Ränder – Marginaler Mittelwert, prädiktive Ränder und marginale Effekte“ in Stata.

Ein Screenshot zeigt das Dialogfeld

Um die Ergebnisse darzustellen, kehren Sie zum Dialogfeld „Postestimation Selector“ zurück. Wählen Sie „Profildiagramme nach Randanalyse“, wie in Abbildung 10 gezeigt.

Das Dialogfeld „Postestimation Selector“ besteht aus einer Liste von Befehlen unter dem Titel „Postestimation commands“. Die Elemente erscheinen wie folgt:

  • Marginale Analyse (erweiterte Ansicht)
    • Marginale Mittelwerte und marginale Effekte, Grundlegende Analysen
    • Mittelwerte und Interaktionsanalyse (zusammengeklappte Ansicht)
    • Kontraste der marginalen Mittelwerte (zusammengeklappte Ansicht)
    • Marginale Effekte einer Kovariate bei Werten einer anderen Kovariate (erweiterte Ansicht)
      • Populationsdurchschnitt (durchschnittliche Überschätzung der Stichprobe)
      • Bei Stichprobenmittelwerten
    • Marginale Effekte aller Kovariaten (erweiterte Ansicht)
      • Benutzerdefinierte und hochdimensionalen Analysen
      • Profilplots nach marginaler Analyse (hervorgehoben)
  • Tests, Kontraste und Vergleiche von Parameterschätzungen (eingeklappte Ansicht)
  • Spezifikation, Diagnose, und Anpassungsgüteanalysen (eingeklappte Ansicht)
  • Vorhersagen (eingeklappte Ansicht)
  • Sonstige Berichte (eingeklappte Ansicht)
  • Verwalten von Schätzergebnissen (eingeklappte Ansicht)

Eine Schaltfläche „Starten“ und eine Schaltfläche „Abbrechen“ erscheinen in der oberen rechten Ecke bzw. in der unteren rechten Ecke des Fensters.

Abbildung 10: Erstellen eines Ergebnisdiagramms mit dem Dialogfeld „Postestimation Selector“ in Stata.

Ein Screenshot zeigt das Dialogfeld

Drücken Sie auf „Starten“, um das Dialogfeld „marginsplot – Graph results from margins“ zu öffnen. Wählen Sie auf der Registerkarte „Main“ im dritten Textfeld mit der Bezeichnung „Create subgraphs for groups defined by variables:“ die beiden Altersvariablen aus den Dropdown-Optionen aus, wie in Abbildung 11 dargestellt.

Klicken Sie auf die Schaltfläche „Options“ neben dem Textfeld. Dadurch wird ein neues Dialogfeld „Nach Dimensionsbezeichnung“ geöffnet. Aktivieren Sie die Option „Variablennamen und Gleichheitszeichen in alle Beschriftungen einschließen“, wie in Abbildung 12 dargestellt.

Das Dialogfeld trägt den Titel „marginsplot – Diagrammergebnisse aus Rändern“. Unmittelbar unter der Titelleiste erscheint eine Menüleiste mit 12 Registerkarten: „Main“, „Labels“, „Plot“, „CI plot“, „Pairwise“, „Add plots“, „Y axis“, „X axis“, „Titles“, „Legend“, „Overall“ und „By options“, wobei die Registerkarte „Main“ ausgewählt ist.

Der weitere Inhalt des Dialogfelds wird unter dem Titel „Dimensionen“ wie folgt angezeigt:

  • Variable(n), die die X-Achse definieren, mit einer leeren Textleiste und einem Dropdown-Menü und einer Schaltfläche „Optionen“ daneben.
  • Erstellen von Diagrammen für durch Variablen definierte Gruppen, mit einer leeren Textleiste und einem Dropdown-Menü und einer Schaltfläche „Optionen“ daneben.
  • Erstellen Sie Teilgrafiken für Gruppen, die durch Variablen definiert sind, mit einer Textleiste im ausgewählten Modus, die lautet: „bei (unter 30) bei (Alter 65 plus)“. Die Textleiste hat auch ein Dropdown-Menü und eine Schaltfläche „Optionen“ daneben.
  • Erstelle Diagramme für Gruppen, die durch Variablen definiert sind, mit einer leeren Textleiste und einem Dropdown-Menü und einer Schaltfläche „Optionen“ daneben.

Eine Checkliste darunter erscheint wie folgt:

  • (leeres Kontrollkästchen) x- und y-Achse vertauschen (horizontales Diagramm)
  • (leeres Kontrollkästchen) keine Konfidenzintervalle einzeichnen
  • (leeres Kontrollkästchen) Name des Diagramms oder Stub, wenn mehrere Diagramme, mit einer leeren Textleiste darunter
  • (leeres Kontrollkästchen) Diagramm ersetzen, wenn es bereits im Speicher vorhanden ist, im Graustufenmodus

Drei Schaltflächen, „OK“, „Abbrechen“ und „Absenden“, erscheinen in der unteren rechten Ecke des Dialogfelds, wobei die Schaltfläche „OK“ im ausgewählten Modus erscheint.

Abbildung 11: Verwenden des Dialogfelds marginsplot zum Darstellen der vorhergesagten Wahrscheinlichkeiten in Stata.

Ein Screenshot zeigt das Dialogfeld marginsplot zum Darstellen der vorhergesagten Wahrscheinlichkeiten in Stata.

Das Dialogfeld trägt den Titel „Nach Dimensionsbezeichnung“. Der weitere Inhalt des Dialogfelds sieht wie folgt aus:

Zeile 1: Hinweis: Diese Einstellungen haben Vorrang vor den Standardeinstellungen und den Einstellungen auf der Registerkarte „Etikett“

Zeile 2: Liste der Anführungszeichen zur Beschriftung jeder Ebene der Dimension

Zeile 3: (leere Textleiste im ausgewählten Modus)

Zeile 4: Liste der aufgezählten Beschriftungen, Beispiel 1 „eins“ 2 „zwei“ Ellipsen

Zeile 5: (leere Textleiste) Gruppen mit ihren Werten beschriften, nicht mit ihren Bezeichnungen

Zeile 6: (leeres Kontrollkästchen) Verzichte auf Variablennamen und Gleichheitszeichen in allen Beschriftungen, im Graustufenmodus

Zeile 7: (leeres Kontrollkästchen) Variablenname und Gleichheitszeichen in alle Beschriftungen einbeziehen

Zeile 8: (leeres Kontrollkästchen) Trennzeichen für Beschriftungen, wenn mehrere Variablen angegeben sind

Zeile 9: (leere Textleiste) im Graustufenmodus

Zeile 10: (leeres Kontrollkästchen) Kein Trennzeichen zwischen den Beschriftungen verwenden

Drei Schaltflächen, „OK“, „Abbrechen“ und „Absenden“, erscheinen in der rechten unteren Ecke des Dialogfelds, wobei die Schaltfläche „OK“ im ausgewählten Modus erscheint.

Abbildung 12: Auswahl von Beschriftungsoptionen mit dem Dialogfeld „marginsplot“ in Stata.

Ein Screenshot zeigt das Dialogfeld

Wählen Sie auf der Registerkarte „Plot“, die in Abbildung 13 dargestellt ist, aus den Dropdown-Optionen für den „Plot-Typ“ oben die Option „Balken“ aus.

Das Dialogfeld trägt den Titel „marginsplot – Graph results from margins.“ Unmittelbar unter der Titelleiste erscheint eine Menüleiste mit 12 Registerkarten: „Haupt“, „Beschriftungen“, „Plot“, „CI-Plot“, „Paarweise“, „Plots hinzufügen“, „Y-Achse“, „X-Achse“, „Titel“, „Legende“, „Insgesamt“ und „Nach Optionen“, wobei die Registerkarte „Plot“ ausgewählt ist.

Unter der Menüleiste erscheint ein Dropdown-Menü mit dem Titel „Plot-Typ“, wobei „Balken“ aus dem Menü ausgewählt ist. Außerdem wird ein Listenfeld mit der Überschrift „Plot auswählen“ angezeigt, in dem die folgenden Elemente aufgelistet sind:

  • Alle Plots (ausgewählt)
  • Plot 1
  • Plot 2
  • Plot 3
  • Plot 4
  • Plot 5
  • Plot 6
  • Plot 7
  • Plot 8

Neben dem Listenfeld erscheint eine Registerkarte „Balken-Eigenschaften“. Ein Text am unteren Rand lautet: „Die hier gezeigten Darstellungen spiegeln nicht unbedingt die Anzahl der tatsächlichen Darstellungen für das Diagramm wider.“

Drei Schaltflächen, „OK“, „Abbrechen“ und „Absenden“, erscheinen in der rechten unteren Ecke des Dialogfelds, wobei die Schaltfläche „OK“ den ausgewählten Modus darstellt.

Abbildung 13: Auswählen eines Balkendiagramms mit dem Dialogfeld „marginsplot“ in Stata.

Ein Screenshot zeigt das Dialogfeld

Stata bietet weitere Optionen, um das Diagramm ansehnlicher zu gestalten. In diesem Fall werden wir nur eine weitere Option auswählen. Wählen Sie die Registerkarte „X-Achse“ und schreiben Sie in das Textfeld „Titel“ „Aktivitätsniveau“, um die X-Achse wie in Abbildung 14 gezeigt zu beschriften.

Klicken Sie auf OK, um das Diagramm der vorhergesagten Wahrscheinlichkeiten, in jeder Aktivitätsniveaukategorie zu sein, für den Bereich der ausgewählten Werte zu erstellen, wie in Abbildung 8 gezeigt.

Um den Befehl direkt in das Stata-Befehlsfenster einzugeben, lautet der Code wie folgt:

marginsplot, bydimension(at(under30) at(age65plus), nosimplelabels) recast(bar) recastci(rbar) xtitle(BMI category)

Drücken Sie Enter, um das Balkendiagramm zu erzeugen.

Das Dialogfeld trägt den Titel „marginsplot – Graph results from margins“. Unmittelbar unter der Titelleiste erscheint eine Menüleiste mit 12 Registerkarten: „Haupt“, „Beschriftungen“, „Plot“, „CI-Plot“, „Paarweise“, „Plots hinzufügen“, „Y-Achse“, „X-Achse“, „Titel“, „Legende“, „Insgesamt“ und „Nach Optionen“, wobei die Registerkarte „X-Achse“ im ausgewählten Modus ist.

Eine Textleiste unter dem Namen „Titel“ zeigt den Eintrag „Aktivitätsniveau“, daneben erscheint eine Registerkarte „Eigenschaften“. Unter der Textleiste erscheinen fünf weitere Registerkarten mit den Bezeichnungen „Eigenschaften des Hauptzeichens/der Beschriftung“, „Eigenschaften des Nebenzeichens/der Beschriftung“, „Eigenschaften der Achsenskala“ und „Bezugslinien“. Es folgen zwei Optionen mit Kontrollkästchen wie folgt:

  • (leeres Kontrollkästchen) Achse ausblenden
  • (leeres Kontrollkästchen) Achse auf der gegenüberliegenden Seite des Diagramms platzieren

Drei Schaltflächen, „OK“, „Abbrechen“ und „Absenden“, erscheinen in der unteren rechten Ecke des Dialogfelds, wobei die Schaltfläche „OK“ den ausgewählten Modus darstellt.

Abbildung 14: Beschriftung der X-Achse mit dem Dialogfeld „marginsplot“ in Stata.

Ein Screenshot zeigt das Dialogfeld

Eine vollständige Interpretation der Ergebnisse eines multinomialen Logit-Modells würde ähnliche Tabellen oder Abbildungen für jede unabhängige Variable im Modell darstellen.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.