Lær om multinomial logit i Stata med data fra Behavioral Risk Factor Surveillance System (2013)

maj 15, 2021
admin
2.2 Udforskning af Stata-output

Resultaterne fra den multinomiale logistiske regressionsmodel er vist i figur 3.

Outputtet fra den logistiske regressionsmodel ser ud som følger:

Linje 1: dot mlogit active 1 female under 30 age 65 plus arthritis

Linje 2: Iteration 0: log sandsynlighed er lig med negativ 379353,27

Linje 3: Log sandsynlighed er lig med negativ 379353,27

Linje 3: Iteration 1: log sandsynlighed er lig med negativ 357272,01

Linje 4: Iteration 1: log sandsynlighed er lig med negativ 357272,01

Linje 4: Iteration 2: log sandsynlighed er lig med negativ 356455,81

Linje 5: Iteration 2: log sandsynlighed er lig med negativ 356455,81

Linje 5: Iteration 3: log sandsynlighed er lig med negativ 356439.91

Linje 6: Iteration 3: log sandsynlighed er lig med negativ 356439.91

Linje 6: Iteration 4: log sandsynlighed er lig med negativ 356439.9

Linje 7: Iteration 4: log sandsynlighed er lig med negativ 356439.9

Linje 7: Multinomial logistisk regression; antal observationer er lig med 359.925

Linje 8: LR chi2 (8) er lig med 45826,74

Linje 9: LR chi2 (8) er lig med 45826,74

Linje 9: Sandsynlighed større end chi2 er lig med 0,0000

Linje 10: Log likelihood er lig med negativ 356439,9; Pseudo R2 er lig med 0,0604

Under disse oplysninger vises en tabel, hvor forskellige værdier for “aktiv 1” præsenteres som følger:

Række 1: Ingen understregning eller understregning under understregning understregning moderat, kvinde: Koefficient, negativ 0,0137624; standardfejl, 0,0081021; z, negativ 1,70; P større end den absolutte værdi af z, 0,089; 95 procent konfidensinterval, negativ 0,0296422, 0,0021173.

Række 2: Ingen underscore eller underscore under underscore moderat, under 30 år: Ingen underscore eller underscore under underscore moderat, under 30 år: Koefficient, negativ 0.2132395; standardfejl, 0.0136507; z, negativ 15.62; P større end den absolutte værdi af z, 0.000; 95 procent konfidensinterval, 0.7998839, 0.8377535.

Række 3: Ingen underscore eller underscore under underscore moderat, alder 65 plus: Ingen underscore eller underscore under underscore moderat, alder 65 plus: Koefficient, 0.8188187; standardfejl, 0.0096608; z, 84.76; P større end den absolutte værdi af z, 0.000; 95 procent konfidensinterval, 0.7998839, 0.8377535.

Række 4: Ingen understregning eller understregning under understregning understregning moderat, arthritis: Koefficient, 0.4168419; standardfejl, 0.008863; z, 47.03; P større end den absolutte værdi af z, 0.000; 95 procent konfidensinterval, 0.3994706, 0.4342131.

Række 5: Ingen understregning eller understregning under understregning under understregning moderat, understregning cons: Koefficient, negativ 0.7812104; standardfejl, 0.007175; z, negativ 108.88; P større end den absolutte værdi af z, 0.000; 95 procent konfidensinterval, negativ 0.7952731, 0.7671477.

Række 6: Moderat, basisresultat

Række 7: Kraftig, kvinde: Koefficient, negativ 0,0456556; standardfejl, 0,0090931; z, negativ 5,02; P større end den absolutte værdi af z, 0,000; 95 procent konfidensinterval, negativ 0,0634778, 0,0278334.

Række 8: Kraftig, under 30 år: Koefficient, negativ 1,333241; standardfejl, 0,0247722; z, negativ 53,82; P større end den absolutte værdi af z, 0,000; 95 procent konfidensinterval, negativ 1,381794, negativ 1,284689.

Række 9: Kraftig, alder 65 plus: Koefficient, 1,663682; standardfejl, 0,0099416; z, 167,35; P større end den absolutte værdi af z, 0,000; 95 procent konfidensinterval, 1,644197, 1,683167.

Række 10: Kraftig, arthritis: Kraftig, arthritis: Koefficient, 0.0555993; standardfejl, 0.0098662; z, 5.64; P større end den absolutte værdi af z, 0.000; 95 procent konfidensinterval, 0.036262, 0.0749366.

Række 11: Vigorous, underscore cons: Koefficient, negativ 1,168047; standardfejl, 0,0081195; z, negativ 143,86; P større end den absolutte værdi af z, 0,000; 95 procent konfidensinterval, negativ 1,183961, negativ 1,152133.

Figur 3: Multinomial logistisk regression af træningsaktivitetens anstrengelse i løbet af de sidste 30 dage på køn, alder og om respondenten har gigt eller ej, 2013 BRFSS.

Et skærmbillede viser den logistiske regression af træningsaktivitetens anstrengelse i løbet af de sidste 30 dage på køn, alder og om respondenten har gigt eller ej.

Multinomial logistisk regression estimerer modeller for alle kategorier af den afhængige variabel undtagen en. Som standard udelader Stata det hyppigste resultat og bruger det som udgangspunkt for at sammenligne de andre kategorier.

Der er mange oplysninger i resultaterne. I dette eksempel fokuserer vi vores opmærksomhed på de individuelle koefficientestimater, der forbinder de uafhængige variabler med den afhængige variabel, og deres tilsvarende niveau af statistisk signifikans. Vi kan se, at hvert koefficientestimat er statistisk signifikant forskelligt fra nul. Dette ville få os til at forkaste nulhypotesen om, at en koefficient er lig nul for alle estimaterne.

Intolkning af resultaterne fra en multinomial logitmodel kræver mere end blot at undersøge retningen og niveauet af statistisk signifikans for selve koefficientestimaterne.

Den mest almindelige måde at fortolke resultaterne af en multinomial logitmodel på er at beregne forudsagte sandsynligheder på baggrund af analysens resultater. Fordi den forudsagte sandsynlighed for at falde i en af kategorierne for den afhængige variabel er en ikke-lineær funktion af de uafhængige variabler, kræver beregning af forudsagte sandsynligheder, at hver uafhængig variabel sættes til en vis værdi. Tænk på det som at oprette en beskrivende profil for et tilfælde i datasættet og beregne en forudsagt sandsynlighed for, at en person med denne profil deltager i de tre forskellige aktivitetsniveauer, der er beskrevet her. Du kan evaluere, hvordan forskellige uafhængige variabler påvirker ændringerne i de forudsagte sandsynligheder ved at ændre profilens egenskaber og beregne disse sandsynligheder igen.

Som eksempel vil vi beregne de forudsagte sandsynligheder for at falde ind under hvert aktivitetsniveau for respondenter med og uden gigt. For hver af dem sætter vi værdien af den kvindelige indikatorvariabel til dens gennemsnit og de to aldersvariabler til nul, hvilket betyder, at disse profiler beskriver respondenter i alderen 30 til 64 år.

For at beregne den forudsagte sandsynlighed for at være på hvert aktivitetsniveau for dem med gigt indtastes følgende kommando i Stata-kommandovinduet:

margins, at(mean(female) under30=(0) age65plus=(0) arthritis=(1))

Tryk på Enter for at producere den forudsagte sandsynlighed for at være på hvert aktivitetsniveau i hver gruppe.

For personer uden gigt er koden som følger:

margins, at(mean(female) under30=(0) age65plus=(0) arthritis=(0))

Tryk på Enter for at producere den forudsagte sandsynlighed for at være i hver aktivitetsniveaugruppe.

For at beregne disse forudsagte sandsynligheder ved hjælp af menupunkterne i stedet skal du, efter at have kørt den multinomiale logistiske regressionsmodel, vælge følgende muligheder i menuen i Stata:

Statistik → Postestimation

I dialogboksen “Postestimation Selector”, der åbnes, vist i figur 4, skal du udvide “Marginal analysis”. Under “Marginale virkninger af alle kovariater” skal du fremhæve “Brugerdefinerede og højdimensionelle analyser” ved at klikke på den.

Tryk på Start for at åbne dialogboksen “Marginaler – Marginale middelværdier, prædiktive marginer og marginale virkninger”.

Dialogboksen med titlen “Postestimation Selector” består af en liste over kommandoer under titlen “Postestimation commands”. Elementerne vises som følger:

  • Marginalanalyse (udvidet visning)
    • Marginalmidler og marginale effekter, grundlæggende analyser
    • Marginale middelværdier og interaktionsanalyse (sammenklappet visning)
    • Kontraster af marginale middelværdier (sammenklappet visning)
    • Marginale virkninger af en kovariat ved værdier af en anden kovariat (udvidet visning)
      • Gennemsnit af population (gennemsnitlig overestimationsprøve)
      • Ved stikprøvens gennemsnit
      • Marginale virkninger af alle kovariater (udvidet visning)
      • Brugerdefineret og højdimensionelle analyser (fremhævet)
      • Profilplots efter marginalanalyse
      • Tests, kontraster og sammenligninger af parameterestimater (sammenklappet visning)
      • Specifikation, diagnostisk, og goodness-of-fit-analyse (sammenklappet visning)
      • Forudsigelser (sammenklappet visning)
      • Andre rapporter (sammenklappet visning)
      • Håndtering af estimationsresultater (sammenklappet visning)
      • Der vises en “Start”-knap og en “Annuller”-knap i henholdsvis øverste højre hjørne og nederste højre hjørne af vinduet.

Figur 4: Brug af dialogboksen Postestimation Selector fra menuen Statistics i Stata.

Et skærmbillede viser dialogboksen Postestimation Selector til at starte en kommando.

Overst i dialogboksen “Marginaler – Marginale middelværdier, prædiktive marginalværdier og marginale effekter” skal du vælge fanen “At”. På fanen “At” skal knappen ved siden af “All covariates at observed values in the sample” være fremhævet.

Klik på knappen “Create” længere nede, og en ny dialogboks “Specification 1” åbnes.

Den “Statistics”-sektion øverst i dialogboksen “Specification 1” kan bruges til at indstille de relevante variabler til deres middelværdi, i dette tilfælde kvindelig. Sæt kryds ved “1” ved at klikke på feltet til venstre for det, og tekstboksen Statistic til højre vil give en pil med en drop-down-menu. Vælg “Middelværdier”. I feltet “Covariates” skal du bruge rullemenuen til at vælge female.

I afsnittet “Fixed values” kan du indstille værdierne for de resterende variabler. Klik på afkrydsningsfeltet ud for tallet 1. Vælg under30 fra listen over variabler i rullemenuen “Covariate”. I tekstboksen “Numlist” skal du manuelt indtaste værdien af variablen til “0” i tekstboksen “Numlist”. I rubrik 2 sættes alder65plus til “0”. Endelig i boks 3 indstiller du værdien af arthritis til “1.”

Figur 5 viser, hvordan dette ser ud i Stata.

Dialogboksen med titlen “Specification 1” kan opdeles i tre afsnit med titlerne “Statistics”, “Fixed values” og “Expressions”. Den øverste sektion med titlen “Statistics” er yderligere opdelt i to paneler, venstre og højre, som vises som følger.

Venstre panel, Statistik:

  • (afkrydset afkrydsningsfelt) 1: Tekst “Middelværdier”, (drop-down-knap)
  • (tomt afkrydsningsfelt) 2: Tom tekstbjælke, 50 (drop-down-knap), i gråskalatilstand
  • (tomt afkrydsningsfelt) 3: Tom tekstbjælke, 50 (drop-down-knap), i gråskalatilstand
  • (tomt afkrydsningsfelt) 3: (drop-down-knap), i gråskalatilstand
  • (tom afkrydsningsfelt) 4: tom tekstbjælke, 50 (drop-down-knap), i gråskalatilstand

Højre panel, kovariater:

  • Tekst “kvindelig”, drop-down-knap
  • Tom tekstboks, drop-down-knap
  • Tom tekstboks, drop-down-knap
  • Tom tekstboks, drop-down-knap

Underst på siden står der: “Kovariater kan også være underscore all (alle kovariater) dot underscore factor (alle faktor-kovariater) dot og underscore continuous (alle kontinuerte kovariater).”

Den midterste sektion med titlen “Faste værdier” er yderligere opdelt i to paneler, venstre og højre, der vises som følger:

Venstre panel, Kovariat:

  • (afkrydset afkrydsningsfelt) 1: under 30 år (drop-down-knap)
  • (afkrydset afkrydsningsfelt) 2: alder 65 år plus (drop-down-knap)
  • (afkrydset afkrydsningsfelt) 3: arthritis (drop-down-knap)
  • (tømt afkrydsningsfelt) 4: tom tekstbjælke (drop-down-knap)

Højre panel, Numliste:

  • 0
  • 0
  • 1 (tekstbjælke valgt)
  • Tom tekstbjælke

Den nederste sektion med titlen “Udtryk” er yderligere opdelt i to paneler, venstre og højre, som vises som følger.

Venstre panel, Kovariat:

  • (tomt afkrydsningsfelt) 1: tom tekstbjælke (drop-down-knap)
  • (tomt afkrydsningsfelt) 2: tom tekstbjælke (drop-down-knap)
  • (tomt afkrydsningsfelt) 3: (drop-down-knap)
  • (tom afkrydsningsfelt) 4: tom tekstbjælke (drop-down-knap)

Højre panel, Udtryk:

  • Tom tekstbjælke, med “Opret”-knap i gråtonemodus
  • Tom tekstbjælke, med “Opret”-knap i gråtonemodus
  • Tom tekstbjælke, med “Opret”-knap i gråtonemodus
  • Tom tekstbjælke, med knappen “Opret” i gråskalatilstand

To knapper, “OK” og “Annuller”, vises nederst til højre i dialogboksen, med OK-knappen i den valgte tilstand.

Figur 5: Valg af værdier for kovariater ved hjælp af dialogboksen Specifikation fra dialogboksen “margins – Marginal means, predictive margins and marginal effects” i Stata.

Et skærmbillede viser dialogboksen Specifikation til valg af værdier for kovariater.

Klik på OK for at vende tilbage til dialogboksen “margins – Marginal means, predictive margins and marginal effects”. Denne skulle nu vise “Specifikation 1” i boksen “Ved specifikationer (modificer indstillinger fra ovenfor)” med en beskrivelse af specifikationsdetaljerne nedenfor.

Klik på knappen “Opret” igen, og en anden dialogboks “Specifikation 2” åbnes. Brug indstillingerne som tidligere, idet du denne gang indstiller værdien af arthritis til 0.

Klik igen på OK for at vende tilbage til dialogboksen “Marginaler – Marginale middelværdier, prædiktive marginalmargener og marginale effekter”. Denne viser nu “Specifikation 1” og “Specifikation 2” i boksen “Ved specifikationer (ændr indstillinger fra ovenfor)”.

Figur 6 viser, hvordan dette ser ud i Stata.

Dialogboksen har titlen “margins – Marginal means, predictive margins, and marginal effects”. Et sæt af 10 faner vises umiddelbart under titellinjen som, “Main”, “At”, “if or in or over”, “Within”, “Contrast”, “Pairwise comparisons”, “Weights”, “SE”, “Advanced” og “Reporting” med “At” i den valgte tilstand. Indholdet i dialogboksen vises yderligere som følger:

  • (Valgt valgknap) Alle kovariater ved observerede værdier i stikprøven
  • (Tom valgknap) Alle kovariater ved deres middelværdier i stikprøven
  • (Tom afkrydsningsboks) For hver anden faktorvariabel, behandle alle niveauer som om de var lige sandsynlige (tilsidesætter de to indstillinger ovenfor for faktorvariabler)

Det viser desuden en listeboks med titlen “At specifications (modify settings from above)”, som indeholder de 2 punkter som følger:

  • Specifikation 1
  • Specifikation 2 (valgt)

I højre side af boksen er der et sæt af fire faner som “Create”, “Edit”, “Disable” og “Enable”, med “Create”, “Edit” og “Disable” i den aktive tilstand og “Enable” i gråtonemodus. Nederst i teksten står der: “ved venstre parentes venstre parentes venstre parentes middel højre parentes kvinde under 30 år er lig med venstre parentes 0 højre parentes højre parentes 65 år og derover er lig med venstre parentes 0 højre parentes gigt er lig med venstre parentes 0 højre parentes højre parentes højre parentes.”

Der vises tre knapper, “OK”, “Annuller” og “Indsend”, i nederste højre hjørne af dialogboksen, med OK-knappen i den valgte tilstand.

Figur 6: Dialogboksen “Marginaler – Marginale middelværdier, prædiktive marginaler og marginale effekter” i Stata.

Et skærmbillede viser dialogboksen

Klik på OK igen for at producere resultaterne, som er vist i figur 7.

De resultater, der er opnået ud fra den forudsagte sandsynlighed for hver gruppe af træningsaktivitetens anstrengelsesgrad i løbet af de sidste 30 dage for respondenterne, vises som følger:

Linje 1: Justerede forudsigelser; Antallet af observationer er lig med 359.925

Linje 2: Model VCE colon OIM

Linje 3: 1 punkt understregning forudsige kolon Pr venstre-parenthesis aktiv 1 er lig med er lig med Ingen understregning eller understregning Under understregning understregning moderat højre-parenthesis, forudsige venstre-parenthesis pr resultat venstre-parenthesis 0 højre-parenthesis højre-parenthesis højre-parenthesis.

Linje 4: 2 punkt understregning forudsige kolon Pr venstre forældrestilling aktiv 1 lig lig lig lig lig moderat højre forældrestilling, forudsige venstre forældrestilling pr resultat venstre forældrestilling 1 højre forældrestilling højre forældrestilling højre forældrestilling.

Linje 5: 3 punkt understregning forudsige kolon Pr venstre parentese aktiv 1 lig med lig med kraftig højre parentese, forudsige venstre parentese pr resultat venstre parentese 2 højre parentese højre parentese højre parentese.

Række 6: 1 punktum understregning ved kolon kvindelig er lig med 0,5679239 (gennemsnit)

Linje 7: under 30 år er lig med 0

Linje 8: alder 65 plus er lig med 0

Linje 9: gigt 1 er lig med 1

Linje 10: 2 punktum understregning ved kolon kvindelig er lig med 0.5679239 (middel)

Linje 11: under 30 år er lig med 0

Linje 12: alder 65 plus er lig med 0

Linje 13: aktiv 1 er lig med 0

En tabel viser endvidere værdierne for “Margin”, “Delta-metode Standardfejl”, “z”, “sandsynlighed større end z” og 95 procent konfidensinterval.” De forskellige værdier for den forudsagte sandsynlighed for hver gruppe af anstrengelsesgrad af motionsaktivitet i de sidste 30 dage for respondenterne er som følger:

Række 1: Underscore forudsiger 1 1 1: Margin, 0,3429731; Delta-metode Standard Error, 0,0016608; z, 206.51; Sandsynlighed større end z, 0.000; 95 procent konfidensinterval, 0.339718, 0.3462283.

Række 2: Underscore predict 1 underscore at 2: Margin, 0.258514; Delta-metode Standard Error, 0.0010418; z, 248.14; Sandsynlighed større end z, 0.000; 95 procent konfidensinterval, 0,256472, 0,2605559.

Række 3: Underscore forudsiger 2 underscore ved 1: Margin, 0,49762; Delta-metode Standard Error, 0,0017772; z, 280,00; Sandsynlighed større end z, 0,000; 95 procent konfidensinterval, 0,000; 95 procent konfidensinterval, 0.4941367, 0.5011032.

Række 4: Underscore forudsige 2 underscore ved 2: Margin, 0.5690545; Delta-metode Standard Error, 0.0011953; z, 476.06; Sandsynlighed større end z, 0.000; 95 procent konfidensinterval, 0.5667117, 0.57133973.

Række 5: Understregning forudsiger 3 understregninger ved 1: Margin, 0,1594069; Delta-metode standardfejl, 0,00117; z, 136,25; Sandsynlighed større end z, 0,000; 95 procent konfidensinterval, 0,1571138, 0,1617.

Række 6: Understregning forudsiger 3 understregning ved 2: Margin, 0,1724315; Delta-metode Standard Error, 0,0008886; z, 194,05; Sandsynlighed større end z, 0,000; 95 procent konfidensinterval, 0,17068991, 0,1741731.

Figur 7: Forudsagt sandsynlighed for at falde inden for hver gruppe af træningsaktivitetens anstrengelsesgrad i løbet af de sidste 30 dage for respondenter med og uden gigt, 30-64 år, med andre variabler holdt på deres middelværdier, 2013 BRFSS.

En tabel viser den forudsagte sandsynlighed for at falde inden for hver gruppe af træningsaktivitetens anstrengelsesgrad i løbet af de sidste 30 dage for respondenter med og uden gigt, i alderen 30-64 år.

Den venstre kolonne i tabellen nederst har to kolonner med tal under ordene “_predict#_at”. Tallene 1-3 til venstre er hver af kategorierne for forskellige niveauer af anstrengelsesgrad af aktivitet. Tallene 1 og 2 til højre er de to forskellige profiler, som vi har oprettet for, om en respondent har gigt eller ej. Nærmere oplysninger om disse profiler kan ses i oplysningerne over tabellen.

De forudsagte sandsynligheder og deres konfidensintervaller er estimeret ved hjælp af postestimationssimulering. En fuldstændig diskussion af denne proces ligger uden for rammerne af dette eksempel, men kort fortalt beregner processen 1.000 sæt af forudsagte sandsynligheder ved at simulere værdier for modelkoefficienterne på grundlag af deres estimerede værdier, varianser og kovarianser. For yderligere oplysninger, se “Udnyttelse af statistiske analyser”: Improving Interpretation and Presentation” af King, Tomz og Wittenberg (American Journal of Political Science, 44(2), 341-355).

Den bedste måde at undersøge ændringer i forudsagte sandsynligheder, der involverer en uafhængig variabel med mere end to værdier, er at fremstille en figur som den, der er vist i figur 8. Figur 8 viser den forudsagte sandsynlighed for at falde ind under et af de tre aktivitetsniveauer for respondenterne i hver af disse tre aldersgrupper, mens de to andre uafhængige variabler i modellen holdes på deres respektive middelværdier. Højden på hver søjle viser størrelsen af den forudsagte sandsynlighed.

Det første søjlediagram har titlen “under 30 år er lig med nej, alder 65 plus er lig med nej”. Den lodrette akse angiver sandsynligheden fra 0 til 0,6, og den vandrette akse angiver BMI-kategoriseringen fra 0 til 2.

Den estimerede forudsagte sandsynlighed for respondenter ved forskellige BMI-klassifikationer er som følger: (0, 0,28); (1, 0,55); (2, 0,18).

Det andet søjlediagram har overskriften “under 30 år er lig med nej, 65 år og derover er lig med ja”. Den estimerede forudsagte sandsynlighed for respondenter ved forskellige BMI-klassifikationer er som følger: (0, 0,30); (1, 0,25); (2, 0,41).

Det tredje søjlediagram har overskriften “under 30 år er lig med ja, 65 år og derover er lig med nej”. Den estimerede forudsagte sandsynlighed for respondenter ved forskellige BMI-klassifikationer er som følger: (0, 0,28); (1, 0,66); (2, 0,05).

Figur 8: Forudsagt sandsynlighed for respondenter, der falder ind i hver af de tre kategorier på den afhængige variabel på tværs af forskellige aldersværdier, mens alle andre uafhængige variabler i modellen holdes på deres respektive gennemsnit, 2013 BRFSS.

Et sæt af tre søjlediagrammer repræsenterer den forudsagte sandsynlighed for, at respondenterne falder ind i hver af de tre kategorier på den afhængige variabel på tværs af forskellige aldersværdier.

For at producere dette plot skal du vende tilbage til dialogboksen “Postestimation Selector”, som stadig skal være åben. Sørg for, at “Custom and high-dimensional analyses” stadig er fremhævet.

Tryk på Launch for at genåbne dialogboksen “Margins – Marginal means, predictive margins, and marginal effects”.

Vælg igen fanen “At” som før. Du vil se de to tidligere specifikationer i boksen “At-specifikationer (ændr indstillinger fra ovenfor)”. Markér hver af dem på skift ved at klikke på dem og deaktiver dem ved hjælp af knappen “Disable” til højre. Klik på “Create” for at åbne en ny “Specification”-dialogboks.

Som før bruger vi denne til at indtaste værdierne for variablerne for den valgte profil. Afsnittet “Statistics” øverst i dialogboksen “Specification 1” kan bruges til at indstille de relevante variabler (i dette tilfælde kvinde og gigt) til deres gennemsnit. Sæt kryds i “1” ved at klikke på feltet til venstre for det, og i tekstboksen “Statistic” til højre vises en pil med en drop-down-menu. Vælg “Middelværdier”. I feltet “Covariates” skal du bruge rullemenuen til at vælge kvinde. Gør det samme for gigt i rækken nedenunder.

Næst skal du bruge afsnittet “Faste værdier” som før for at vælge værdierne for under30 år og alder65plus. Da vi ser på ændringen i de forudsagte sandsynligheder på tværs af tre alderskategorier, skal vi oprette tre specifikationer for hver af aldersgrupperne, hvor alderen er sat til følgende værdier:

  • Under 30-under30 1 age65plus 0
  • 30-64-under30 0 age65plus 0
  • 65 og over-under30 0 age65plus 1

Den første af disse er vist i figur 9.

Når alle tre nye specifikationer vises i dialogboksen “Marginaler – Marginale middelværdier, prædiktive marginaler og marginale virkninger”, skal du klikke på OK for at producere de forudsagte sandsynligheder.

For at indtaste kommandoen direkte i Stata-kommandovinduet, er koden som følger:

margins, at((mean) female (mean) arthritis under30=(1) age65plus=(0)) at((mean) female (mean) arthritis under30=(0) age65plus=(0)) at(((mean) female (mean) arthritis under30=(0) age65plus=(1))

Tryk på Enter for at producere de forudsagte sandsynligheder for de valgte profiler.

Dialogboksen med titlen “Specifikation 3” kan opdeles i tre afsnit med titlerne “Statistik”, “Faste værdier” og “Udtryk”. Den øverste sektion med titlen “Statistik” er yderligere opdelt i to paneler, venstre og højre, som vises som følger:

Venstre panel, Statistik:

  • (afkrydset afkrydsningsfelt) 1: Tekst “Middelværdi”, (drop-down-knap)
  • (afkrydset afkrydsningsfelt) 2: Tekst “Middelværdi”, (drop-down-knap)
  • (tomt afkrydsningsfelt) 3: Tom tekstbjælke, 50 (drop-down-knap), i gråtonemode
  • (tomt afkrydsningsfelt) 4: tom tekstbjælke, 50 (drop-down-knap), i gråskalatilstand

Højre panel, Kovariater:

  • Tekst “kvinde,” drop-down-knap
  • Tekst “gigt,” drop-down-knap
  • Tomt tekstfelt, drop-down-knap
  • Tomt tekstfelt, drop-down-knap

Underst på siden står der: “Kovariater kan også være underscore all (alle kovariater) dot underscore factor (alle faktor-kovariater) dot og underscore continuous (alle kontinuerlige kovariater).”

Den midterste sektion med titlen “Faste værdier” er yderligere opdelt i to paneler, venstre og højre, som vises som følger:

Venstre panel, Kovariat:

  • (afkrydset afkrydsningsfelt) 1: under 30 år (drop-down-knap)
  • (afkrydset afkrydsningsfelt) 2: alder 65 år og derover (drop-down-knap)
  • (tomt afkrydsningsfelt) 3: tom tekstbjælke (drop-down-knap)
  • (tomt afkrydsningsfelt) 4: tom tekstbjælke (drop-down-knap)

Højre panel, Numlist:

  • 1
  • 0 (tekstbjælke valgt)
  • Tom tekstbjælke
  • Tom tekstbjælke

Den nederste sektion med titlen “Udtryk” er yderligere opdelt i to paneler, venstre og højre, som vises som følger:

Venstre panel, Kovariat:

Venstre panel, Kovariat:

  • (tomt afkrydsningsfelt) 1: tom tekstbjælke (drop-down-knap)
  • (tomt afkrydsningsfelt) 2: tom tekstbjælke (drop-down-knap)
  • (tomt afkrydsningsfelt) 3: tom tekstbjælke (drop-down-knap)
  • (tomt afkrydsningsfelt) 4: tom tekstbjælke (drop-down-knap)

Højre panel, Udtryk:

  • (tomt afkrydsningsfelt) 1: tomt afkrydsningsfelt:
    • Tom tekstbjælke, med “Opret”-knap i gråtonemodus
    • Tom tekstbjælke, med “Opret”-knap i gråtonemodus
    • Tom tekstbjælke, med “Opret”-knap i gråtonemodus
    • Tom tekstbjælke, med knappen “Opret” i gråskalatilstand

    To knapper, “OK” og “Annuller”, vises nederst til højre i dialogboksen, med OK-knappen i den valgte tilstand.

Figur 9: Valg af værdier for hver af aldersgrupperne, idet andre variabler holdes på deres gennemsnit ved hjælp af dialogboksen “margins – Marginal means, predictive margins and marginal effects” i Stata.

Et skærmbillede viser dialogboksen Specifikation til valg af værdier for kovariater.

For at plotte resultaterne skal du vende tilbage til dialogboksen Postestimation Selector. Vælg “Profile plots after marginal analysis” som vist i figur 10.

Dialogboksen med titlen “Postestimation Selector” består af en liste af kommandoer under titlen “Postestimation commands”. Elementerne vises som følger:

  • Marginalanalyse (udvidet visning)
    • Marginalmidler og marginale effekter, grundlæggende analyser
    • Marginale middelværdier og interaktionsanalyse (sammenklappet visning)
    • Kontraster af marginale middelværdier (sammenklappet visning)
    • Marginale virkninger af en kovariat ved værdier af en anden kovariat (udvidet visning)
      • Gennemsnit af population (gennemsnitlig overestimationsprøve)
      • Ved stikprøvens gennemsnit
      • Marginale virkninger af alle kovariater (udvidet visning)
      • Brugerdefineret og højdimensionelle analyser
      • Profilplots efter marginalanalyse (fremhævet)
      • Tests, kontraster og sammenligninger af parameterestimater (sammenklappet visning)
      • Specifikation, diagnostisk, og goodness-of-fit-analyse (sammenklappet visning)
      • Forudsigelser (sammenklappet visning)
      • Andre rapporter (sammenklappet visning)
      • Håndtering af estimationsresultater (sammenklappet visning)
      • Der vises en “Start”-knap og en “Annuller”-knap i henholdsvis øverste højre hjørne og nederste højre hjørne af vinduet.

Figur 10: Fremstilling af en plotte af resultater ved hjælp af dialogboksen Postestimation Selector i Stata.

Et skærmbillede viser dialogboksen Postestimation Selector til at starte en kommando.

Kryds på Launch for at åbne dialogboksen “marginsplot – Graph results from margins” (marginsplot – grafiske resultater fra marginer). På fanen “Main”, i det tredje tekstfelt mærket “Create subgraphs for groups defined by variables:”, skal du vælge de to aldersvariabler fra drop-down mulighederne som vist i figur 11.

Klik på knappen “Options” ved siden af tekstfeltet. Dette åbner en ny dialogboks “By dimension label”. Sæt kryds ved “Include variable name and equal signs in all labels” som i figur 12.

Dialogboksen har titlen “marginsplot – Graph results from margins”. Der vises en menulinje umiddelbart under titellinjen med 12 faner som “Main”, “Labels”, “Plot”, “CI plot”, “Pairwise”, “Add plots”, “Y axis”, “X axis”, “Titles”, “Legend”, “Overall” og “By options”, med fanen “Main” i den valgte tilstand.

Det øvrige indhold i dialogboksen vises under titlen “Dimensioner” som følger:

  • Variabel(er), der definerer x-aksen, med en tom tekstbjælke og en rullemenu og en knap “Indstillinger” ved siden af.
  • Opret plot for grupper defineret af variabler, med en tom tekstbjælke og en rullemenu og en knap “Indstillinger” ved siden af.
  • Opret undergrafer for grupper defineret af variabler med en tekstbjælke i valgt tilstand, der lyder: “på (under 30 år) på (alder 65 år og derover).” Tekstbjælken har også en drop-down menu sammen med den og en “Indstillinger”-knap ved siden af.
  • Opret grafer for grupper defineret ved variabler, med en tom tekstbjælke og en drop-down menu og en “Indstillinger”-knap ved siden af den.

En tjekliste under den vises som følger:

  • (tomt afkrydsningsfelt) Byt x- og y-akse (horisontal graf)
  • (tomt afkrydsningsfelt) Plot ikke konfidensintervaller
  • (tomt afkrydsningsfelt) Navn på graf, eller stub hvis der er flere grafer, med en tom tekstlinje nedenunder
  • (tom afkrydsningsboks) Udskift graf, hvis den allerede findes i hukommelsen, i gråskalatilstand

Tre knapper, “OK”, “Annuller” og “Indsend”, vises i nederste højre hjørne af dialogboksen, med OK-knappen i den valgte tilstand.

Figur 11: Brug af dialogboksen marginsplot til at plotte de forudsagte sandsynligheder i Stata.

Et skærmbillede viser dialogboksen marginsplot til at plotte de forudsagte sandsynligheder i Stata.

Dialogboksen har titlen “By dimension label”. Det øvrige indhold i dialogboksen vises som følger:

Linje 1: Bemærk: Disse indstillinger tilsidesætter standardindstillingerne og indstillingerne for fanen Label

Linje 2: Liste over citattekster til mærkning af hvert niveau i dimensionen

Linje 3: (tom tekstlinje i den valgte tilstand)

Linje 4: (tom tekstlinje i den valgte tilstand)

Linje 4: Liste over opregnede mærket, eksempel 1 “en” 2 “to” ellipse

Linje 5: (tom tekstlinje) Mærk grupper med deres værdier, ikke deres etiketter

Linje 6: (tom tekstlinje) Mærk grupper med deres værdier, ikke deres etiketter

Linje 6: (tom afkrydsningsboks) Glem variabelnavn og lighedstegn i alle etiketter i gråskalatilstand

Linje 7: (afkrydset tomt afkrydsningsfelt) Medtag variabelnavn og lighedstegn i alle etiketter

Linje 8: (tomt afkrydsningsfelt) Separator for etiketter, når der er angivet flere variabler

Linje 9: (tom tekstlinje) i gråskalatilstand

Linje 10: (tom afkrydsningsboks) Brug ikke en separator mellem etiketter

Der vises tre knapper, “OK”, “Cancel” og “Submit”, i nederste højre hjørne af dialogboksen, med OK-knappen i den valgte tilstand.

Figur 12: Valg af etiketindstillinger ved hjælp af dialogboksen marginsplot i Stata.

Et skærmbillede viser dialogboksen marginsplot til valg af etiketindstillinger.

På fanen “Plot”, vist i Figur 13, skal du vælge “Bar” fra rullemenuen “Plot type” øverst.

Dialogboksen har titlen “marginsplot – Graph results from margins”. En menulinje vises umiddelbart under titellinjen med 12 faner som “Main”, “Labels”, “Plot”, “CI-plot”, “Pairwise”, “Add plots”, “Y axis”, “X axis”, “Titles”, “Legend”, “Overall” og “By options”, med fanen “Plot” i den valgte tilstand.

Under menulinjen vises en drop-down menu under menulinjen med titlen “Plot type” med “Bar” valgt i menuen. Den viser desuden en listeboks med titlen “Select plot” (Vælg plot) med en liste af elementer, der vises som følger:

  • Alle plotter (valgt)
  • Plot 1
  • Plot 2
  • Plot 3
  • Plot 4
  • Plot 4
  • Plot 5
  • Plot 6
  • Plot 7
  • Plot 7
  • Plot 8

Der vises en fane “Bar properties” ved siden af listefeltet. En tekst nederst lyder: “De viste plots afspejler ikke nødvendigvis antallet af faktiske plots for grafen.”

Der vises tre knapper, “OK”, “Annuller” og “Indsend”, i nederste højre hjørne af dialogboksen, med OK-knappen i den valgte tilstand.

Figur 13: Valg af et søjlediagram ved hjælp af dialogboksen marginsplot i Stata.

Et skærmbillede viser dialogboksen marginsplot til valg af et søjlediagram.

Stata giver andre muligheder for at gøre diagrammet mere præsentabelt. I dette tilfælde vil vi kun vælge yderligere én mulighed. Vælg fanen “X axis” (X-akse), og skriv “Activity Level” i tekstboksen “Title” (titel) for at mærke x-aksen som vist i figur 14.

Klik på OK for at producere plottet med de forudsagte sandsynligheder for at være i hver kategori af aktivitetsniveau for intervallet af valgte værdier, som vist i figur 8.

For at indtaste kommandoen direkte i Stata-kommandovinduet er koden som følger:

marginsplot, bydimension(at(under30) at(age65plus), nosimplelabels) recast(bar) recastci(rbar) xtitle(BMI-kategori)

Tryk på Enter for at producere søjlediagrammet.

Dialogboksen har titlen “marginsplot – Graph results from margins”. En menulinje vises umiddelbart under titellinjen med 12 faner som “Main”, “Labels”, “Plot”, “CI-plot”, “Pairwise”, “Add plots”, “Y axis”, “X axis”, “Titles”, “Legend”, “Overall” og “By options”, med fanen “X axis” i den valgte tilstand.

En tekstlinje under navnet “Title” viser elementet “Activity Level” med en “Properties”-fanebladet, der vises ved siden af. Et sæt af yderligere fem faner vises under tekstbjælken som “Egenskaber for større kryds/mindre kryds/mindre etiket”, “Egenskaber for mindre kryds/mindre etiket”, “Egenskaber for aksens skala” og “Referencelinjer”. Herefter følger to muligheder med afkrydsningsfelter som følger:

  • (tom afkrydsningsfelt) Skjul akse
  • (tom afkrydsningsfelt) Placér akse på modsatte side af grafen

Der vises tre knapper, “OK”, “Annuller” og “Indsend”, i nederste højre hjørne af dialogboksen, med OK-knappen i den valgte tilstand.

Figur 14: Mærkning af X-aksen ved hjælp af dialogboksen marginsplot i Stata.

Et skærmbillede viser dialogboksen marginsplot til mærkning af X-aksen.

En komplet fortolkning af resultaterne af en multinomial logit-model ville præsentere lignende tabeller eller figurer for hver uafhængig variabel i modellen.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.