Apprenez à connaître la logit multinomiale dans Stata avec les données du système de surveillance des facteurs de risque comportementaux (2013)

Mai 15, 2021
admin
2.2 Exploration de la sortie de Stata

Les résultats du modèle de régression logistique multinomiale sont présentés dans la figure 3.

La sortie du modèle de régression logistique apparaît comme suit :

Ligne 1 : dot mlogit active 1 femme de moins de 30 ans âge 65 plus arthrite

Ligne 2 : Itération 0 : la vraisemblance logarithmique est égale à négative 379353,27

Ligne 3 : Itération 1 : la log-vraisemblance est égale à négative 357272.01

Ligne 4 : Itération 2 : la log-vraisemblance est égale à négative 356455.81

Ligne 5 : Itération 3 : la log-vraisemblance est égale à négative 356439.91

Ligne 6 : Itération 4 : la log-vraisemblance est égale à négative 356439.9

Ligne 7 : Régression logistique multinomiale ; Le nombre d’observations est égal à 359 925

Ligne 8 : LR chi2 (8) est égal à 45826,74

Ligne 9 : Probabilité supérieure au chi2 égale à 0,0000

Ligne 10 : La vraisemblance logarithmique est égale à négative 356439,9 ; le Pseudo R2 est égal à 0,0604

Un tableau apparaît sous ces informations, avec différentes valeurs pour « actif 1 » présentées comme suit :

Ligne 1 : Aucun soulignement ou soulignement sous le soulignement modéré, féminin : Coefficient, négatif 0,0137624 ; erreur standard, 0,0081021 ; z, négatif 1,70 ; P supérieur à la valeur absolue de z, 0,089 ; intervalle de confiance à 95 %, négatif 0,0296422, 0,0021173.

Rangée 2 : Aucun soulignement ou soulignement inférieur au soulignement modéré, moins de 30 ans : Coefficient, négatif 0,2132395 ; erreur standard, 0,0136507 ; z, négatif 15,62 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, 0,7998839, 0,8377535.

Rangée 3 : Aucun sous-score ou sous-score inférieur au sous-score modéré, 65 ans et plus : Coefficient, 0,8188187 ; erreur standard, 0,0096608 ; z, 84,76 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, 0,7998839, 0,8377535.

Rangée 4 : Aucun sous-score ou sous-score inférieur au sous-score modéré, arthrite : Coefficient, 0,4168419 ; erreur standard, 0,008863 ; z, 47,03 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, 0,3994706, 0,4342131.

Rangée 5 : Aucun soulignement ou soulignement inférieur au soulignement modéré, soulagement du soulignement : Coefficient, négatif 0,7812104 ; erreur standard, 0,007175 ; z, négatif 108,88 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, négatif 0,7952731, 0,7671477.

Rangée 6 : Modéré, résultat de base

Rangée 7 : Vigoureux, féminin : Coefficient, négatif 0,0456556 ; erreur standard, 0,0090931 ; z, négatif 5,02 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, négatif 0,0634778, 0,0278334.

Rangée 8 : Vigoureuse, moins de 30 ans : Coefficient, négatif 1,333241 ; erreur standard, 0,0247722 ; z, négatif 53,82 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, négatif 1,381794, négatif 1,284689.

Rangée 9 : Vigoureux, 65 ans et plus : Coefficient, 1,663682 ; erreur standard, 0,0099416 ; z, 167,35 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, 1,644197, 1,683167.

Rangée 10 : Vigoureux, arthrite : Coefficient, 0,0555993 ; erreur standard, 0,0098662 ; z, 5,64 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 %, 0,036262, 0,0749366.

Rangée 11 : Vigoureux, soulignement cons : Coefficient, négatif 1,168047 ; erreur type, 0,0081195 ; z, négatif 143,86 ; P supérieur à la valeur absolue de z, 0,000 ; intervalle de confiance à 95 pour cent, négatif 1,183961, négatif 1,152133.

Figure 3 : Régression logistique multinomiale de l’intensité de l’activité physique au cours des 30 derniers jours sur le sexe, l’âge et le fait que le répondant souffre ou non d’arthrite, 2013 BRFSS.

Une capture d'écran montre la régression logistique de l'intensité de l'activité physique au cours des 30 derniers jours sur le sexe, l'âge et le fait que le répondant souffre ou non d'arthrite.

La régression logistique multinomiale estime des modèles pour toutes les catégories de la variable dépendante, sauf une. Par défaut, Stata omet le résultat le plus fréquent, l’utilisant comme base pour comparer les autres catégories.

Il y a beaucoup d’informations dans les résultats. Dans cet exemple, nous concentrons notre attention sur les estimations des coefficients individuels reliant les variables indépendantes à la variable dépendante et leur niveau de signification statistique correspondant. Nous pouvons constater que chaque estimation de coefficient est statistiquement différente de zéro. Cela nous conduirait à rejeter l’hypothèse nulle d’un coefficient égal à zéro pour toutes les estimations.

L’interprétation des résultats d’un modèle logit multinomial nécessite plus que le simple examen de la direction et du niveau de signification statistique des estimations de coefficient elles-mêmes.

La façon la plus courante d’interpréter les résultats d’un modèle logit multinomial est de calculer les probabilités prédites en fonction des résultats de l’analyse. Comme la probabilité prédite de tomber dans l’une des catégories de la variable dépendante est une fonction non linéaire des variables indépendantes, le calcul des probabilités prédites nécessite de fixer chaque variable indépendante à une certaine valeur. Pensez-y comme si vous créiez un profil descriptif pour un cas dans l’ensemble de données et que vous calculiez la probabilité prédite qu’une personne ayant ce profil s’engage dans les trois différents niveaux d’activité décrits ici. Vous pouvez évaluer l’impact de différentes variables indépendantes sur les changements dans les probabilités prédites en changeant les caractéristiques du profil et en recalculant ces probabilités.

À titre d’exemple, nous allons calculer les probabilités prédites de tomber dans chaque niveau de pénibilité de l’activité pour les répondants avec et sans arthrite. Pour chacun, nous fixons la valeur de la variable indicatrice féminine à sa moyenne et les deux variables d’âge à zéro, ce qui signifie que ces profils décrivent des répondants âgés de 30 à 64 ans.

Pour calculer la probabilité prédite d’être dans chaque niveau d’activité pour les personnes atteintes d’arthrite, entrez la commande suivante dans la fenêtre de commande de Stata:

margins, at(mean(female) under30=(0) age65plus=(0) arthritis=(1))

Appuyez sur Entrée pour produire la probabilité prédite d’être dans chaque groupe de niveau d’activité.

Pour les personnes sans arthrite, le code est le suivant :

margins, at(mean(female) under30=(0) age65plus=(0) arthritis=(0))

Appuyez sur Entrée pour produire la probabilité prédite d’être dans chaque groupe de niveau d’activité.

Pour calculer ces probabilités prédites en utilisant plutôt les options du menu, après avoir exécuté le modèle de régression logistique multinomiale, sélectionnez les options suivantes dans le menu de Stata:

Statistiques → Postestimation

Dans la boîte de dialogue « Sélecteur de postestimation » qui s’ouvre, illustrée à la figure 4, développez « Analyse marginale ». Sous « Effets marginaux de toutes les covariables », mettez en évidence « Analyses personnalisées et à haute dimension » en cliquant dessus.

Appuyez sur Launch pour ouvrir la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux ».

La boîte de dialogue intitulée « Sélecteur de post-estimation » consiste en une liste de commandes sous le titre « Commandes de post-estimation ». Les éléments apparaissent comme suit :

  • Analyse marginale (vue étendue)
    • Moyens marginaux et effets marginaux, analyses fondamentales
    • Moyennes marginales et analyse d’interaction (vue réduite)
    • Contraste des moyennes marginales (vue réduite)
    • Effets marginaux d’une covariable aux valeurs d’une autre covariable (vue étendue)
      • Moyenne de la population (échantillon de surestimation moyenne)
      • -.
        Aux moyennes de l’échantillon
    • Effets marginaux de toutes les covariables (vue élargie)
      • Analyses personnalisées et hautementdimensionnelles (mises en évidence)
      • Plots de profil après analyse marginale
  • Tests, contrastes, et comparaisons des estimations des paramètres (vue rabattue)
  • Spécification, diagnostic, et analyse de qualité d’ajustement (vue réduite)
  • Prédictions (vue réduite)
  • Autres rapports (vue réduite)
  • Gérer les résultats d’estimation (vue réduite)

Un bouton « Lancer » et un bouton « Annuler » apparaissent respectivement dans le coin supérieur droit et le coin inférieur droit de la fenêtre.

Figure 4 : Utilisation de la boîte de dialogue du sélecteur de post-estimation à partir du menu Statistiques de Stata.

Une capture d'écran montre la boîte de dialogue du sélecteur de post-estimation pour lancer une commande.

En haut de la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux », sélectionnez l’onglet intitulé « At ». Dans l’onglet « At », le bouton à côté de « Toutes les covariables aux valeurs observées dans l’échantillon » doit être mis en surbrillance.

Cliquez sur le bouton « Créer » plus bas et une nouvelle boîte de dialogue « Spécification 1 » s’ouvrira.

La section « Statistiques » en haut de la boîte de dialogue « Spécification 1 » peut être utilisée pour définir les variables pertinentes à leur moyenne, dans ce cas la femme. Cochez « 1 » en cliquant sur la case à sa gauche, et la zone de texte « Statistiques » à droite fournira une flèche avec un menu déroulant. Sélectionnez « Moyennes ». Dans la case « Covariables », utilisez les options déroulantes pour sélectionner femme.

Dans la section « Valeurs fixes », vous pouvez définir les valeurs des variables restantes. Cliquez sur la case située à côté du chiffre 1. Sélectionnez under30 dans la liste des variables dans les options de la liste déroulante « Covariate ». Dans la zone de texte « Numlist », entrez manuellement la valeur de la variable à « 0 ». Dans la case 2, fixez la valeur de age65plus à « 0 ». Enfin, dans la case 3, définissez la valeur de arthrite à « 1. »

La figure 5 montre à quoi cela ressemble dans Stata.

La boîte de dialogue intitulée « Spécification 1 » peut être divisée en trois sections intitulées « Statistiques », « Valeurs fixes » et « Expressions ». La section supérieure intitulée « Statistiques » est en outre divisée en deux panneaux, gauche et droite, qui apparaissent comme suit.

Panneau gauche, Statistiques:

  • (case cochée) 1 : Texte « Moyennes, » (bouton déroulant)
  • (case vide) 2 : barre de texte vide, 50 (bouton déroulant), en mode niveaux de gris
  • (case vide) 3 : barre de texte vide, 50 (bouton déroulant), en mode niveaux de gris
  • (case à cocher vide) 4 : barre de texte vide, 50 (bouton déroulant), en mode niveaux de gris

Panneau de droite, covariables :

  • Texte « femme », bouton déroulant
  • Barre de texte vide, bouton déroulant
  • Barre de texte vide, bouton déroulant
  • Barre de texte vide, bouton déroulant

Une note en bas de page indique : « Les covariables peuvent également être soulignées all (toutes les covariables) dot underscore factor (toutes les covariables factorielles) dot et underscore continuous (toutes les covariables continues). »

La section centrale intitulée « Valeurs fixes » est en outre divisée en deux panneaux, gauche et droit, qui apparaissent comme suit :

Panneau gauche, covariable :

  • (case cochée) 1 : moins de 30 ans (bouton déroulant)
  • (case cochée) 2 : 65 ans et plus (bouton déroulant)
  • (case cochée) 3 : arthrite (bouton déroulant)
  • (case à cocher vide) 4 : barre de texte vide (bouton déroulant)

Panneau de droite, Numlist :

  • 0
  • 0
  • 1 (barre de texte sélectionnée)
  • Barre de texte vide

La section inférieure intitulée « Expressions » est encore divisée en deux panneaux, gauche et droite, qui apparaît comme suit .

Panneau de gauche, Covariate:

  • (case vide) 1 : barre de texte vide (bouton déroulant)
  • (case vide) 2 : barre de texte vide (bouton déroulant)
  • (case vide) 3 : barre de texte vide (bouton déroulant)
  • (case à cocher vide) 4 : barre de texte vide (bouton déroulant)

Panneau de droite, Expression :

  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris
  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris
  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris
  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris

Deux boutons, « OK » et « Annuler », apparaissent dans le coin inférieur droit de la boîte de dialogue, avec le bouton OK dans le mode sélectionné.

Figure 5 : Sélection des valeurs des covariables à l’aide de la boîte de dialogue de spécification À partir de la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux » dans Stata.

Une capture d'écran montre la boîte de dialogue de spécification pour sélectionner les valeurs des covariables.

Cliquez sur OK pour revenir à la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux ». Cela devrait maintenant montrer « Spécification 1 » dans la boîte « Aux spécifications (modifier les paramètres du dessus) », avec une description des détails de la spécification en dessous.

Cliquez à nouveau sur le bouton « Créer » et une autre boîte de dialogue « Spécification 2 » s’ouvrira. Utilisez les options comme précédemment, en fixant cette fois la valeur de l’arthrite à 0.

A nouveau, cliquez sur OK pour revenir à la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux ». Celle-ci affichera maintenant « Spécification 1 » et « Spécification 2 » dans la boîte « Aux spécifications (modifier les paramètres ci-dessus) ».

La figure 6 montre à quoi cela ressemble dans Stata.

La boîte de dialogue est intitulée « marges – Moyennes marginales, marges prédictives et effets marginaux. » Un ensemble de 10 onglets apparaît immédiatement sous la barre de titre comme, « Principal », « A », « si ou dans ou sur », « Dans », « Contraste », « Comparaisons par paires », « Poids », « SE », « Avancé » et « Rapport » avec « A » dans le mode sélectionné. Le contenu de la boîte de dialogue apparaît en outre comme suit :

  • (bouton radio sélectionné) Toutes les covariables aux valeurs observées dans l’échantillon
  • (bouton radio vide) Toutes les covariables à leurs moyennes dans l’échantillon
  • (case vide) Pour chaque autre variable de facteur, traiter tous les niveaux comme s’ils étaient également probables (remplace les deux paramètres ci-dessus pour les variables factorielles)

Il affiche en outre une boîte de liste intitulée « Aux spécifications (modifiez les paramètres ci-dessus) » contenant les 2 éléments suivants :

  • Spécification 1
  • Spécification 2 (sélectionnée)

À droite de la boîte se trouve un ensemble de quatre onglets comme, « Créer », « Modifier », « Désactiver » et « Activer », avec « Créer », « Modifier » et « Désactiver » en mode actif et « Activer » en mode niveaux de gris. Un texte en bas de page indique : « à gauche-parenthèse gauche-parenthèse droite-parenthèse moyenne femme moins de 30 ans égale gauche-parenthèse 0 droite-parenthèse âge 65 plus égale gauche-parenthèse 0 droite-parenthèse arthrite égale gauche-parenthèse 0 droite-parenthèse droite-parenthèse. »

Trois boutons, « OK », « Annuler » et « Soumettre », apparaissent dans le coin inférieur droit de la boîte de dialogue, le bouton OK étant en mode sélectionné.

Figure 6 : La boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux » dans Stata.

Une capture d'écran montre la boîte de dialogue des marges à définir

Cliquez à nouveau sur OK pour produire les résultats, qui sont présentés dans la figure 7.

Les résultats obtenus à partir de la probabilité prédite de chaque groupe d’intensité de l’activité physique au cours des 30 derniers jours pour les répondants apparaissent comme suit :

Ligne 1 : Prédictions ajustées ; Le nombre d’observations est égal à 359 925

Ligne 2 : Modèle VCE colon OIM

Ligne 3 : 1 point underscore predict colon Pr left-parenthesis active 1 égale égale None underscore or underscore Below underscore moderate right-parenthesis, predict left-parenthesis pr outcome left-parenthesis 0 right-parenthesis right-parenthesis.

Line 4 : 2 points soulignés prédire colon Pr parenthèse gauche active 1 égale égale modérée parenthèse droite, prédire parenthèse gauche pr résultat parenthèse gauche 1 parenthèse droite parenthèse droite.

Ligne 5 : 3 points de soulignement au colon Pr parenthèse gauche active 1 égal égale égale parenthèse droite vigoureuse, prédire parenthèse gauche pr résultat parenthèse gauche 2 parenthèse droite parenthèse droite.

Ligne 6 : 1 point souligné au colon femme égale 0,5679239 (moyenne)

Ligne 7 : moins de 30 ans égale 0

Ligne 8 : âge 65 plus égale 0

Ligne 9 : arthrite 1 égale 1

Ligne 10 : 2 points soulignés au colon femme égale 0.5679239 (moyenne)

Ligne 11 : moins de 30 ans égale 0

Ligne 12 : 65 ans et plus égale 0

Ligne 13 : actif 1 égale 0

Un tableau indique en outre les valeurs de  » Marge « ,  » Erreur standard de la méthode Delta « ,  » z « ,  » probabilité supérieure à z  » et intervalle de confiance à 95 %.  » Les différentes valeurs de la probabilité prédite de chaque groupe de la pénibilité de l’activité physique au cours des 30 derniers jours pour les personnes interrogées sont les suivantes :

La rangée 1 : Sous-entendu prédire 1 1 : Marge, 0,3429731 ; Erreur standard de la méthode Delta, 0,0016608 ; z, 206.51 ; Probabilité supérieure à z, 0.000 ; Intervalle de confiance à 95 pour cent, 0.339718, 0.3462283.

Rangée 2 : Underscore predict 1 underscore at 2 : Marge, 0.258514 ; Delta-method Standard Error, 0.0010418 ; z, 248.14 ; Probabilité supérieure à z, 0.000 ; Intervalle de confiance à 95 %, 0,256472, 0,2605559.

La rangée 3 : Underscore prédit 2 underscore à 1 : Marge, 0,49762 ; Erreur standard de la méthode delta, 0,0017772 ; z, 280,00 ; Probabilité supérieure à z, 0,000 ; Intervalle de confiance à 95 %, 0.4941367, 0,5011032.

La rangée 4 : Soulignement prédit 2 soulignement à 2 : Marge, 0,5690545 ; Erreur standard de la méthode delta, 0,0011953 ; z, 476,06 ; Probabilité supérieure à z, 0,000 ; Intervalle de confiance à 95 pour cent, 0,5667117, 0,57133973.

La rangée 5 : Soulignement prédit 3 soulignés à 1 : Marge, 0,1594069 ; Erreur standard de la méthode Delta, 0,00117 ; z, 136,25 ; Probabilité supérieure à z, 0,000 ; Intervalle de confiance à 95 pour cent, 0,1571138, 0,1617.

La rangée 6 : Soulignement prédit 3 soulignement à 2 : Marge, 0,1724315 ; Erreur standard de la méthode delta, 0,0008886 ; z, 194,05 ; Probabilité supérieure à z, 0,000 ; Intervalle de confiance à 95 pour cent, 0,17068991, 0,1741731.

Figure 7 : Probabilité prédite de tomber dans chaque groupe d’intensité de l’activité physique au cours des 30 derniers jours pour les répondants avec et sans arthrite, âgés de 30 à 64 ans, les autres variables étant maintenues à leur moyenne, 2013 BRFSS.

Un tableau montre la probabilité prédite de se situer dans chaque groupe d'intensité de l'activité physique au cours des 30 derniers jours pour les répondants avec et sans arthrite, âgés de 30 à 64 ans.

La colonne de gauche du tableau en bas comporte deux colonnes de chiffres sous les mots « _predict#_at ». Les chiffres 1 à 3 à gauche correspondent à chacune des catégories correspondant à différents niveaux de pénibilité de l’activité. Les chiffres 1 et 2 à droite sont les deux profils différents que nous avons créés pour déterminer si une personne interrogée souffre d’arthrite ou non. Les détails de ces profils peuvent être vus dans les informations au-dessus du tableau.

Les probabilités prédites et leurs intervalles de confiance sont estimés à l’aide de la simulation après estimation. Une discussion complète de ce processus dépasse le cadre de cet exemple, mais brièvement, le processus calcule 1 000 ensembles de probabilités prédites en simulant les valeurs des coefficients du modèle en fonction de leurs valeurs, variances et covariances estimées. Pour plus d’informations, voir « Making the Most of Statistical Analyses : Improving Interpretation and Presentation » par King, Tomz et Wittenberg (American Journal of Political Science, 44(2), 341-355).

La meilleure façon d’explorer les changements dans les probabilités prédites impliquant une variable indépendante avec plus de deux valeurs est de produire une figure comme celle de la figure 8. La figure 8 présente la probabilité prédite de tomber dans l’un des trois niveaux d’activité pour les répondants de chacun de ces trois groupes d’âge tout en maintenant les deux autres variables indépendantes du modèle à leur moyenne respective. La hauteur de chaque barre rend compte de la taille de la probabilité prédite.

Le premier diagramme à barres est intitulé « moins de 30 ans égale non, 65 ans et plus égale non. » L’axe vertical désigne la probabilité allant de 0 à 0,6, et l’axe horizontal désigne la catégorisation de l’IMC allant de 0 à 2.

Les probabilités prédites estimées des répondants aux différentes classifications de l’IMC sont les suivantes : (0, 0,28) ; (1, 0,55) ; (2, 0,18).

Le deuxième graphique à barres est intitulé « moins de 30 ans égale non, 65 ans et plus égale oui. » Les probabilités prédites estimées des répondants aux différentes classifications d’IMC sont les suivantes : (0, 0,30) ; (1, 0,25) ; (2, 0,41).

Le troisième histogramme est intitulé « moins de 30 ans égale Oui, 65 ans et plus égale Non ». Les probabilités prédites estimées des répondants aux différentes classifications d’IMC sont les suivantes : (0, 0,28) ; (1, 0,66) ; (2, 0,05).

Figure 8 : Probabilité prédite des répondants se situant dans chacune des trois catégories de la variable dépendante selon différentes valeurs de l’âge, tout en maintenant toutes les autres variables indépendantes du modèle à leurs moyennes respectives, 2013 BRFSS.

Un ensemble de trois graphiques à barres représente la probabilité prédite que les répondants tombent dans chacune des trois catégories sur la variable dépendante à travers différentes valeurs d'âge.

Pour produire ce graphique, retournez à la boîte de dialogue « Sélecteur de post-estimation » qui devrait toujours être ouverte. Assurez-vous que « Analyses personnalisées et à haute dimension » est toujours en surbrillance.

Appuyez sur Launch pour rouvrir la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux ».

Sélectionnez à nouveau l’onglet « At » comme précédemment. Vous verrez les deux spécifications précédentes dans la boîte « At specifications (modify settings from above) ». Mettez-les en surbrillance en cliquant dessus et désactivez-les en utilisant le bouton « Disable » à droite. Cliquez sur « Créer » pour ouvrir une nouvelle boîte de dialogue « Spécification ».

Comme précédemment, nous l’utilisons pour entrer les valeurs des variables pour le profil choisi. La section « Statistiques » en haut de la boîte de dialogue « Spécification 1 » peut être utilisée pour définir les variables pertinentes (dans ce cas, femme et arthrite) à leur moyenne. Cochez « 1 » en cliquant sur la case située à sa gauche, et la zone de texte « Statistiques » située à droite affichera une flèche avec un menu déroulant. Sélectionnez « Moyennes ». Dans la case « Covariables », utilisez les options déroulantes pour sélectionner « Femme ». Faites de même pour l’arthrite dans la ligne ci-dessous.

Puis, utilisez la section « Valeurs fixes » comme précédemment pour sélectionner les valeurs pour les moins de 30 ans et les 65 ans et plus. Comme nous examinons le changement des probabilités prédites à travers trois catégories d’âge, nous devons créer trois spécifications pour chacun des groupes d’âge, avec les âges fixés aux valeurs suivantes :

  • Moins de 30 ans-moins de 30 ans 1 âge65plus 0
  • 30-64-moins de 30 ans 0 âge65plus 0
  • 65 et plus-moins de 30 ans 0 âge65plus 1

La première de ces spécifications est illustrée à la figure 9.

Une fois que les trois nouvelles spécifications apparaissent dans la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux », cliquez sur OK pour produire les probabilités prédites.

Pour entrer la commande directement dans la fenêtre de commande de Stata, le code est le suivant :

margins, at((mean) female (mean) arthritis under30=(1) age65plus=(0)) at((mean) female (mean) arthritis under30=(0) age65plus=(0)) at((mean) female (mean) arthritis under30=(0) age65plus=(1))

Appuyez sur Entrée pour produire les probabilités prédites pour les profils sélectionnés.

La boîte de dialogue intitulée « Spécification 3 » peut être divisée en trois sections intitulées « Statistiques », « Valeurs fixes » et « Expressions ». La section supérieure intitulée « Statistiques » est en outre divisée en deux panneaux, gauche et droit, qui apparaissent comme suit:

Panneau gauche, Statistiques:

  • (case cochée) 1 : Texte « Moyens, » (bouton déroulant)
  • (case cochée) 2 : Texte « Moyens, » (bouton déroulant)
  • (case vide) 3 : barre de texte vide, 50 (bouton déroulant), en mode niveaux de gris
  • (case vide) 4 : barre de texte vide, 50 (bouton déroulant), en mode niveaux de gris

Panneau de droite, covariables :

  • Texte « femme », bouton déroulant
  • Texte « arthrite », bouton déroulant
  • Barre de texte vide, bouton déroulant
  • Barre de texte vide, bouton déroulant

Une note en bas de page indique : « Les covariables peuvent également être soulignées all (toutes les covariables) dot underscore factor (toutes les covariables factorielles) dot et underscore continuous (toutes les covariables continues). »

La section centrale intitulée « Valeurs fixes » est en outre divisée en deux panneaux, gauche et droit, qui apparaissent comme suit :

Panneau gauche, Covariate:

  • (case cochée) 1 : moins de 30 ans (bouton déroulant)
  • (case cochée) 2 : âge 65 plus (bouton déroulant)
  • (case vide) 3 : barre de texte vide (bouton déroulant)
  • (case vide) 4 : barre de texte vide (bouton déroulant)

Panneau de droite, Numlist :

  • 1
  • 0 (barre de texte sélectionnée)
  • Barre de texte vide
  • Barre de texte vide

La section inférieure intitulée « Expressions » est en outre divisée en deux panneaux, gauche et droit, qui apparaissent comme suit :

Panneau gauche, Covariate :

  • (case vide) 1 : barre de texte vide (bouton déroulant)
  • (case vide) 2 : barre de texte vide (bouton déroulant)
  • (case vide) 3 : barre de texte vide (bouton déroulant)
  • (case vide) 4 : barre de texte vide (bouton déroulant)

Panneau de droite, Expression :

  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris
  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris
  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris
  • Barre de texte vide, avec bouton « Créer » en mode niveaux de gris

Deux boutons, « OK » et « Annuler », apparaissent dans le coin inférieur droit de la boîte de dialogue, avec le bouton OK dans le mode sélectionné.

Figure 9 : Sélection des valeurs pour chacun des groupes d’âge, en maintenant les autres variables à leurs moyennes à l’aide de la boîte de dialogue « marges – Moyennes marginales, marges prédictives et effets marginaux » dans Stata.

Une capture d'écran montre la boîte de dialogue de spécification pour sélectionner les valeurs des covariables.

Pour tracer les résultats, revenez à la boîte de dialogue du sélecteur de post-estimation. Sélectionnez « Tracés de profil après analyse marginale », comme indiqué sur la figure 10.

La boîte de dialogue intitulée « Sélecteur de post-estimation » consiste en une liste de commandes sous le titre « Commandes de post-estimation ». Les éléments apparaissent comme suit :

  • Analyse marginale (vue étendue)
    • Moyens marginaux et effets marginaux, analyses fondamentales
    • Moyennes marginales et analyse d’interaction (vue réduite)
    • Contraste des moyennes marginales (vue réduite)
    • Effets marginaux d’une covariable aux valeurs d’une autre covariable (vue étendue)
      • Moyenne de la population (échantillon de surestimation moyenne)
      • -.
        Aux moyennes de l’échantillon
    • Effets marginaux de toutes les covariables (vue élargie)
      • Analyses personnalisées et hautementdimensionnelles
      • Plots de profil après analyse marginale (mise en évidence)
  • Tests, contrastes, et comparaisons des estimations de paramètres (vue réduite)
  • Spécification, diagnostic, et analyse de qualité d’ajustement (vue réduite)
  • Prédictions (vue réduite)
  • Autres rapports (vue réduite)
  • Gérer les résultats d’estimation (vue réduite)

Un bouton « Lancer » et un bouton « Annuler » apparaissent respectivement dans le coin supérieur droit et le coin inférieur droit de la fenêtre.

Figure 10 : Production d’un graphique de résultats à l’aide de la boîte de dialogue du sélecteur de post-estimation dans Stata.

Une capture d'écran montre la boîte de dialogue du sélecteur de post-estimation pour lancer une commande.

Appuyez sur Launch pour ouvrir la boîte de dialogue « marginsplot – Graphique des résultats des marges ». Sur l’onglet « Principal », dans la troisième zone de texte intitulée « Créer des sous-graphes pour les groupes définis par des variables : », sélectionnez les deux variables d’âge dans les options déroulantes, comme indiqué sur la figure 11.

Cliquez sur le bouton « Options » sur le côté de la zone de texte. Cela ouvre une nouvelle boîte de dialogue « Par étiquette de dimension ». Cochez « Inclure le nom de la variable et les signes égaux dans toutes les étiquettes », comme dans la figure 12.

La boîte de dialogue est intitulée « marginsplot – Graphique des résultats des marges. » Une barre de menu apparaît immédiatement sous la barre de titre avec 12 onglets comme, « Principal », « Étiquettes », « Tracé », « Tracé CI », « Par paire », « Ajouter des tracés », « Axe Y », « Axe X », « Titres », « Légende », « Global » et « Par options », avec l’onglet « Principal » dans le mode sélectionné.

L’autre contenu de la boîte de dialogue apparaît sous le titre « Dimensions » comme suit :

  • Variable(s) qui définit l’axe des x, avec une barre de texte vide et un menu déroulant et un bouton « Options » à côté.
  • Créer des tracés pour des groupes définis par des variables, avec une barre de texte vide et un menu déroulant et un bouton « Options » à côté.
  • Créer des sous-graphes pour des groupes définis par des variables, avec une barre de texte en mode sélectionné qui dit : « à (moins de 30 ans) à (65 ans et plus). » La barre de texte a également un menu déroulant avec elle et un bouton « Options » à côté.
  • Créer des graphiques pour des groupes définis par des variables, avec une barre de texte vide et un menu déroulant et un bouton « Options » à côté.

Une liste de contrôle en dessous apparaît comme suit :

  • (case vide) Permuter les axes x et y (graphique horizontal)
  • (case vide) Ne pas tracer les intervalles de confiance
  • (case vide) Nom du graphique, ou talon si plusieurs graphiques, avec une barre de texte vide en dessous
  • (case à cocher vide) Remplacer le graphique s’il existe déjà en mémoire, en mode niveaux de gris

Trois boutons, « OK », « Annuler » et « Soumettre », apparaissent dans le coin inférieur droit de la boîte de dialogue, avec le bouton OK dans le mode sélectionné.

Figure 11 : Utilisation de la boîte de dialogue marginsplot pour tracer les probabilités prédites dans Stata.

Une capture d'écran montre la boîte de dialogue marginsplot pour tracer les probabilités prédites dans Stata.

La boîte de dialogue est intitulée « Par étiquette de dimension ». Les autres contenus de la boîte de dialogue apparaissent comme suit :

Ligne 1 : Remarque : Ces paramètres remplacent les paramètres par défaut et les paramètres de l’onglet Étiquette

Ligne 2 : Liste des chaînes de guillemets pour étiqueter chaque niveau de la dimension

Ligne 3 : (barre de texte vide dans le mode sélectionné)

Ligne 4 : Liste des étiquetages énumérés, exemple 1 « un » 2 « deux » ellipse

Ligne 5 : (barre de texte vide) Étiqueter les groupes avec leurs valeurs, pas leurs étiquettes

Ligne 6 : (case vide cochée) Renoncer au nom de variable et aux signes égaux dans toutes les étiquettes, en mode niveaux de gris

Ligne 7 : (case à cocher vide) Inclure le nom de la variable et les signes égaux dans toutes les étiquettes

Ligne 8 : (case vide cochée) Séparateur pour les étiquettes lorsque plusieurs variables sont spécifiées

Ligne 9 : (barre de texte vide) en mode niveaux de gris

Ligne 10 : (case à cocher vide) Ne pas utiliser de séparateur entre les étiquettes

Trois boutons, « OK », « Annuler » et « Soumettre », apparaissent dans le coin inférieur droit de la boîte de dialogue, avec le bouton OK dans le mode sélectionné.

Figure 12 : Sélection des options d’étiquettes à l’aide de la boîte de dialogue marginsplot dans Stata.

Une capture d'écran montre la boîte de dialogue marginsplot pour sélectionner les options d'étiquette.

Sur l’onglet « Plot », montré dans la Figure 13, sélectionnez « Bar » dans les options déroulantes « Plot type » en haut.

La boîte de dialogue est intitulée « marginsplot – Graphique des résultats des marges. » Une barre de menu apparaît immédiatement sous la barre de titre avec 12 onglets comme, « Principal, » « Labels, » « Plot, » « CI plot, » « Pairwise, » « Add plots, » « Y axis, » « X axis, » « Titles, » « Legend, » « Overall, » et « By options, » avec l’onglet « Plot » dans le mode sélectionné.

Un menu déroulant apparaît sous la barre de menu intitulé « Plot type » avec « Bar » sélectionné dans le menu. Il montre en outre une boîte de liste intitulée « Sélectionner le tracé » avec une liste d’éléments apparaissant comme suit :

  • Tous les tracés (sélectionnés)
  • Plot 1
  • Plot 2
  • Plot 3
  • Plot 4
  • Plot 5
  • Plot 6
  • Plot 7
  • Plot 8

Un onglet « Propriétés de la barre » apparaît à côté de la zone de liste. Un texte en bas de page indique : « Les tracés présentés ici ne reflètent pas nécessairement le nombre de tracés réels pour le graphique. »

Trois boutons, « OK », « Annuler » et « Soumettre », apparaissent dans le coin inférieur droit de la boîte de dialogue, le bouton OK étant en mode sélectionné.

Figure 13 : Sélection d’un graphique à barres à l’aide de la boîte de dialogue marginsplot dans Stata.

Une capture d'écran montre la boîte de dialogue marginsplot pour sélectionner un graphique à barres.

Stata fournit d’autres options pour rendre le graphique plus présentable. Dans ce cas, nous allons sélectionner une seule autre option. Sélectionnez l’onglet « Axe des X » et, dans la zone de texte « Titre », écrivez « Niveau d’activité » pour étiqueter l’axe des x, comme le montre la figure 14.

Cliquez sur OK pour produire le graphique des probabilités prédites d’être dans chaque catégorie de niveau d’activité pour la plage de valeurs sélectionnées, comme le montre la figure 8.

Pour entrer la commande directement dans la fenêtre de commande Stata, le code est le suivant :

marginsplot, bydimension(at(under30) at(age65plus), nosimplelabels) recast(bar) recastci(rbar) xtitle(BMI category)

Appuyez sur Entrée pour produire le graphique à barres.

La boîte de dialogue est intitulée « marginsplot – Graphique des résultats des marges ». Une barre de menu apparaît immédiatement sous la barre de titre avec 12 onglets comme, « Principal, » « Étiquettes, » « Tracé, » « Tracé CI, » « Par paire, » « Ajouter des tracés, » « Axe Y, » « Axe X, » « Titres, » « Légende, » « Globale, » et « Par options, » avec l’onglet « Axe X » dans le mode sélectionné.

Une barre de texte sous le nom « Titre » montre l’élément « Niveau d’activité » avec un onglet « Propriétés » apparaissant à côté. Un ensemble de cinq autres onglets apparaît sous la barre de texte comme, « Propriétés de la coche/étiquette majeure », « Propriétés de la coche/étiquette mineure », « Propriétés de l’échelle de l’axe » et « Lignes de référence. » Ceci est suivi par deux options avec des cases à cocher comme suit :

  • (case vide) Masquer l’axe
  • (case vide) Placer l’axe sur le côté opposé du graphique

Trois boutons, « OK », « Annuler » et « Soumettre », apparaissent dans le coin inférieur droit de la boîte de dialogue, avec le bouton OK dans le mode sélectionné.

Figure 14 : étiquetage de l’axe des X à l’aide de la boîte de dialogue marginsplot dans Stata.

Une capture d'écran montre la boîte de dialogue marginsplot pour étiqueter l'axe des X.

Une interprétation complète des résultats d’un modèle logit multinomial présenterait des tableaux ou des figures similaires pour chaque variable indépendante du modèle.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.