ARCHIVÉ – État de santé et capital social des nouveaux immigrants : données probantes issues de l’Enquête longitudinale auprès des immigrants du Canada

Informations archivées

Les informations archivées sont fournies aux fins de référence, de recherche ou de tenue de documents. Elles ne sont pas assujetties aux normes Web du gouvernement du Canada et n'ont pas été modifiées ou mises à jour depuis leur archivage. Pour obtenir ces informations dans un autre format, veuillez communiquez avec nous.

Modèles économétriques

Comme nous l’avons déjà mentionné, les données de l’ELIC sont longitudinales, c’est-à-dire qu’elles sont constituées d’un très grand nombre de fichiers de micro-données transversales – qui comprennent des milliers d’individus et couvrent trois périodes. Pour pouvoir modéliser la probabilité de se déclarer en bonne santé chez les immigrants, tout en prenant en considération l’hétérogénéité individuelle, des modèles de données recueillies au moyen d’un panel sont appliqués à notre analyse de régression en contrôlant le stock individuel de capital social et les autres variables socio-démographiques. Le principal avantage du modèle de données recueillies au moyen d’un panel est la possibilité de modéliser les différences de comportement d’un individu à l’autre. Les techniques de modélisation de données recueillies au moyen d’un panel se concentrent sur l’hétérogénéité à travers les unités plutôt que sur l’autocorrélation de séries chronologiques. Le cadre de travail de base des modèles binaires de données recueillies au moyen d’un panel est un modèle à équation unique :

Expliquez ci-dessous    i = 1,…, n; t = 1,…, Ti.

Expliquez ci-dessous

Ici, y* est une variable latente de la probabilité qu’un immigrant déclare être en bonne santé. X est une collection de variables indépendantes temporalisées k dénotée par le vecteur x’ = (x1, x2, …, xk). Z est une collection de m variables indépendantes fixes dans le temps dénotée par le vecteur z’ = (z1, z2, …, zm). Les deux collections X et Z sont observables. Les variables descriptives comprennent également un ensemble de variables fictives pour chacun des cycles du panel afin de saisir les effets temporels. E est un terme d’erreur dont la moyenne est zéro et dont la distribution logistique normalisée comporte une variance de π2/3. L’indice inférieur i est un indice pour les unités transversales, et t est un indice pour les périodes (T = 3). L’effet individuel latent v’ia saisissant l’hétérogénéité entre les individus qui détermine la probabilité d’une bonne santé comprend notamment un ensemble de facteurs individuels particuliers qui sont non observables, tels que la différence individuelle au chapitre de la personnalité ou des capacités, les caractéristiques du groupe ou de la famille, et les comportements en matière de santé. On suppose que vi et Eit ne sont pas corrélés entre eux.  

Pour faire l’estimation du modèle de données recueillies au moyen d’un panel, la question primordiale est de déterminer si les effets individuels vi sont corrélés avec les variables explicatives X et Z (Greene 2002; Jones 2007). Par comparaison avec le modèle à effets aléatoires, l’approche des équations d’estimations généralisées (GEE) proposée par Liang et Zeger (1986) ainsi que par Zeger, Liang, et Albert (1988) peut être utilisée pour estimer les effets selon le modèle moyen de population. Le modèle GEE est une extension de l’approche du modèle linéaire généralisé (GLM) pour l’analyse de données longitudinales à l’aide d’une estimation par quasi-vraisemblance. Le modèle GEE comporte des solutions cohérentes et asymptotiquement normales, et ce, malgré des erreurs de spécification dans la structure de corrélation, parce que l’hypothèse de l’indépendance des effets individuels non observés  par rapport aux variables explicatives n’est pas requise dans le modèle (Hu et coll. 1998). L’approche GEE assouplit l’hypothèse de la stricte indépendance de l’estimation des effets aléatoires et prend en considération la dépendance des unités entre elles. De plus, des variables fixes dans le temps comme la catégorie d’immigrants, le groupe ethnique, et la région d’origine peuvent être incluses dans la régression comme faisant partie de X, ce qui est impossible dans le cas du modèle avec effets fixes. Le modèle GEE est approprié lorsque les inférences au sujet de la moyenne d’une population sont le principal centre d’intérêt. Dans la présente recherche, l’écart moyen entre les groupes possédant un stock divers de capital social est ce qui nous intéresse principalement, et non l’écart pour un immigrant en particulier. De ce fait, nous présentons nos résultats en adoptant le cadre de travail du modèle GEE dans le présent document [ note 8 ].


8 Dans le présent document, nous présentons uniquement les résultats obtenus à l’aide des modèles GEE, les résultats obtenus à l’aide de modèles à effets aléatoires et de modèles à effets fixes peuvent être fournis sur demande.

 

Date de modification :