Auteur
Djamila
Chagra
Directeurs de thèse
Solène Lardoux, Alain Gagnon
Jury(s)
Lardoux Solène, Gagnon, Alain
Les données d’enquêtes jouent un rôle primordial dans la production scientifique en sciences sociales. Cependant, la présence de biais dans les données au moment de la collecte, y compris les erreurs de réponse et de non-réponse, pourrait affecter la fiabilité des résultats obtenus. Bien que le problème des erreurs de réponse et de non-réponse soit largement discuté, la littérature existante s’intéresse peu aux mécanismes par lesquels ces erreurs influencent les mesures estimées. Par conséquent, l’objectif principal de cette thèse est d’apporter une contribution méthodologique à la compréhension des estimations d’enquêtes en présence de données erronées et manquantes, en déterminant leur part explicative dans les modèles estimés. À l’aide de deux mesures répétées de l’âge de la première consommation de substances psychoactives recueillies par l’ELNEJ (1994-2009) auprès de jeunes Canadiens à l’âge de 12-13 ans, puis à l’âge de 14-15 ans, cette thèse par articles visait à étudier : (1) les types d’incohérences ou de biais imputés dans la deuxième mesure comparativement à la première (mesure de référence) et ainsi déduire les caractéristiques des répondants dont les déclarations sont incohérentes (Article 1); (2) l’impact de ces biais dans la détermination des prédicteurs de la consommation précoce, c’est-à-dire à l’âge de 13 ans ou moins (Article 2); et (3) leur impact sur la prédiction de la consommation à l’âge de 16-17 ans en fonction de l’âge d’initiation (Article 3). L’impact du biais est déterminé en corrigeant (1) le biais de sélection dû à la censure des répondants ayant des déclarations incohérentes de l’échantillon de l’étude, lorsque l’âge de l’initiation est la variable dépendante dans le modèle estimé (Article 2) ou (2) le biais d’endogénéité dû à la présence de valeurs erronées et manquantes dans l’âge d’initiation, lorsque l’âge d’initiation est une variable explicative dans le modèle estimé (Article 3). 
Le premier article révèle qu’au deuxième passage de l’enquête, les jeunes de 14-15 ans ne fournissent pas nécessairement des âges d’initiation cohérents avec ceux fournis lorsqu’ils avaient 12-13 ans. La proportion d’incohérence enregistrée n’est pas négligeable; elle est de 43 % pour l’alcool, 33 % pour le tabac et 32 % pour la drogue. Ces jeunes sont susceptibles de déclarer des âges d’initiation plus tardifs ou d’omettre l’expérimentation antérieure (biais télescopique vers l’avant: BTA), des âges d’initiation plus hâtifs (biais télescopique vers l’arrière: BTR), et peuvent également ne pas déclarer leur initiation à au moins un des deux cycles d’enquête (Biais non-déclaré : BND). Les résultats de la régression multinomiale montrent que le risque de détecter ces biais n’est pas le fruit du hasard; il varie en fonction des caractéristiques socio-démographiques et personnelles des répondants, notamment le genre, la structure de la famille et la région de résidence. En raison du biais dans la deuxième déclaration de l'âge d'initiation, le deuxième article démontre que l'identification des groupes à risque de consommation précoce est affectée par le potentiel de biais au sein de ces groupes. En utilisant l'approche de Heckman, il a été conclu que les âges d'initiation déclarés plus hâtifs (plus tardifs) génèrent une surestimation (sous-estimation) des risques de consommation précoce (à 13 ans et moins) dans les groupes les plus susceptibles de fournir des âges biaisés vers l'arrière BTR (biaisés vers l'avant BTA). Cependant, ces risques sont sous-estimés dans les groupes qui n’ont pas déclaré leur âge d’initiation lors du premier passage de l’enquête (BND). Ceci indique que pour ces groupes, l’âge d’initiation qui n’a pas été déclaré lors du premier passage est probablement un âge précoce (autour de 12-13 ans). Le troisième article conclut que les biais attribués à l'âge de l'initiation affectent l’estimation de la relation entre l’âge d’initiation et la fréquence de consommation à l'âge de 16-17 ans. Le fait que cette relation soit surestimée ou sous-estimée dépend spécifiquement du type de biais et de sa corrélation avec la consommation ultérieure. Enfin, cette thèse tente de fournir des preuves empiriques mettant en évidence le biais de réponse et de non-réponse comme une source d'information supplémentaire qui caractérise l'échantillon de l'étude et qui sa propre part explicative dans les modèles estimés. La validité des données d'enquête est donc d'une grande utilité pour la validité des résultats des études.
Année de soutenance
2020
Lieu de soutenance
Université de Montréal
Mots clés
Données longitudinales incohérentes et manquantes
Biais télescopique vers l’avant
Biais télescopique vers l’arrière
Âge à l’initiation aux substances psychoactives
Consommation précoce
Impact du biais de déclaration
Sous/surestimation
Biais de sélection/d’endogénéité
Sociologie - Démographie (UMI : 0938)
Sujet
Estimation en présence de données incohérentes : étude de l'impact des biais de déclaration d'âge à l'initiation de la consommation de substances psychoactives à partir de données longitudinales.