Prise en compte des facteurs de confusion non observés dans les bases de données médico-administratives

Dans les bases de données médico-administratives, l’information sur les facteurs de confusion potentiels est souvent manquante. Ainsi les études d’observation sur ces bases de données peuvent conduire à des résultats biaisés. L’intégration d’informations supplémentaires issues de données de cohortes provenant de la même population pourrait considérablement réduire le biais de confusion.

Ce projet vise à comparer et étendre les méthodes d’imputation multiples (MICE) et de calibration en 2 étapes (TSC) pour prendre en compte les facteurs de confusion non observés dans les bases de données médico–administratives (BDDMA) en utilisant des données de cohortes comme échantillon de validation.

Dans un premier travail, nous avons comparé par simulations les performances de MICE et TSC lorsque la cohorte est représentative de la population sur laquelle la BDDMA est constituée et sous différents écarts à cette hypothèse de représentativité. Nous avons également proposé une version d’imputation multiple consistant à imputer le score de propension, plus économe en temps de calcul que la méthode MICE. Ce travail a permis d’établir des recommandations sur l’usage de ces méthodes suivant que l’échantillon de validation est interne (sous-échantillon de la BDDMA) ou externe et suivant les hypothèses qui peuvent être faites (et pour certaines vérifiées) sur la représentativité de l’échantillon de validation. Ces recommandations ont été illustrées sur une étude de l’association entre l’exposition aux benzodiazépines et les fractures chez les personnes âgées à partir de l’Echantillon généraliste des Bénéficiaires (EGB) et de la cohorte Paquid.

Dans un second travail, nous avons étendu la méthode TSC, la plus prometteuse dans l’étude précédente, afin de remédier au problème de sous-estimation de la variance mis en évidence précédemment et d’obtenir des estimations robustes lorsque les distributions de l’exposition et de la variable réponse sont différentes dans l’échantillon de validation et la BDDMA. Une estimation pondérée permet d’assurer la robustesse de la méthode et l’ajustement sur les facteurs de confusion plutôt que sur le score de propension permet une estimation correcte de la variance du paramètre d’intérêt. La méthode a été implémentée et validée par simulations. Une illustration sur données réelles est prévue.


Valorisation de la recherche

 

Speech

Communications en congrès

Silénou B, Avalos M, Pariente A, Jacqmin-Gadda H. Adjustment for unobserved confounders in health administrative databases: Data enrichment using cohorts’ information

Jacqmin-Gadda H, Silénou B, Helmer C, Pariente A. Weighted two-stage calibration for adjustment on unobserved confounders with non-representative validation sample.

Silénou B, Avalos M, Helmer C, Berr C, Pariente A, Jacqmin-Gadda H. Prise en compte des facteurs de confusion non observés dans les bases de données médico-administratives

Avertissement : Le contenu de la publication n’engage que ses auteurs et ne reflète pas nécessairement la position de l’ANSM