Une version actualisée de ce chapitre est disponible sur guide-R : Quel modèle choisir ?

Ce chapitre est évoqué dans le webin-R #21 (trajectoires de soins : un exemple de données longitudinales 5 : modèle à observations répétée, régression logistique ordinale GEE & analyse de survie multi-états) sur YouTube.

Tableau synthétique

Variable à expliquer Type de modèle Interprétation des coefficients Modèle de base Échantillonnage complexe Modèle mixte GEE*
Continue Linéaire directe stats::lm()   lme4::lmer()  
  Gaussien directe stats::glm (family = gaussian) survey::svyglm
(family = gaussian)
lme4::glmer (family = gaussian) geepack::geeglm (family = gaussian)
Comptage
(nombre d’occurences)
Poisson RR
(risques relatifs)
stats::glm (family = poisson) survey::svyglm
(family = quasipoisson)
lme4::glmer (family = poisson) geepack::geeglm (family = poisson)
  Binomial négatif RR
(risques relatifs)
MASS::glm.nb() sjstats::svyglm.nb()

svrepmisc::svynb()
lme4::glmer.nb()  
Ratio / Incidence Poisson avec offset IRR
(incidence rate ratio)
stats::glm (family = poisson) survey::svyglm
(family = quasipoisson)
lme4::glmer (family = poisson) geepack::geeglm (family = poisson)
  Binomial négatif avec offset IRR
(incidence rate ratio)
MASS::glm.nb() sjstats::svyglm.nb()

svrepmisc::svynb()
lme4::glmer.nb()  
Binaire
(oui / non)
Logistique (logit) OR
(odds ratio)
stats::glm (family = binomial("logit")) survey::svyglm
(family = quasibinomial("logit"))
lme4::glmer (family = binomial("logit")) geepack::geeglm (family = binomial("logit"))
  Probit pas interprétable directement stats::glm (family = binomial("probit")) survey::svyglm
(family = quasibinomial("probit"))
lme4::glmer (family = binomial("probit")) geepack::geeglm (family = binomial("probit"))
  Log binomial RR
(risques relatifs)
PR
(prevalence ratio)
stats::glm (family = binomial("log")) survey::svyglm
(family = quasibinomial("log"))
lme4::glmer (family = binomial("log")) geepack::geeglm (family = binomial("log"))
Catégorielle ordinale
(3 modalités ou plus)
Régression logistique ordinale OR
(odds ratio)
ordinal::clm()

VGAM::vglm (family = cumulative(parallel = TRUE))

MASS::polr()
svrepmisc::svyclm()

svyVGAM::svy_vglm (family = cumulative(parallel = TRUE))

survey::svyolr()
ordinal::clmm() geepack::ordgee()

multgee::ordLORgee()
Catégorielle nominale
(3 modalités ou plus)
Régression logistique multinomiale OR
(odds ratio)
nnet::multinom()

VGAM::vglm (family = multinomial)
svrepmisc::svymultinom()

svyVGAM::svy_vglm (family = multinomial)
  multgee::nomLORgee()
Survie
(time to event)
Cox HR
(hazard ratio)
survival::coxph() survey::svycoxph() survival::coxph() avec un terme frailty

coxme::coxme()
survival::coxph() avec l’option cluster
  Modèle à temps discret binomial cloglog HR
(hazard ratio)
stats::glm (family = binomial("cloglog")) survey::svyglm
(family = quasibinomial("cloglog"))
lme4::glmer (family = binomial("cloglog")) geepack::geeglm (family = binomial("cloglog"))
  Accelerated failure time (AFT) HR
(hazard ratio)
survival::survreg() survey::svysurvreg() survival::survreg() avec un terme frailty survival::survreg() avec l’option cluster
Comptage avec surreprésentation de zéros Zero-inflated Poisson OR & RR pscl::zeroinfl() sjstats::svyglm.zip() glmmTMB::glmmTMB(family = poisson)  
  Zero-inflated negtaive binomial OR & RR pscl::zeroinfl (dist = "negbin") sjstats::svyglm.zip (dist = "negbin")    

* Voir aussi gee::gee comme alternative à geepack::geeglm