Quel type de modèles choisir ?
Une version actualisée de ce chapitre est disponible sur guide-R : Quel modèle choisir ?
Ce chapitre est évoqué dans le webin-R #21 (trajectoires de soins : un exemple de données longitudinales 5 : modèle à observations répétée, régression logistique ordinale GEE & analyse de survie multi-états) sur YouTube.
Tableau synthétique
Variable à expliquer | Type de modèle | Interprétation des coefficients | Modèle de base | Échantillonnage complexe | Modèle mixte | GEE* |
---|---|---|---|---|---|---|
Continue | Linéaire | directe |
|
|
||
Gaussien | directe |
|
|
|
|
|
Comptage (nombre d’occurences) |
Poisson | RR (risques relatifs) |
|
|
|
|
Binomial négatif | RR (risques relatifs) |
|
|
|
||
Ratio / Incidence | Poisson avec offset |
IRR (incidence rate ratio) |
|
|
|
|
Binomial négatif avec offset |
IRR (incidence rate ratio) |
|
|
|
||
Binaire (oui / non) |
Logistique (logit) | OR (odds ratio) |
|
|
|
|
Probit | pas interprétable directement |
|
|
|
|
|
Log binomial | RR (risques relatifs) PR (prevalence ratio) |
|
|
|
|
|
Catégorielle ordinale (3 modalités ou plus) |
Régression logistique ordinale | OR (odds ratio) |
|
|
|
|
Catégorielle nominale (3 modalités ou plus) |
Régression logistique multinomiale | OR (odds ratio) |
|
|
|
|
Survie (time to event) |
Cox | HR (hazard ratio) |
|
|
avec un terme frailty
|
avec l’option cluster |
Modèle à temps discret binomial cloglog | HR (hazard ratio) |
|
|
|
|
|
Accelerated failure time (AFT) | HR (hazard ratio) |
|
|
avec un terme frailty |
avec l’option cluster |
|
Comptage avec surreprésentation de zéros | Zero-inflated Poisson | OR & RR |
|
|
|
|
Zero-inflated negtaive binomial | OR & RR |
|
|
* Voir aussi
comme alternative à gee
::gee
geepack
::geeglm