ggplot2 ou la grammaire des graphiques sous R

Joseph Larmarange, Ceped IRD
Rencontres de statistique appliquée, Ined, 18 juin 2018

DOI

R

  • logiciel libre et gratuit
  • multi-plateforme (Windows, MacOS, Linux)
  • nombreuses fonctions d'import et d'export des données
  • développement très actif (plus de 10 000 extensions)
  • de plus en plus utilisé dans la communauté scientifique
  • interface graphique la plus commune : RStudio
  • rapports automatisés avec Rmarkdown
  • interfaçage possible avec bases SQL
  • serveurs de calcul en ligne (cf. https://r-tools.huma-num.fr)

R et les graphiques

R dispose d'un puissant moteur graphique interne.

Exemples en ligne : https://www.r-graph-gallery.com/

Fonctions graphiques de base :

  • permettent de dessiner dans un graphique (ajout de points, segments, étiquettes…)
  • mais fonctions peu intuitives
  • la production d'un graphique complet nécessite pas mal d'étapes et de codes

R et les graphiques (suite)

Heureusement, il existe de nombreuses extensions graphiques pour R, dont (liste non exhaustive)

  • lattice, particulièrement adapté à la visualisation de panels et de séries temporelles
  • circlize pour les visualisations circulaires
  • igraph ou DiagrammeR pour les réseaux
  • LexisPlotR pour les diagramme de Lexis

ggplot2

  • extension développée par Hadley Wickham
  • met en œuvre la grammaire des graphiques théorisée par Leland Wilkinson
  • est devenue en quelques années l’une des extensions R les plus utilisées
  • appartient au tidyverse, un ensemble d'extensions dédiées à l'analyse de données

Le tidyverse