Aller au contenu principal

Écosystème et bonnes pratiques

Progression

#Écosystème et bonnes pratiques

Un projet d’analyse de données doit être reproductible. R dispose d’un écosystème riche pour versionner les dépendances, automatiser les rapports et distribuer des bibliothèques.

#1. Gestion des dépendances

renv fige les packages utilisés dans un projet. Après un renv::init(), chaque installation est enregistrée dans renv.lock. Sur une autre machine, renv::restore() reproduit exactement l’environnement. Cette discipline évite les surprises lorsqu’un package change de comportement entre deux versions.

#2. Reporting reproductible

Les notebooks Quarto fusionnent texte, code et graphiques. Ils peuvent être exportés en HTML, PDF ou slides. Pour automatiser la génération, utilisez quarto render dans un script ou une tâche GitHub Actions. Les rapports deviennent des artefacts versionnés au même titre que le code.

#3. Packaging et tests

Dès que des fonctions se stabilisent, regroupez-les dans un package : usethis::create_package, devtools::document pour la documentation, roxygen2 pour les commentaires. Ajoutez testthat pour écrire des tests unitaires, lintr pour vérifier le style et une action GitHub prédéfinie (usethis::use_github_action_check_standard()) pour automatiser les contrôles.

#Atelier

  1. Créez un package palmaresR contenant un jeu de données d’exemple, deux fonctions de nettoyage et une vignette Quarto qui raconte l’analyse.
  2. Configurez une pipeline GitHub Actions qui exécute R CMD check, testthat et quarto render.
  3. Publiez la documentation avec pkgdown pour offrir un site statique décrivant votre package.