Écosystème et bonnes pratiques
Progression
#Écosystème et bonnes pratiques
Un projet d’analyse de données doit être reproductible. R dispose d’un écosystème riche pour versionner les dépendances, automatiser les rapports et distribuer des bibliothèques.
#1. Gestion des dépendances
renv
fige les packages utilisés dans un projet. Après un renv::init()
, chaque installation est enregistrée dans renv.lock
. Sur une autre machine, renv::restore()
reproduit exactement l’environnement. Cette discipline évite les surprises lorsqu’un package change de comportement entre deux versions.
#2. Reporting reproductible
Les notebooks Quarto fusionnent texte, code et graphiques. Ils peuvent être exportés en HTML, PDF ou slides. Pour automatiser la génération, utilisez quarto render
dans un script ou une tâche GitHub Actions. Les rapports deviennent des artefacts versionnés au même titre que le code.
#3. Packaging et tests
Dès que des fonctions se stabilisent, regroupez-les dans un package : usethis::create_package
, devtools::document
pour la documentation, roxygen2
pour les commentaires. Ajoutez testthat
pour écrire des tests unitaires, lintr
pour vérifier le style et une action GitHub prédéfinie (usethis::use_github_action_check_standard()
) pour automatiser les contrôles.
#Atelier
- Créez un package
palmaresR
contenant un jeu de données d’exemple, deux fonctions de nettoyage et une vignette Quarto qui raconte l’analyse. - Configurez une pipeline GitHub Actions qui exécute
R CMD check
,testthat
etquarto render
. - Publiez la documentation avec
pkgdown
pour offrir un site statique décrivant votre package.