Écosystème et bonnes pratiques
Progression
#Écosystème et bonnes pratiques
Un projet d’analyse de données doit être reproductible. R dispose d’un écosystème riche pour versionner les dépendances, automatiser les rapports et distribuer des bibliothèques.
#1. Gestion des dépendances
renv fige les packages utilisés dans un projet. Après un renv::init(), chaque installation est enregistrée dans renv.lock. Sur une autre machine, renv::restore() reproduit exactement l’environnement. Cette discipline évite les surprises lorsqu’un package change de comportement entre deux versions.
#2. Reporting reproductible
Les notebooks Quarto fusionnent texte, code et graphiques. Ils peuvent être exportés en HTML, PDF ou slides. Pour automatiser la génération, utilisez quarto render dans un script ou une tâche GitHub Actions. Les rapports deviennent des artefacts versionnés au même titre que le code.
#3. Packaging et tests
Dès que des fonctions se stabilisent, regroupez-les dans un package : usethis::create_package, devtools::document pour la documentation, roxygen2 pour les commentaires. Ajoutez testthat pour écrire des tests unitaires, lintr pour vérifier le style et une action GitHub prédéfinie (usethis::use_github_action_check_standard()) pour automatiser les contrôles.
#Atelier
- Créez un package
palmaresRcontenant un jeu de données d’exemple, deux fonctions de nettoyage et une vignette Quarto qui raconte l’analyse. - Configurez une pipeline GitHub Actions qui exécute
R CMD check,testthatetquarto render. - Publiez la documentation avec
pkgdownpour offrir un site statique décrivant votre package.