across() est plus puissant et flexible qu’il n’y parait
Arrivée à maturité il y a deux ans avec sa version 1.0, dplyr introduisait en fanfare l’intriguant élément « across() », destiné à remplacer plus d’une dizaine de fonctions préexistantes.
Dans cette rubrique, sont classés les billets du blog dont l’objet est en relation avec les outils statistiques, au premier rang desquels se trouve R, le logiciel d’analyse statistique le plus couramment utilisé actuellement.
La palette d’outils ou de librairies disponibles est large et en évolution continue. Certaines dénominations ne manquent pas de poésie : R, Tidyverse, D3, Observable, Mapshaper, Apache Arrow, Arquero, Vega-lite…
La plupart des articles de cette rubrique se basent sur des exemples concrets de traitements de données. L’objectif est de permettre au lecteur de comprendre dans le détail les procédures mises en œuvre, pour mieux se les approprier et être capable de les réutiliser dans d’autres contextes. Le lecteur soucieux de tenir à jour ses connaissances trouvera son compte dans ces articles à vocation pédagogique.
Arrivée à maturité il y a deux ans avec sa version 1.0, dplyr introduisait en fanfare l’intriguant élément « across() », destiné à remplacer plus d’une dizaine de fonctions préexistantes.
Quelques réflexions à propos du temps, cette notion qui rend compte du changement dans le monde. Comment on le perçoit. Comment on le représente. Quelle place centrale il occupe pour le statisticien.
Pour construire des tutoriels R sur-mesure, les packages learnr et gradethis fournissent tous les outils nécessaires. RStudio, qui développe ces packages, met en ligne de
Enseigner R, et surtout les services pratiques que R peut rendre, c’est un vrai défi ! L’apprenant doit d’abord installer un environnement logiciel, puis se familiariser avec
Pour constituer et interroger des tables de données, SQL a pavé le chemin de langages simples, déclaratifs, agençant des verbes faciles à comprendre : SELECT,
Dans le contexte actuel de crise sanitaire, la Direction de la recherche, des études, de l’évaluation et des statistiques (DREES) publie désormais (décembre 2020) chaque mois un
Baptiste Coulmont a récemment produit cette superbe animation sur la distribution mensuelle des mariages en France, dont on peut voir la déformation au fil d’une
Cet article évoque un nouveau modèle, celui de l’open data-flow : des flux de données, de traitements et d’enseignements qu’un lecteur saisit pour créer à
En quelques années à peine, Tidyverse a pris une place considérable au sein de l’écosystème R. Pour certains ce fut leur point d’entrée dans l’apprentissage