Formation sur mesure DuckDB

DuckDB est un moteur de bases de données open source et gratuit. Léger, il se connecte à la plupart des sources de données existantes, à commencer par les plus courantes : csv, json, xlsx, parquet, y compris dans leurs applications géographiques. Il propose, sans l’imposer, son propre format de stockage.

DuckDB s’appuie sur le langage de requête SQL, supportant ses évolutions les plus récentes, qui en facilitent encore l’usage. Il se démarque par un démarrage instantané et une vélocité spectaculaire, même avec de gros volumes de données.

La formation sur mesure et avancée que nous proposons s’adresse à des praticiens de R, Python/Pandas ou Excel qui souhaitent donner plus de puissance, d’élégance et de robustesse à leurs requêtes quotidiennes. Elle s’appuie sur plusieurs décennies de pratique du requêtage de bases de données. 

À qui s’adresse cette formation ?

Profil des stagiaires

Analystes de toute sorte de jeux de données, équipes souhaitant se concentrer sur un langage standard et pérenne et contourner les barrières à l’entrée des outils classiques (SGBD ou environnements lourds, outils payants), accélérer les traitements, faciliter explorations et partages.

Besoins des stagiaires

  • accéder facilement à toute sorte de jeux de données, en ligne et en local, de façon instantanée, dans un environnement de travail simplifié 
  • accélérer les traitements de données dans un process R ou Python
  • mener des calculs spatiaux sans recourir à des outils complexes comme PostGIS ou QGIS

Bases souhaitées

  • Connaissance et pratique soutenue de l’interrogation de jeux de données en open data 
  • Maitrise préalable d’un langage d’interrogation (par ex. : R, Pandas, JavaScript, Arquero)
  • Notions en bases de données relationnelles : colonnes et types, jointures

Objectifs de la formation

  • Savoir traduire un besoin de données en requête SQL
  • Lire différents formats de données : CSV, JSON, GeoJSON, Parquet et Geoparquet, xlsx, etc., en ligne ou en local
  • Maitriser les meilleures pratiques du SQL moderne que DuckDB promeut, plus amical, plus lisible et modulable
  • Maitriser l’extension spatiale de DuckDB et en anticiper les évolutions, notamment vers GeoArrow
  • Utiliser DuckDB dans différents environnements : DBeaver, Python, R & JavaScript

Contenu et déroulé

  • Jour 1 : exemples simples, améliorations spectaculaires et/ou ludiques de scripts existants, connexions à de nombreuses et variées sources de données, SQL tout terrain et amical, nettoyages et restructurations
  • Jour 2 : tâches avancées : discrétisations, requêtes spatiales, macros et variables SQL, facteurs de performance

Formateur

Éric Mauvière

Points forts

Groupe à taille humaine, avec 4 à 8 stagiaires maximum, favorisant les interactions entre stagiaires et avec le formateur, en présence.

Formateur statisticien et rédacteur disposant d’une expérience longue et concrète des traitements statistiques et des outils proposés.

Scripts, jeux de données et enjeux issus de l’environnement de travail quotidien des stagiaires. 

Modalités pratiques

Préparation de la formation

  • Entretien préalable avec le commanditaire et chaque stagiaire
  • Constitution du groupe de stagiaires : 4 à 8 personnes, aux besoins proches
  • Identification de cas concrets fournis par les stagiaires 
  • Adaptation des exercices en fonction des cas concrets retenus
  • La formation s’organise en présence avec un groupe issu d’un même organisme, dans les locaux de l’organisme

Moyens pédagogiques et techniques

  • Documents Observable et scripts SQL à compléter, avec jeux de données de travail fournis
  • Exemples issus de l’environnement de travail des stagiaires, correspondant à des besoins pratiques
  • Mise en perspective historique et documentaire des concepts présentés, liens vers de nombreuses ressources « pour en savoir plus » sélectionnées avec soin

Modalités d’évaluation de la formation

  • Cahier d’exercices individuel 
  • Feedback collectif en fin de chaque journée
  • Questionnaire « à chaud » communiqué à chaque stagiaire, rempli en fin de chaque journée
  • Questionnaire « à froid » communiqué à chaque stagiaire à l’issue de la formation (rendu dans la semaine suivante)
  • Questionnaire « à froid » + entretien avec le commanditaire quelques semaines après la formation, pour apprécier l’efficacité de la formation vue de l’extérieur.

Nous sommes à votre écoute
pour tout besoin spécifique :
contactez-nous.

Contact

Le formulaire de contact permet à tout candidat de demander des renseignements sur la formation qui l’intéresse et de s’inscrire. Un livret d’accueil (CGV, CGU, règlement intérieur, convention-type, modalités d’accueil, modèles de convocation, feuille de présence, modalités de rétractation, grille d’évaluation initiale et finale, accueil des personnes en situation de handicap) vous sera adressé si vous le souhaitez. Nous nous engageons à répondre à toute demande dans un délai de 1 jour ouvré. Les délais d’organisation d’une formation sont au maximum de 2 mois. 

Prochaines dates : 18-19 octobre 2024.

Les personnes en situation de handicap sont invitées à nous contacter, afin d’étudier ensemble les possibilités de bénéficier de la formation dans les meilleures conditions.

Tarif

  • Facturation possible avec exonération de TVA
  • 4 000 € HT par groupe de 6 pour deux journées, préparation sur mesure comprise

Retours d'expérience

“Cette formation m’a été très utile pour acquérir de bonnes pratiques et de l’efficacité dans mon code.”

“Les supports sont vraiment de qualité ; je n’ai pas eu le temps de réaliser les autres exercices proposés mais j’ai déjà pu progresser très vite lors de ces 2 jours.”

Dernière mise à jour de cette page : septembre 2024