Table des matières

Poste fourni par Midori Yajima

Midori Yajima est diplômée d’une maîtrise en écologie avec un projet sur la paléoécologie et a décidé de rejoindre l’atelier en ligne Manipulation de données et analyse statistique en paléoécologie : une masterclass en R, mis en place par le Groupement d’Intérêt Spécial Paléoécologie (PalaeoSIG). Dans cet article, Midori discute de certains faits saillants de l’atelier et souligne l’importance d’une communauté de recherche lors de la navigation dans le domaine de la programmation.

« Les données ont une meilleure idée ». C’était l’enseigne au néon brillante qui m’éclairait depuis l’une des diapositives que le Dr. Gavin Simpson montré dans le cadre de sa présentation. La quantité croissante de données générées change en effet la donne pour presque tous les domaines des sciences, de la technologie, de l’ingénierie, des mathématiques (STEM) et au-delà, et de la nourriture pour ces « meilleures idées ». En fait, les chercheurs ont été témoins d’un élargissement passionnant des questions de recherche qu’ils peuvent traiter, entraînant inévitablement un besoin croissant de boîtes à outils à jour avec un savoir-faire statistique de pointe, des compétences analytiques et des compétences en codage – peut-être aussi un reniflement caché du syndrome de l’imposteur.

Le Palaeo SIG a en effet su faire face à ce besoin. Cet événement est né de l’idée de partager les connaissances et l’expertise entre les membres de la paléoécologique communauté. A ce titre, il a été mis en place comme un atelier de trois jours destiné aux intermédiaires R utilisateurs, plus un séminaire à mi-parcours ouvert à tous ceux qui souhaitent découvrir la variété des applications de R en paléoécologie. Après les sessions de formation dirigées par des experts le matin, les sessions de l’après-midi de l’atelier ont été consacrées au travail individuel, où nous avons soit travaillé en détail les exercices du matin, soit travaillé sur nos propres données. Toutes les sessions ont été soutenues par une salle de discussion virtuelle. Là, les gens pouvaient laisser leurs questions, partager des ressources, se connecter entre eux et avec des experts et des organisateurs, qui étaient toujours là pour offrir leur aide tout au long de l’événement.

Dès le début, le sentiment que j’ai eu était d’être entré dans une pièce où des personnes à différents stades de leur carrière, de différents coins du globe, convergeaient pour apprendre et échanger, quel que soit le niveau d’éducation et cette pandémie partagée qui se passait en arrière-plan. Une tâche difficile, d’autant plus que les espaces en ligne, bien que devenant rapidement la nouvelle norme, présentent toujours un grand potentiel de gêne lorsqu’il s’agit d’interagir avec des personnes derrière un écran.

C’est avec cette prémisse que le professeur Steve Juggings a débuté le premier jour, avant de se lancer dans la lutte contre les données et les flux de travail dans R, c’est-à-dire le processus de nettoyage et de manipulation des données pour les préparer à des analyses ultérieures. En tant que première étape de l’analyse des données et non par hasard le premier sujet de l’atelier, nous avons été guidés à travers les paléo-données en comparant base R et le bien rangé « grammaire », afin que nous puissions apprécier les différences entre les deux, tout en ajoutant progressivement de la complexité à notre flux de travail et en découvrant quelques trucs et astuces en cours de route.

La deuxième journée a été consacrée à un thème qui préoccupe beaucoup, à savoir la nécessité de favoriser la communication entre l’écologie et la paléoécologie. Cette fois, le Dr Simpson était le chaperon qui nous a guidés à travers des méthodes tirées de l’écologie avec le potentiel d’être appliquées aux données paléoécologiques, à savoir les modèles thématiques et l’analyse du réseau d’interactions au sein des communautés que nous étudions. On nous a ainsi montré comment la première peut nous aider à traiter de manière flexible nos données lorsqu’elles comportent trop de variables, tandis que la seconde nous permettrait d’ajouter plus d’informations sur les systèmes d’intérêt.

Les portes ont ensuite été ouvertes à un public plus large pour la journée du séminaire, où onze intervenants ont été répartis en quatre sessions thématiques avec des présentations concernant les données ouvertes et la réplicabilité, les méthodes d’organisation et de traçage des données et la modélisation de scénarios complexes. La dernière session a ensuite été laissée à un avant-goût de la diversité des usages du R traversant les frontières paléoécologiques, qu’il s’agisse d’appuyer la prise de décision locale avec une perspective à long terme sur la dynamique des écosystèmes, comme la dynamique des feux et la gestion sur la ceinture éricacée de Montagnes de balle en Éthiopie avec Dr. Graciela Gil Romera, ou en soutenant les connaissances écologiques en analysant les caractéristiques environnementales telles que la diversité fonctionnelle des plantes sur des échelles de temps plus longues, avec le Dr. Triin Reitalu, ou traitant de données qualitatives et multidisciplinaires telles que celles générées par les sciences citoyennes, historiques et savoir local, avec le Dr. Lizzie Jones.

Le quatrième jour a ensuite été entièrement consacré à l’application de modèles « ondulants » aux données paléo et ainsi à la découverte des merveilles de Modèles additifs généralisés (GAM) comme technique pour apprendre en ajustant différentes fonctions qui suivent les tendances des variables mieux qu’une forme fonctionnelle fixe ne le ferait (« LOESS doit mourir » – a déclaré le Dr Simpson sardonique, se référant à cette méthode de lissage bien connue).

Ainsi, de l’arrière-plan théorique, sur la façon de les implémenter dans R, à l’introduction de modèles plus affinés, tels que les GAM hiérarchiques et les modèles distributionnels, le Dr Simpson nous a guidés à travers les notions et les scripts, en s’assurant qu’il répondait à toutes les questions et commentaires lancés à lui en chemin.

Quelque chose de plus approprié pour conclure le voyage est né d’une de ces questions, à la fin de l’atelier. Pour répondre aux incertitudes de quelqu’un de nouveau dans le domaine de la programmation, les conférenciers et les organisateurs ont alterné des mots de soutien avec des conseils judicieux sur le processus d’apprentissage de R, où “n’importe qui traverse ces problèmes”, “acceptez cela va prendre du temps”, ” il n’y a pas de honte à demander de l’aide » et « chacun a des forces différentes, tout le monde tirera profit de la collaboration » étaient les points récurrents.

Et après tout, la collaboration, la patience et le temps étaient précisément le sujet de ces quatre jours. Nous avons fait l’expérience d’un grand partage de scripts, de ressources et d’informations, chaque session étant enregistrée puis rendue disponible, et en gardant un œil sur l’inclusivité puisque nous pouvions tous activer les sous-titres en direct à volonté. Nous pouvions voir une discussion en cours entre le public et les orateurs, couvrant des sujets spécifiques à des conversations informelles. Surtout, on nous a permis d’explorer pendant un certain temps le monde des chercheurs de haut niveau.

Nous avons ensuite pu entendre certains d’entre eux reconnaître qu’ils ont toujours un sentiment d’admiration tout en faisant face aux rebondissements du codage, et en partageant leur parcours d’apprentissage et leurs conseils. Encore plus, les voir traiter avec des animaux de compagnie, des échecs de connexion, des astuces de Zoom et des intrusions d’enfants ont fait l’affaire pour rendre tout – en particulier leur travail – plus convivial.

C’est avec ce sentiment d’inclusion dans la communauté, étonnamment amplifié par l’espace virtuel dans lequel nous nous trouvions, que j’ai quitté l’atelier. Le sentiment que je suis entré dans un lieu où les gens pouvaient travailler, discuter, comparer, trouver de nouvelles ressources et s’améliorer, de manière tout à fait humaine.

Je tiens à remercier Dr. Suzette Flantua pour être la raison pour laquelle j’ai pu participer à cet atelier en premier lieu et pour son soutien indéfectible. Mes remerciements vont également au Dr. Althéa Davies pour ses précieux commentaires tout au long du processus d’écriture et pour être toujours prêt à aider.

Pour plus d’informations sur le Groupement d’Intérêt Spécial Paléoécologie, visitez le site du SIG ici.




Source link