Le module s'ouvre sur un article extrait du blog de France-inter annonçant la moins grande susceptibilité des individus de groupe sanguin O à être infecté par le COVID19, et chiffrant même cette différence de susceptibilité à 33% par rapport aux autres groupes sanguins.

La critique de cette affirmation et la compréhension plus fine des chiffres avancés est le point de départ d'une réflexion sur la modélisation d'un risque.

Ce module a essentiellement deux objectifs :

  • étendre le champ d'expertise en analyse de données : en s'appuyant sur les acquis du module de L3 Démarche Statistique, il présente les méthodes de la biostatistique pour la modélisation d'un risque et introduit aux problématiques de l'apprentissage statistique (machine learning) ;
  • renforcer les compétences d'analyse : l'enseignement prend la forme d'un tutoriel présentant la démarche d'analyse, de la conception des méthodes jusqu'à leur implémentation dans R.
Contenu

Le module est divisé en cinq sessions homogènes, abordant chacune une question : pourquoi les scientifiques affirment-ils que les individus de groupe sanguin O sont moins susceptibles que les autres d'être infectés par le COVID 19 ? La préférence pour un parfum évolue-t'elle avec l'âge ? Peut-on deviner le stade de maturité d'un abricot à partir de ses indices colorimétriques ?
La complexité des questions abordées est graduelle : il est important de s'assurer que les concepts des sessions antérieures sont bien comprises avant de passer aux suivantes. C'est le sens des fichiers d'exercice fourni à chaque session. 
 
Evaluation

L'évaluation finale des compétences prendra une forme similaire aux fichiers d'exercice associés à chaque session. Chaque étudiant aura un énoncé d'exercice personnalisé auquel il devra répondre en temps limité (1h). Certaines questions visent à évaluer l'acquisition des connaissances méthodologiques, d'autres la capacité à mettre en oeuvre les méthodes dans R.