En naviguant sur notre site vous acceptez l'installation et l'utilisation des cookies sur votre ordinateur. En savoir +

Menu Logo Principal logo vas

UMR EPIA - Unité Mixte de Recherche d'EPIdémiologie des maladies Animales et zoonotiques

EPIA

Développements méthodologiques en mathématique, statistique et informatique

tuberculose_model_Ri-site

Simulation de la tuberculose en France (Photo : David Abrial, UMR EPIA, INRA)

Les données collectées pour étudier les systèmes épidémiologiques sont de nature très variée, allant d’un nombre de cas cliniques observés à une séquence de nucléotides en passant par des relevés de piégeage d’espèces hôtes ou de vecteurs et proviennent de champs disciplinaires différents (biologie moléculaire, écologie…).

L’utilisation de ces données hétérogènes nécessite bien souvent l’adaptation voire même le développement de nouveaux modèles mathématiques et statistiques mais aussi informatiques pour gérer l’arrivée massive de données et les temps de calculs importants qui en résultent. Nos travaux de recherche épidémiologiques sont couplés à des travaux de développements méthodologiques en mathématique, statistique et informatique. Ces développements concernent :

  • La modélisation des systèmes épidémiologiques. Nous travaillons particulièrement sur des estimations d’abondance de populations de vecteurs ou de réservoirs par des modèles dynamiques ou des modèles bayésiens hiérarchiques. Nous développons également des modèles statistiques ou probabilistes d’identification d’association de pathogènes.
  • La modélisation spatio-temporelle. Nous développons de nouveaux modèles d’analyse spatio-temporelle pour les maladies contagieuses à l’aide de modèles bayésiens hiérarchiques avec un champ latent auto-régressif gaussien. Nous travaillons également sur la détection d’agrégat spatiaux et spatiaux-temporels, notamment la détection d’agrégats multiples. Ces méthodes sont élargies pour identifier des agrégats de mutation le long du génome.
  • Des méthodes de bioinformatique. Nous travaillons en particulier sur la conception de méthodes informatiques appliquées à la génomique et à la biologie moléculaire. Il s’agit d’adapter les techniques de traitement et d’analyse des données à l’arrivée massive de données liées au séquençage de l’ADN. Des modèles moléculaires et épidémiologiques sont développés et éventuellement couplés pour inférer des taux de transmission entre populations.
  • L’optimisation des temps de calcul et du stockage. Nous travaillons sur le calcul à haute performance à travers l’optimisation temps de calcul et de traitement, notamment via différentes techniques de programmation parallèle. Pour cela nous appuyons sur une infrastructure informatique conséquente et adaptée composée de plusieurs serveurs (d’application, de bases de données, de calcul scientifique et de stockage).