EPIdémie - Recherche 4 (Eclairages scientifiques)

Eclairage : La modélisation en épidémiologie

 

Classiquement en science, une approche expérimentale constitue l’outil conceptuel par excellence pour mettre en place une démarche scientifique permettant de répondre à une question. A l’issue de l’expérimentation, le scientifique récupère des données qui lui permettront, à l’aide d’outils statistiques, de mettre à l’épreuve les hypothèses qu’il a formulées pour répondre à la problématique soulevée.

Comment faire cependant pour les domaines scientifiques où l’expérimentation est rendue complexe voire impossible ? C’est le cas notamment dans le domaine de l’épidémiologie où l’on cherche à comprendre comment naissent et se propagent les épidémies afin de développer des outils et des moyens qui permettent d’enrayer ce processus. Beaucoup de questions relatives à l’épidémiologie ne peuvent se traiter par une approche expérimentale, que ce soit pour des questions de temps, de coût, ou tout simplement pour des raisons éthiques. De plus, les systèmes étudiés sont souvent très complexes et une approche réductionniste ne saurait être pertinente pour comprendre les facteurs qui contrôlent la propagation des épidémies à l’échelle mondiale. En effet, plus les systèmes sont complexes et plus les relations causales deviennent nombreuses et imbriquées entre elles, au point de ne plus être intuitives. Dans tous ces cas, les modèles mathématiques s’avèrent des aides indispensables. Ils peuvent avoir deux objectifs majeurs : utiliser le jeu de données pour chercher à établir une relation causale c’est-à-dire proposer une explication aux observations (modèles explicatifs) ; prédire l’évolution d’une situation initiale dans différents scénarios (modèles prédictifs).

 

L’importance de la question posée

Le premier élément qui dirige le biologiste ayant recours à une modélisation mathématique est celle de la question posée. Ainsi, l’épidémiologie s’intéresse aux causes et aux conséquences des maladies dans une population donnée, et à leur répartition dans le temps et dans l’espace. De fait, les modèles utilisés dans cette discipline sont essentiellement des modèles dynamiques. D’autre part, ils sont essentiellement centrés sur les états cliniques des individus hôtes (et ne considèrent que rarement ce qui se passe chez le parasite).

Bien sûr, selon la maladie étudiée, le biologiste devra ajuster son modèle et déterminer les paramètres à rajouter ou à éliminer. En effet, les prédictions d’un modèle trop simplifié ne seront pas assez précises car les paramètres du modèle ne suffiront pas à expliquer la variabilité des données. A l’inverse, un modèle trop complexe ne sera pas non plus pertinent car les paramètres en trop introduiront une variabilité qui ne sera pas expliquée par les données. Il sera ainsi inutile la plupart du temps de rajouter des paramètres comme les phénomènes démographiques (naissances, décès) car ils sont négligeables aux échelles de temps étudiés.

 

Les modèles en compartiments

Un modèle classique de l’épidémiologie est le modèle SI. Dans ce modèle, on considère que les individus hôtes peuvent être répartis en deux compartiments : le compartiment des individus S (pour « susceptibles » de déclencher la maladie) et le compartiment des individus I (pour « infectés »). Les compartiments sont reliés entre eux par des flux : les individus du compartiment S vont rejoindre le compartiment I quand ils se feront infecter. Nous voyons que ce modèle n’est pertinent que dans le cas des maladies incurables ou si l’on peut négliger le phénomène d’immunité acquise. Dans le cas contraire, il est nécessaire de rajouter un troisième compartiment : R (pour « remis »). On appelle SIR un tel modèle. Il a été proposé pour la première fois en 1927 par William Kermack et Anderson McKendrick. Dans certains cas, on voudra rajouter un quatrième compartiment : E (pour « exposés ») qui concerne les individus qui sont déjà infectés mais pas encore contagieux. Dans d’autres cas, on sous-compartimentera la population des susceptibles par tranche d’âge ou par sexe si la contamination s’avère être influencée par ces facteurs. Une connaissance précise de l’infection étudiée sera donc indispensable au biologiste pour lui permettre de déterminer l’ensemble des paramètres qu’il doit intégrer dans son modèle.

Quand le modèle a été déterminé, le scientifique doit l’écrire sous la forme d’équations. Dans le cas d’un modèle SIR, l’outil mathématique utilisé est celui des équations différentielles. Une équation différentielle est une relation entre une ou plusieurs fonctions et leurs dérivées. Appliquée à l’épidémiologie, il s’agira principalement d’établir la variation d’une variable (par exemple, le nombre d’individus dans le compartiment I) par rapport au temps en fonction de cette variable et d’autres, ainsi que de paramètres (comme la probabilité qu’un individu susceptible contracte la maladie). Voici les trois équations simplifiées du modèle SIR :

(1) dS/dt = –αSI

(2) dI/dt = αSI – βI

(3) dR/dt = βI

Dans ces équations, S représente le nombre d’individus susceptibles ; I le nombre d’individus infectés ; R le nombre d’individus remis. t est le temps continu. α représente la force d’infection qui exprime la probabilité qu’un individu susceptible contracte la maladie après contact avec un individu malade (le nombre de contacts étant donné par le produit SI). β représente le taux d’immunisation (c’est-à-dire le passage de l’état I à l’état R). Les paramètres α et β sont mesurables expérimentalement.

On peut représenter les flux entre compartiments de la façon suivante :

 

Qu’apprend-on en utilisant des modèles en compartiments ?

Après un temps t, le nombre d’individus infectés augmente par la contamination des susceptibles (+ αS) et diminue par l’immunisation (- β). La variation peut s’écrire : (αS – β). It

Tout l’enjeu est de savoir dans quel cas cette variation est positive, autrement dit dans quelles conditions l’épidémie va avoir lieu. Ce sera le cas quand  αS – β > 0, autrement dit quand le nombre de sujets susceptibles dépasse une valeur seuil β/α. Une conclusion contre-intuitive est que l’apparition d’une épidémie ne dépend pas du nombre de personnes infectées (I) mais bien du nombre de personnes susceptibles d’être contaminées (S). L’objectif est donc de diminuer le nombre d’individus S, ce qui est l’enjeu au cœur des campagnes de vaccination (voir chapitre XX). Cela peut aussi consister à diminuer le vecteur d’une maladie (comme le moustique pour la malaria) au-dessous d’un seuil (théorème du moustique de Ronald Ross). Dans d’autres cas, on peut rechercher à isoler les malades et protéger les soignants (voir Chapitre 1 pour Ebola). Tout ceci aboutit à une diminution de la valeur de S et donc à la probabilité de voir une épidémie se déclarer.

Les scientifiques définissent un paramètre fondamental nommé R0. R est le nombre moyen d’infections causées par un individu malade. R0 représente ce même nombre à t0 c’est-à-dire dans une population uniquement constituée d’individus susceptibles. L’épidémie n’aura lieu que si ce taux est supérieur à 1. Ce paramètre est égal à : α/β.S0 où S0 est le nombre d’individus susceptibles à t0.

On peut calculer cette valeur pour différentes maladies. On a ainsi une mesure de l’efficacité avec laquelle une maladie va se propager, en l’absence de vaccination, dans une population. Ce calcul révèle le niveau de contagiosité élevé de certaines maladies comme la rougeole et la coqueluche. Ci-dessous, le tableau présenté résume quelques valeurs de R0.

Valeurs de R0 pour des maladies communes

Maladie

Mode de transmission

R0

Rougeole

Dans l'air

12–18

Coqueluche

Dans l'air

12–17

Diphtérie

Salive

6–7

Variole

Contact physique

5–7

Polio

Ingestion de matière fécale

5–7

Rubéole

Dans l'air

5–7

Oreillons

Dans l'air

4–7

VIH/SIDA

Contact sexuel

2–5

Syndrome respiratoire aigu sévère

Dans l'air

2–5

Grippe (grippe espagnole de 1918)

Dans l'air

2–3

 

Source : History and Epidemiology of Global Smallpox Eradication [archive] du cours "Smallpox: Disease, Prevention, and Intervention" par le Centers for Disease Control and Prevention (CDC) et l'Organisation mondiale de la santé (OMS), diapositives 16-17.

 

Même s’il est impossible de trouver une solution exacte au système d’équations différentielles du modèle SIR, on peut utiliser une simulation informatique pour en déterminer des valeurs approchées.

Source : Rechenmann F., Modéliser la propagation d’une épidémie, interstice.info, consulté le 13/05/2016

On remarque que, au cours du temps, le nombre d’individus infectés augmente, atteint une valeur maximale puis diminue. L’utilisation de l’applet proposée sur ce site permet de montrer l’influence des différents paramètres sur, par exemple, la valeur maximale d’individus infectés au cours de l’épidémie.

 

Les modèles en réseaux

Le réseau monde

L’histoire de l’organisation de l’espace mondial et celle des grandes épidémies sont intimement liées. L’établissement de contacts entre toutes les parties du monde s’est accéléré à partir du XVIème siècle pour se terminer au tout début du XXème siècle. Il n’est donc pas étonnant que la première épidémie mondiale, à savoir celle de grippe espagnole, a eu lieu en 1918-1919. Avant cette période, les épidémies ne pouvaient atteindre une ampleur mondiale du fait de la lenteur de la progression de la maladie, ou de son incapacité à atteindre certaines zones (c’est le cas de l’épidémie de peste noire médiévale qui s’est limitée à une partie de l’Ancien Monde). Depuis le XXème siècle, l’espace mondial est devenu un réseau de grandes métropoles reliées entre elles.  Dans ces grandes métropoles, les concentrations élevées d’individus jouent le rôle de grand réservoir d’hôtes, rendant la propagation de l’épidémie (facteur α) supérieur à l’immunisation des populations (facteur β). Entre les métropoles, le tissu de transports rend toujours plus efficace la diffusion des vecteurs de l’épidémie. Des données sur le réseau aérien mondial récupérées auprès de l’AITA (Association internationale du transport aérien) et couvrant 94% du trafic aérien font état de 3880 aéroports établissant 18810 connexions entre eux. Les villes de Paris et New-York sont distantes de près de 6000 km. Au XIXème siècle, la traversée de l’Atlantique se faisait en plusieurs jours en bateau (une vingtaine au début du siècle, 5 à la fin). Au milieu du XXème siècle, des liaisons commerciales relient Paris à New-York en une vingtaine d’heures. En 1989, le Concorde relie les deux villes en moins de 3 heures. La mondialisation nous oblige à délaisser la notion de proximité géographique au profit d’une vision en termes de connectivité entre différents points du réseau : un lien fortement connecté au point de départ de l’épidémie sera généralement touché avant un lieu faiblement connecté, indépendamment de la distance kilométrique.

Source : LES CAHIERS GEOGRAPHIQUES, VILACA Olivier. Ce que les épidémies nous disent sur la mondialisation. Disponible sur : http://cafe-geo.net/wp-content/uploads/epidemies-mondialisation.pdf

La modélisation peut intégrer cette vision spatiale et en réseaux de la propagation des épidémies. La notion de graphe permet de formaliser l’idée d’un réseau. Un graphe est un objet mathématique simple qui représente le réseau. Il est constitué de nœuds et de liens. Dans un réseau, une information passe d’un nœud au suivant en empruntant des liens. Ici l’information est assimilée à une infection, les nœuds peuvent représenter des villes du réseau mondial (ou des localités, ou encore des individus) et les liens sont constitués par les échanges entre les villes notamment via le trafic aérien.

 

Qu’apprend-on en utilisant des modèles en réseau ?

Dans un réseau, la transmission d’une maladie (entre deux villes ou entre deux individus) dépend de deux conditions : premièrement il doit exister un lien entre ces deux nœuds, et deuxièmement, le pathogène doit être transmis. Si dans une classe de 30 élèves, chaque élève parle à 30 % des autres élèves de la classe et que, dans chaque cas, il existe 10% de chance que la maladie se transmette (parce que le contact est suffisant pour cela), alors, pour deux élèves pris au hasard dans la classe, la probabilité d’observer une transmission de la maladie n’est que de  3%. Chaque jour, on recommence le calcul de propagation. On observera qu’un nombre très faible d’individus vont être contaminés au bout d’une semaine. Si on recommence en doublant la probabilité de transmission et en la fixant à 6%, on remarquera que la maladie va se transmettre à l’ensemble de la population ! Tout se passe comme si un seuil avait été franchi. On retrouve ainsi l’existence d’un seuil épidémique – au-delà duquel l’épidémie se répand à la population entière alors qu’elle reste limitée sinon – comme dans la modélisation en compartiments.

Cette valeur de seuil a été mise en évidence dans les années 1950 par les mathématiciens hongrois Paul Erdös et Alfréd Rényi. Ils ont montré qu’elle se situe autour de 1/N où N est le nombre de nœuds du réseau. Dans notre exemple, cette valeur se situe à 1/30 donc 3,3%. En fait, l’épidémie apparait dès le moment où il existe en moyenne au moins un lien par nœud.

Dans le cas d’un monde à 10 villes en disposition circulaire comme c’est le cas dans l’activité proposée, on observe que le nombre de tours nécessaire pour atteindre 100% de contamination diminue fortement quand la probabilité de contamination dépasse la valeur de 0,1. Si on considère un nombre de tours limité, on observera que si la probabilité de contamination est supérieure à cette valeur de 0,1, alors l'événement de pandémie est bien plus probable que si la probabilité était inférieure à 0,1. C'est le seuil épidémique.

 

Cette modélisation, intéressante pour mettre en évidence la notion de seuil, n’est pas suffisamment précise pour correspondre à ce qu’il se passe lors d’une épidémie. Comme il en va de nombreux réseaux, les réseaux épidémiologiques présentent des nœuds avec un grand nombre de connexions et d’autres avec un nombre réduit de connexions. Ainsi, en 2013, le premier aéroport mondial en nombre de passagers était Atlanta avec 94 millions de passagers. L’aéroport de Paris est 8ème avec 62 millions de passagers. L’aéroport de Marseille ne compte que 8 millions de passagers pour la même période. De tels réseaux hétérogènes sont qualifiés de « petits mondes ». Les individus très connectés jouent le rôle de « hub ».

Pour comprendre l’influence d’une organisation particulière de l’espace mondial par rapport à une autre, les mathématiciens ont développé des outils permettant de quantifier l’organisation d’un réseau. Par exemple, on appelle degré d’un nœud le nombre de nœuds du graphe auxquels il est directement relié par un lien. Un réseau « petit monde » est caractérisé par une distribution des degrés en loi de puissance (par opposition à un degré constant pour un graphe régulier ou une distribution de Poisson pour un graphe aléatoire). Les graphes « petits mondes » peuvent être de degré faible et pourtant permettre que les distances entre les nœuds restent faibles du fait de la présence des hubs. Ce type de graphes permet de représenter fidèlement de nombreux phénomènes, allant des relations entre acteurs à Hollywood, à la propagation des infections entre individus (comme dans le cas du VIH où un steward ayant eu un nombre très élevé de relations sexuelles aurait joué ce rôle de « hub ») ou encore dans le cas des pandémies. L’objectif est de mieux comprendre le rôle de ces « hubs » et de développer des stratégies orientées vers ces « hubs » en cas de risque (voir le chapitre 2 et l’exemple de la ville de Lagos).

 

Taux de croissance de l'épidémie dans un modèle en réseau "petit monde" avec K, le nombre de coordination du réseau qui augmente de 2 à 5.

Source : G. Chowell and C. Castillo-Chávez. Worst-Case scenarios and epidemics. Bioterrorism: Mathematical Modeling Applications to Homeland Security (2003), T. Banks, C. Castillo-Chávez Eds. Frontiers in Applied Mathematics Vol. 28 (SIAM, Philadelphia, 2003).

 

Protéger ses ressources ou coopérer dans le cas d’une pandémie

« The next pandemic will test notions of global solidarity »

Une question plus générale peut être adressée au modèle. Elle concerne les stratégies à adopter concernant les stocks d’antiviraux en cas de déclenchement d’une épidémie majeure. Ces stocks représentent une ressource rare. Les pays riches pourront utiliser des stocks mais les pays en voie de développement ne sont pas capables pour le moment d’avoir un accès suffisant à ce type de ressource. Sans un accord international impliquant un partage plus équitable des stocks de médicaments antiviraux, des pays d’Asie par exemple ne seront pas capables d’avoir accès à ces ressources. Contenir l’épidémie à un niveau faible demande de faire face à des défis logistiques massifs. Certains pensent que les pays des régions pauvres pourraient, en l’absence de soutien par les pays riches, se montrer réticents à coopérer avec la communauté internationale, par exemple en fournissant des informations qui aideraient à la surveillance de la maladie ou à l’isolement du virus (indispensable au développement d’un vaccin). Les pays qui pourraient être les premiers à être affectés par une épidémie devraient bénéficier d’un soutien logistique par les pays riches.

Source : Cocker R., Mounier-Jack S., Pandemic influenza preparedness in the Asia Pacific region, The Lancet, Volume 368, No. 9538, p886–889, 2 September 2006

 

Lors de la phase initiale de lutte contre les épidémies, les médicaments antiviraux représentent une ressource cruciale pour réduire la mortalité en l’absence de vaccin. Plusieurs études apportent des preuves que l’endiguement local d’une pandémie émergente repose sur l’utilisation d’antiviraux. Celle-ci peut se faire de façon thérapeutique ou prophylactique. Les stocks d’antiviraux sont principalement fonction du niveau de préparation du pays face à une menace pandémique. Ils sont donc très inégalement répartis entre les pays. Seulement 20 pays disposent actuellement d’un stock suffisant d’antiviraux, comme le recommande l’OMS. Mais avec les taux de production actuels, il est raisonnable de penser que les médicaments ne seront pas disponibles en quantité suffisante ni répartis de façon équitable entre les pays lors d’une éventuelle future pandémie majeure. Dans cette étude, les chercheurs ont établi un modèle avec 3 scénarios : dans le premier, seul un nombre restreint de pays ont des stocks suffisants pour traiter 10% de leur population ; dans les deux suivants, les pays redistribuent 10 ou 20% de leur stock pour un usage international. Dans les scénarios coopératifs (même limités à une redistribution fixée à 10%), le pic d’infection est reporté d’au moins un an. Cette stratégie se révèle même bénéfique pour les pays qui ont partagé une partie de leurs ressources. Le succès d’une telle stratégie coopérative implique cependant l’adoption d’une perspective globale de la lutte contre la pandémie, avec un effort coordonné de la communauté internationale et de l’OMS plutôt qu’une stratégie unilatérale où les pays agissent de façon individuelle en exploitant leurs propres ressources.

Source : Colizza V et al, Modeling the worldwide spread of pandemic influenza baseline case and containment interventions, Plos Medecine, January 2007, Volume 4, Issue 1, e13

Partenaires du projet

Fondation La main à la pâte