Résumé Contexte








télécharger 295.2 Kb.
titreRésumé Contexte
page1/5
date de publication16.05.2017
taille295.2 Kb.
typeRésumé
  1   2   3   4   5
Carte mondiale du paludisme: l’endémicité de Plasmodium falciparum en 2007

Simon I. Hay1,2*, Carlos A. Guerra1,2, Peter W. Gething2,3, Anand P. Patil2, Andrew J. Tatem1,2,4,5, Abdisalan M. Noor1,6, Caroline W. Kabaria1, Bui H. Manh7, Iqbal R. F. Elyazar8, Simon Brooker1,9, David L. Smith5,10, Rana A. Moyeed11 et Robert W. Snow1,6

1. Malaria Public Health and Epidemiology Group, Centre for Geographic Medicine, Kenya Medical Research Institute (KEMRI) – University of Oxford - Wellcome Trust Collaborative Programme, Nairobi, Kenya,

2. Spatial Ecology and Epidemiology Group, Department of Zoology, University of Oxford, Oxford, Royaume-Uni,

3. Centre for Geographical Health Research, School of Geography, University of Southampton, Highfield, Southampton, Royaume-Uni,

4. Department of Geography, University of Florida, Gainesville, Floride, Etats-Unis,

5. Emerging Pathogens Institute, University of Florida, Gainesville, Floride, Etats-Unis,

6. Centre for Tropical Medicine, Nuffield Department of Clinical Medicine, University of Oxford, Centre for Clinical Vaccinology and Tropical Medicine (CCVTM), Oxford, Royaume-Uni,

7. Oxford University Clinical Research Unit, Bach Mai Hospital, National Institute of Infectious and Tropical Diseases, Ha Noi, Vietnam,

8. Eijkman-Oxford Clinical Research Unit, Jakarta, Indonésie,

9. Department of Infectious and Tropical Diseases, London School of Hygiene and Tropical Medicine, Royaume-Uni,

10. Department of Zoology, University of Florida, Gainesville, Floride, Etats-Unis,

11. School of Mathematics and Statistics, University of Plymouth, Plymouth, Devon, Royaume-Uni
Résumé
Contexte

Une meilleure compréhension de la distribution spatiale actuelle des risques liés au paludisme est nécessaire afin de répartir efficacement les ressources pour la lutte contre cette maladie. La publication de la dernière carte mondiale de l’endémicité du paludisme remonte à il y a exactement quarante ans. Cet article décrit la création d’une nouvelle carte mondiale de l’endémicité du paludisme causé par Plasmodium falciparum en 2007.
Méthodologie et résultats

Au total, 8938 études sur le taux de parasitisme de P. falciparum (TPPf) ont été identifiées grâce à différentes stratégies exhaustives de recherche. Parmi ces études, 7953 ont satisfait à des critères de sélection très stricts avant leur inclusion dans une base de données mondiale sur le TPPf. Les données de notre carte d’endémicité ont été standardisées pour une tranche d’âge allant de 2 à 10 ans. Des méthodes géostatistiques de modélisation ont été utilisées pour créer une surface continue d’endémicité du paludisme au sein des limites spatiales définies préalablement comme stables pour la transmission de P. falciparum. Ces méthodes ont été intégrées dans un cadre de statistiques bayésiennes afin de prendre en compte, grâce à des méthodes robustes, les incertitudes des prévisions. Ces incertitudes sont représentées par la probabilité de prédire correctement l’une des trois classes d’endémicité, classes ayant été définies antérieurement afin de guider de manière informative la lutte contre le paludisme. Les estimations des populations à risque, ajustées afin de prendre en compte les effets de l’urbanisation sur la transmission du paludisme en Afrique, ont ensuite été calculées d’après les données de répartition des populations humaines en 2007.

Parmi le milliard trois cent quatre-vingt millions de personnes confrontées à un risque stable de paludisme causé par P. falciparum, 0,69 milliard se trouvent en Asie centrale et en Asie du Sud-Est (Asie CSE), 0,66 milliard en Afrique, au Yémen et en Arabie saoudite (Afrique+) et 0,04 milliard sur les continents américains. Tous les individus exposés à un risque stable en Amériques se situent dans la classe d’endémicité la plus basse (TPPf2-10 ≤5%). La majeure partie (88%) des personnes vivant en Asie CSE dans des régions à risque stable se trouve également dans cette classe d’endémicité peu élevée; 11% se situent dans la classe d’endémicité intermédiaire (TPPf2-10 >5 et <40%) et le pourcent restant (1%), dans des zones d’endémicité élevée (TPPf2-10 ≥40%). Cette dernière catégorie prévaut dans la région Afrique+, où 0,35 milliard de personnes sont confrontées à un risque élevé. Le risque est intermédiaire pour le reste de la population vivant de cette région (0,20 milliard), excepté pour 0,11 milliard d’individus vivant dans des zones à risque stable même si peu élevé.
Conclusions

Les niveaux élevés d’endémicité du paludisme causé par P. falciparum sont courants en Afrique. Les niveaux d’endémicité sont par contre uniformément bas sur les continents américains. Une endémicité faible prévaut également en Asie CSE, mais des poches de transmission intermédiaire, voire élevée dans de rares régions, y persistent. Il existe dès lors des opportunités certaines pour contrôler le paludisme en Afrique et pour éliminer cette maladie partout ailleurs. Cette carte mondiale de l’endémicité du paludisme causé par P. falciparum en 2007 est la première d’une série qui permettra de suivre et d’évaluer les progrès de cette lutte contre le paludisme.

Introduction
Les cartes sont essentielles pour tous les aspects de la coordination de la lutte contre le paludisme [1]. Dans le contexte d'une politique internationale au sein de la communauté luttant contre le paludisme, considérant à nouveau la possibilité d'éradiquer cette maladie [2-4], une carte de la distribution du paludisme constitue un outil primordial pour la planification, la mise en œuvre et la mesure de l’impact des interventions contre la malaria à l’échelle mondiale. La dernière carte mondiale de l’endémicité de Plasmodium falciparum a été publiée en 1968 [5]. Comme toutes les cartes antérieures de la distribution mondiale du paludisme [6-10] et, dans une large mesure, celles qui lui ont succédé [11-16], cette carte (i) fournissait une description incomplète des données utilisées, (ii) délimitait les contours des régions à «risque» sur base d’avis peu détaillés et subjectifs d’experts et (iii) ne donnait aucun chiffre concernant l’incertitude des prévisions. Nous décrivons ici la production d’une nouvelle carte mondiale de l’endémicité du paludisme comblant ces lacunes importantes.
Cadre géographique de la modélisation

Les limites spatiales de la transmission du paludisme causé par P. falciparum dans le monde ont été récemment cartographiées en combinant des données sur l'incidence des cas de paludisme recensés dans chaque pays, des connaissances médicales complémentaires et les critères biologiques empêchant la transmission du paludisme [17,18]. Ces derniers sont basés sur la température et les limites de sécheresse tolérée biologiquement par les Anophèles vecteurs dominants localement. Cette méthode a permis de diviser le monde en trois classes: la représentation spatiale de l'absence de risque, celle d’un risque instable (Incidence Parasitaire Annuelle de Plasmodium falciparum (IPAPf) inférieure à 0,1 pour 1000 individus par an) et celle d’un risque stable (IPAPf supérieure ou égale à 0,1 pour 1000 individus par an) pour la transmission de P. falciparum en 2007. La distribution de ces trois classes est illustrée par la Figure 1. La classification stable vs. instable de l’IPAPf est basée sur la compilation des raisons statistiques, logistiques, organisationnelles et pragmatiques qui influencent les niveaux d’IPAPf utilisés pour définir les points d’action de la campagne mondiale d’éradication du paludisme [19-21].

L’exercice de cartographie décrit ici prolonge substantiellement ce travail. D’une part, il se base sur le plus grand ensemble d’études malariométriques jamais rassemblé à l’échelle mondiale. D’autre part, les valeurs de prévalence du paludisme causé par P. falciparum sont prédites pour chaque point situé au sein des limites spatiales de transmission stable, afin d’obtenir une surface continue de l’endémicité de P. falciparum. Pour faciliter cette étape, les limites spatiales ont été rééchantillonnées avec ArcView GIS 3.2 (ESRI, 1999) selon une grille de 5×5 km. Les méthodes de cartographie décrites ci-dessous ne pouvaient en effet pas être appliquées à une résolution spatiale de 1×1 km à l’échelle mondiale en raison des limites des performances des ordinateurs actuels.
Approches récentes dans la cartographie de l’endémicité du paludisme

Il existe de nombreuses méthodes pour la production de cartes continues de l’endémicité basées sur des données d’études malariométriques. Elles nécessitent toutes l’utilisation d’un modèle permettant de prédire des valeurs d’endémicité aux endroits pour lesquels aucune donnée n’est disponible [22-26]. Les cartes générées par ces modèles possèdent une incertitude inhérente, et la quantification de celle-ci est un problème important pour la cartographie de maladies.

Un certain nombre d’études récentes ont adopté un cadre prédictif connu sous le nom de «model-based geostatistics» (MBG) [27] pour la prévision spatiale de l’endémicité du paludisme [28-33] ou pour la prévalence d’autres maladies transmises par un vecteur ou par un hôte intermédiaire [34-38]. Les MBG fournissent une interprétation statistique explicite des outils géostatistiques classiques de prévision spatiale [39-41] et permettent d’incorporer les méthodes bayésiennes d’inférence statistique [42,43]. Le principal avantage des MBG pour la cartographie d’une maladie réside dans sa gestion rigoureuse de l’incertitude introduite durant les différentes étapes du processus de modélisation [27]. En modélisant l’interaction entre ces différentes sources d’incertitude, une distribution de probabilité est générée pour chaque valeur prédite. Celle-ci peut être synthétisée afin de fournir des mesures robustes de fiabilité pour les valeurs prédites. La carte résultante fournit dès lors un modèle de l’endémicité actuelle mondiale du paludisme, basé sur des données rigoureuses et utilisant les méthodes des MBG pour estimer la fiabilité des prévisions. Ses utilisateurs disposent ainsi d’une estimation claire de la fidélité de celles-ci [36].

Un principe sous-jacent aux géostatistiques implique qu’une prévision cartographiée devient de moins en moins fiable au fur et à mesure que la densité et la proximité des points de donnée avoisinants décroissent. Lorsque les données portent sur des périodes et des endroits différents, ce principe s’applique à travers le temps et à travers l’espace. Il y a peu d’exemples d’études épidémiologiques incorporant les géostatistiques spatiales dans un cadre temporel [44-47]. Dans cette étude, un cadre spatio-temporel complet de modélisation à l’aide de géostatistiques a été développé. L’inclusion de la dimension temporelle permet de comparer sans ambiguïté ce modèle avec de futures mises à jour de la carte. Celle-ci proposera ainsi un cadre géographiquement explicite pour le suivi et l’évaluation de l’impact des mesures de contrôle contre le paludisme causé par P. falciparum dans le monde entier.

Méthodes
Résumé des analyses

Ces analyses ont pour objectif d’utiliser une base de données contemporaine d’enquêtes sur le taux de parasitisme de P. falciparum (TPPf) afin de créer une surface continue de l’endémicité du paludisme causé par P. falciparum à l’échelle mondiale pour 2007. Les méthodes sont transparentes et reproductibles, et l’incertitude associée aux prévisions est documentée de façon rigoureuse.

Les principales étapes suivies, dans notre cadre analytique, pour la conception de cette carte mondiale continue de la prévalence de P. falciparum sont exposées à la Figure 2. La recherche et le prétraitement des données de TPPf étaient tout d’abord nécessaires afin de générer un ensemble géographiquement cohérent et parfaitement géo-référencé pour les cartographier les données des études malariométriques. Les covariables environnementales potentielles (Protocole S1) et l’influence de la structure des zones urbaines ont été évaluées [48-50] (Protocole S2). Après ces raffinements, la base de données des TPPf a servi à créer une surface continue de la prévalence du paludisme, standardisée par âge et corrigée dans les zones urbaines, au moyen de MBG implémentées dans un cadre statistique bayésien (Protocole S3). Des méthodes poussées de validation ont ensuite été utilisées pour évaluer la précision des prévisions de l’endémicité et les indices d’incertitude (Protocole S4). Les estimations des populations à risque (PAR) pour le paludisme causé par P. falciparum ont finalement été calculées à l’échelle mondiale et présentées par classes d’âge et à l’échelle régionale.
Création d’une base de données mondiale de la prévalence parasitaire de P. falciparum

Parmi tous les indicateurs potentiellement disponibles pour mesurer l’endémicité du paludisme, le taux de parasitisme (c'est-à-dire la proportion des personnes échantillonnées pour laquelle les parasites sont détectables dans le sang périphérique) a été sélectionné pour servir de base à notre carte. Cet indicateur est en effet largement utilisé à l’échelle mondiale et il est sensible à une large gamme du spectre de transmission du paludisme causé par P. falciparum. Une classification du spectre de l’endémicité du paludisme au sein d’une classe d’âge allant de deux (2,00) à dix (9,99) ans a été suggérée [51]. Le choix de cette classe d’âge, informative d’un point de vue épidémiologique, est guidé par l’impact potentiel sur l’endémicité du paludisme grâce aux moustiquaires imprégnées d’insecticide (MII), qui constituent la méthode d’intervention la plus utilisée à l’heure actuelle [19]. La classe la plus basse du TPPf dans le groupe d’âge de deux à dix ans (ci-après TPPf2-10) correspond à un taux ≤5%. Cette valeur équivaut à la limite sous laquelle la taille de l’échantillon de population nécessaire pour mesurer précisément l’endémicité est trop importante d’un point de vue logistique. Dans ce cas, les mesures malariométriques basées sur la surveillance sont généralement privilégiées [52-54]. Nous avons considéré qu’une transmission intermédiaire stable correspond à un TPPf2-10 >5% et <40%. Plusieurs modèles mathématiques prédisent en effet que l’interruption de la transmission du paludisme pourrait être atteinte grâce à une utilisation universelle de MII dans toutes les zones présentant un TPPf2-10 <40% [19,55]. Malgré une incertitude relative concernant ce seuil liée au comportement et à la biologie des Anophèles vecteurs dominants localement [56], le seuil du TPPf2-10 <40% est considéré comme relativement fiable étant donné que les MII sont rarement distribuées sans autres méthodes d’intervention visant également à réduire la transmission. Les zones de transmission élevée et stable sont définies par des prévalences correspondant systématiquement à des TPPf2-10 ≥40%. Dans ces zones, la combinaison de diverses méthodes d’intervention doit être envisagée si on veut parvenir à interrompre la transmission du paludisme. Cette classification vise à guider l’interprétation de la surface d’endémicité prédite au sein de ces différentes classes. Elle se démarque des critères utilisés traditionnellement étant donné que ceux-ci ne se sont pas avérés correspondre, dans la plupart des modèles, avec les possibilités de contrôle et d’élimination [19,55].

Le processus d’identification, d’assemblage et de géoréférencement des études de la prévalence du parasite effectuées au sein de populations depuis 1985 a été décrite préalablement [58]. Bien que le «Malaria Atlas Project» (MAP, http://www.map.ox.ac.uk) continue en permanence à rechercher de nouvelles données du TPPf, seules les données acquises avant le 31 juillet 2008 ont été utilisées pour cette itération de la carte d’endémicité mondiale en 2007 (Protocol S1.1). Au total, 8938 estimations du TPPf provenant d’études transversales ont été assemblées. Ces données proviennent de 78 des 87 pays endémiques pour le paludisme causé par P. falciparum (PEPf) [18]. Le Bangladesh, le Belize, le Bhoutan, Djibouti, la République dominicaine, la Guyane, l’Iran, le Kirghizistan et Panama ne sont pas représentés dans la base de données.

Après six niveaux d’exclusion de données (exclusion des études géoréférencées par des grands (>100 km2) ou petits (>25 km2) polygones [58]; exclusion des études ne pouvant pas être géoréférencées, ou pouvant l’être seulement de manière imprécise; et exclusion des études ne pouvant temporairement pas être subdivisées en études indépendantes, ou dont la date était inconnue), 7991 études du TPPf ont été conservées dans la base de données (Figure S1.2 du Protocole S1).

Toutes ces données du TPPf ont ensuite été standardisées pour la tranche d’âge compris entre 2 et 10 ans, puis cartographiées avec un algorithme basé sur des modèles de conversion catalytique, adapté au paludisme pour la première fois par Pull et Grab [59]. Cet algorithme s’est avéré fournir les meilleurs résultats parmi toutes les procédures de standardisation potentielles [51] (Protocole S1.3).

Le jeu de données final a alors été divisé en trois régions principales (Figure 1): les Amériques; l’Afrique, le Yémen et l’Arabie saoudite (Afrique+); l’Asie centrale et l’Asie du Sud-Est (Asie CSE) (Protocole S1.4). Cette division a permis d’examiner séparément ces régions distinctes d’un point de vue épidémiologique, entomologique et biogéographique, tout en conservant suffisamment de données dans chaque région pour permettre des analyses intéressantes. Cette division du globe a ensuite été confirmée par l’observation d’une structure spatiale distincte des données du TPPf2-10 au sein de chaque région. Celle-ci est illustrée par un semi-variogramme (Figure S1.1 du Protocole S1).

Des approches spécifiques pour cartographier les zones urbaines, périurbaines et rurales en relation avec la transmission du paludisme ont été développées [50] (Protocole S2). En bref, toutes les zones urbaines définies par la version alpha du masque d’urbanisation (MU) du Global Rural Urban Mapping Project (GRUMP) [60,61] ont été identifiées à une résolution spatiale de 1x1 km (Protocole S2.1) [50]. Au sein de ces zones, les aires dans lesquelles la densité de population est supérieure à 1000 habitants par km2 d’après la surface de densité de population de la version 3 du «Gridded Population of the World» (GPW3) [60,61] ont été cartographiées [48]. Toutes les études du TPPf ont alors été catégorisées soit en zone urbaine (Gridded Population of the World version 3 ≥1000 km2 dans le MU du GRUMP), soit en zone périurbaine (Gridded Population of the World version 3 <1000 km2 dans le MU du GRUMP) soit en zone rurale (hors du MU du GRUMP) (Protocole S2.2).

Les valeurs statistiques marginales dans les données de TPPf2-10 classées en zone rurale ont ensuite été identifiées grâce à un filtre géostatistique (Protocole S1/5). Cette étape fait appel aux statistiques des semi-variogrammes pour estimer si chaque point diffère significativement des points voisins en tenant compte des distances les séparant et des profils régionaux de variation spatiale. Cette procédure a identifié 38 points de TPPf2-10 en zone non urbaine. Ceux-ci ont été retirés du jeu de données avant la modélisation. Le détail de ces études est disponible sur demande.

Le jeu de données final du TPPf2-10 (n= 7953) est présenté à la Figure 1. Les caractéristiques de cette base de données finalisées sur le TPPf2-10.sont décrites en détails (Tableau S1.2 du Protocole S1). Un graphique du TPPf2-10 médian par année durant la période d’observation est aussi inclus (Figure S1.3 du Protocole S1). Celui-ci illustre le fait que le temps constitue un paramètre de variation important à inclure dans les analyses basées sur les MBG. Des analyses préliminaires similaires pour les relations entre les données de TPPf2-10 et diverses covariables climatiques et environnementales mesurées par télédétection n’ont montré aucune corrélation importante (Figure S1.5 et S1.6 du Protocole S1), ce qui confirme l’approche univariée pour ces analyses.

L’idée, largement répandue, selon laquelle les études malariométriques ne sont menées que dans les zones de prévalence élevée est erronée. En fait, la conduite d’études nationales destinées à être représentatives de toutes les régions d’un pays est de plus en plus fréquente. De plus, la confirmation de l’absence de transmission de P. falciparum lors d’échantillonnages portant sur P. vivax a pour résultat l’enregistrement de nombreuses données de prévalence nulle lors de ces enquêtes. Au total, 119 des 261 études effectuées en Amériques, 1010 des 5307 études réalisées en Afrique+ et 775 des 2385 études en Asie CSE rapportent des valeurs nulles (Figure 1).
Détails des méthodes statistiques

Les algorithmes géostatistiques génèrent des cartes continues en prédisant les valeurs aux endroits non échantillonnés grâce à des combinaisons linaires des valeurs disponibles. Dans le présent exercice cartographique, le fait que la fiabilité des prédictions de TPPf2-10 à un lieu non échantillonné donné sera affectée par (i) la distribution des données autour de ce lieu (densité spatiale des données exploratoires), (ii) l’intensité des variations du TPPf2-10 à travers l’espace (hétérogénéité spatiale des données exploratoires), et (iii) le nombre de personnes échantillonnées dans chaque étude (précision des études composant les données exploratoires) est intuitif. Une approche utilisant les MBG [27] a été intégrée dans un cadre statistique bayésien afin d’incorporer ces différents paramètres dans la génération de cartes continues du TPPf2-10 (Protocole S3). Vu que les données ont été collectées au cours de différentes périodes, entre 1985 et 2008, il était important d’inclure également la dimension temporelle dans cette approche géostatistique purement spatiale, et ce afin de représenter à la fois la densité et l’hétérogénéité des données dans l’espace et dans le temps. L’algorithme de standardisation pour l’âge a été incorporé en tant que sous-modèle afin de permettre l’estimation des erreurs inhérentes à ce processus et leur propagation dans le reste les différentes étapes successives de modélisation (Protocole S3).

Dans chaque région, un modèle géostatistique bayésien a été élaboré. La valeur sous-jacente du TPPf2-10 en 2007, , en chaque lieu y a été modélisée grâce à une transformation d’un champ spatialement et temporellement structuré, superposé à une variation déstructurée (aléatoire) . Le nombre de réponses positives à P. falciparum dans un échantillon total de en chaque lieu d’étude a été modélisé comme une variable binomiale conditionnelle indépendante prenant en compte la valeur sous-jacente non observée du TPPf2-10 standardisé par âge [36]. La composante spatio-temporelle a été représentée par un processus gaussien stationnaire avec une moyenne µ et une covariance définies par une version spatialement anisotrope de la fonction de la covariance espace-temps proposée par Stein [64]. Une modification a cependant été apportée à cette dernière pour incorporer une composante périodique ayant une fréquence de 12 mois dans le modèle temporel et permettre à celui-ci d’incorporer les effets saisonniers dans la structure observée de la covariance temporelle. Ces effets apparaissent lorsque des études effectuées aux mêmes mois au cours de différentes années se ressemblent d’avantage que ne l’aurait prédit le modèle en l’absence de saisonnalité. La moyenne µ a été modélisée comme une fonction linéaire du temps et selon le fait que l’endroit de prévision se situait en zone urbaine ou périurbaine (respectivement défini par les variables 1u(x) et ) plutôt que rurale: . Chaque étude a été référencée temporellement en utilisant le point médian (en années décimales) entre les mois de départ et de fin enregistrés. Un statut urbain, périurbain ou rural a été attribué à chaque lieu prédit sur base de la surface du GRUMP modifiée dans les zones urbaines et décrite précédemment (Protocole S2.2). Cette surface a été rééchantillonnée selon une grille de 5×5 km. La composante non-structurée a été représentée comme une variable gaussienne ayant une moyenne nulle et une variance . L’inférence bayésienne a été appliquée avec les méthodes de Monte Carlo par chaînes de Markov (Markov Chain Monte Carlo, MCMC) pour générer des échantillons de la distribution a posteriori du champ gaussien en chaque lieu; les paramètres non-observés , , , et définis plus haut; et d’autres paramètres non observés définissant la structure et l’anisotropie de la fonction exponentielle de la covariance espace-temps (Protocole S3.4). Les distances entre points ont été mesurées par la distance orthodromique pour intégrer l’effet de la courbure terrestre, qui exerce une influence non négligeable à l’échelle régionale. Des échantillons ont été générés à partir de la moyenne annuelle de 2007 de la distribution a posteriori de en chaque lieu prédit. Pour chaque échantillon, ces prédictions ont été effectuées avec une simulation conditionnelle spatio-temporelle sur les 12 mois de l’année 2007 [44,65]. Ces prévisions ont été faites aux nœuds d’une grille spatiale régulière de 5×5 km au sein des zones de transmission stable de P. falciparum. Les résultats du modèle étaient donc constitués par des échantillons de la distribution prédite a posteriori de la moyenne annuelle du TPPf2-10 pour 2007 en chaque point de la grille. Ces échantillons ont servi à produire des estimations ponctuelles (calculées comme la moyenne de chaque ensemble d’échantillons a posteriori), des probabilités d’appartenance à une classe d’endémicité et des estimations standards de variance (Protocole S3.4). Le Protocole S3.5 fournit une description plus détaillée de la manière dont ces résultats géostatistiques ont été utilisés pour générer les différentes cartes.
Validation du modèle

L’estimation de la vraisemblance de la carte générée par le modèle était essentielle. Plusieurs méthodes descriptives non triviales ont été utilisées (Protocole S4). La capacité du modèle de prévoir des valeurs ponctuelles du TPPf2-10 et la classe d’endémicité la plus probable a été testée au moyen d’une procédure holdout. Un échantillon de validation a été généré en sélectionnant 10% des données (n=800) par un échantillonnage aléatoire stratifié et désagrégé spatialement. Cet échantillon a ensuite été retiré de l’ensemble de données (Protocole S4.1). Les 7153 points de donnée restants ont été utilisés pour toutes les étapes du modèle afin de générer des distributions prédictives a posteriori du TPPf2-10. Les valeurs prédites ont alors pu être comparées aux valeurs connues pour les 800 données isolées préalablement. Contrairement à la simulation principale dans laquelle les moyennes ont été prédites pour l’année 2007, le test de validation a prédit le TPPf2-10 pour le mois médian de chacune des 800 études isolées afin de fournir des données comparables d’un point de vue temporel. Vu la taille importante du jeu de données, un test de validation unique a été considéré comme suffisant pour générer des statistiques de validation selon le niveau de précision requis.

La capacité de prédire des valeurs connues du TPPf2-10 est exprimée en utilisant l’erreur moyenne comme mesure de biais général, l’erreur moyenne absolue comme mesure de la précision générale et le coefficient de corrélation comme mesure d’association linéaire [44,66]. Les valeurs absolues de ces statistiques sont présentées, ainsi que leurs valeurs exprimées, pour chaque région, par une proportion de la moyenne du TPPf2-10 telle qu’estimée au moyen des données de validation. La capacité de prédire l’appartenance à une classe d’endémicité a été testée en recourant à la méthode statistique de l’aire sous la courbe (AUC, Area Under Curve) dérivée des courbes ROC (Receiver Operating Characteristic). Ces dernières comparent la sensibilité à un moins la spécificité pour chaque classe d’endémicité [34,67]. Les valeurs de l’AUC supérieures à 0,9 indiquent une excellente concordance entre les valeurs réelles et prédites d’appartenance à une classe; celles supérieures à 0,7, une concordance modérément bonne; et des valeurs de 0,5 indiquent que le modèle n’obtient pas de meilleurs résultats que l’attribution aléatoire à une classe [34,67]. Une procédure a également été utilisée pour vérifier dans quelle mesure les distributions prédites a posteriori pour chaque lieu fournissaient une mesure appropriée de l’incertitude. Cette procédure a permis de comparer la probabilité attribuée aux valeurs prédites du TPPf2-10 en chaque lieu avec les probabilités observées dans chaque région. Des précisions complémentaires concernant cette procédure sont fournies dans le Protocole S4.2.

Les distributions de fréquence du TPPf2-10 sont illustrées à la fois pour les données originales et pour la surface prédite par le modèle au moyen de diagrammes en forme de violon (violin plots) [69]. Ceux-ci fournissent une approximation lissée de la fréquence de distribution (un diagramme de noyau de densité) du TPPf2-10 pour chaque région, et illustrent les valeurs médianes et l’intervalle interquartiles. Des diagrammes ont été produits en utilisant les données du TPPf2-10 standardisées par âge respectivement pour toutes les années comprises dans la base de données et pour 2007 uniquement. Un autre diagramme a été réalisé en utilisant les estimations ponctuelles pour chaque point de la surface du TPPf2-10 prédite par le modèle pour 2007.
Estimer la densité de population humaine en 2007

La version alpha du GRUMP fournit des estimations du nombre de personnes par km2 et de la densité de population avec une résolution spatiale de 1×1 km pour les années 1990, 1995 et 2000. Ces données sont disponibles à la fois en version ajustée et non ajustée aux estimations de population nationale fournies par les Nations Unies [60,61] (Protocole S2.3). Les données de population ajustées pour l’année 2000 ont été projetées pour 2007 en appliquant le taux national de variance moyenne et d'accroissement intercensitaire pertinent pour chaque pays [70] grâce aux méthodes décrites précédemment [71] (Protocol S2.4). Ces chiffres ont ensuite été stratifiés par pays et par groupe d’âge sur la base des structures d’âge des populations définies par les Nations Unies pour l’année 2005 [72], et ceci afin d’obtenir des surfaces correspondant aux populations de 0 à 5 ans, de 5 à 14 ans et de 15 ans et plus.

Les frontières digitalisées des 87 pays endémiques pour le paludisme causé par P. falciparum ont été superposées aux classes d’endémicité ajustée dans les zones urbaines (et reprojetées avec une projection équivalente). Les zones de chaque classe d’endémicité ont été extraites dans ArcView GIS 3.2 (ESRI, 1999) (Protocole S2.4). Ces couches ont également été superposées aux données du GRUMP [60,61] afin d’extraire les estimations de population à risque pour P. falciparum ajustées dans les zones urbaines, par classes d’âge et d’endémicité (Protocole S2.4). Enfin, ces surfaces ont été combinées avec les cartes des incertitudes pour fournir un indice d’incertitude ajusté à la population (le produit du logarithme de la densité de population et de la réciproque de la probabilité d’une attribution correcte à une classe).
  1   2   3   4   5

similaire:

Résumé Contexte iconRésumé 3 1- contexte

Résumé Contexte iconRésumé: Présentation de l’ouvrage et de son contexte

Résumé Contexte iconRésumé Ce guide présente les évolutions significatives de Microsoft...

Résumé Contexte iconRésumé : Dans un contexte de croissance de l'économie immatérielle,...

Résumé Contexte iconRésumé Ce guide présente les évolutions significatives de Microsoft...

Résumé Contexte iconRésumé : Quelle est l'origine du monde ? Sur ce sujet, science et...

Résumé Contexte iconRésumé Ce guide présente les évolutions significatives de Microsoft...
«Mode de compatibilité Word 2007» correspondant à un document au format ecma-376 Office Open xml 1ère édition; 19

Résumé Contexte iconRésumé Ce guide présente les évolutions significatives de Microsoft...
«Mode de compatibilité Word 2007» correspondant à un document au format ecma-376 Office Open xml 1ère édition; 19

Résumé Contexte iconRésumé Ce guide présente les évolutions significatives de Microsoft...
«Word 2010» correspondant à un document au format iso 29500: 2008/ecma-376 Office Open xml 2ième édition pour la classe de conformité...

Résumé Contexte iconRésumé. Nous présentons la réponse que Leibniz a donnée à la
«la vie est l’ensemble des forces qui résistent à la mort» (Recherches physiologiques sur la vie et la mort, Paris, 1801). La controverse...








Tous droits réservés. Copyright © 2016
contacts
b.21-bal.com