Stéphane Dupuy – Cirad UMR TETIS - stephane.dupuy@cirad.fr, Octobre 2018
Contexte
L’UMR TETIS développe un prototype de chaine de traitement baptisé Moringa, dans le cadre du CES OSO de THEIA. Moringa est actuellement en phase de test sur plusieurs sites d’études en Pays du Sud dont la Réunion. La méthodologie consiste en l’utilisation conjointe d'une image à THRS (Spot6/7 ou Pléiades) et d’une ou plusieurs séries temporelles d’images optiques à HRS (Sentinel-2 et/ou Landsat-8) dans une approche de classification combinant OBIA (approche objets) et classification par la technique d’apprentissage automatique Random Forest entrainée par une base de données d’apprentissage. Afin de rendre la méthode plus facilement reproductible en vue d’une future intégration dans la plateforme iota2, son implémentation est réalisée uniquement avec des outils libres (OTB et Python).
Ces travaux de cartographie à la Réunion sont réalisés dans le cadre du projet GABiR (Gestion Agricole des Biomasses à l’échelle de l’Ile de la Réunion) qui vise à proposer des outils de gestion innovante des biomasses agricoles à La Réunion. Suite aux premiers résultats obtenus en 2016 il a été décidé de poursuivre les travaux de cartographie de l’occupation du sol afin d’en améliorer les résultats.
Objectifs
Sur la cartographie millésimée 2016-2017, nous avions obtenus de bons résultats pour les cultures majoritaires (canne à sucre et prairies) mais le maraichage ainsi que l’arboriculture avaient de moins bons résultats. L’objectif pour cette nouvelle carte d’occupation du sol était d’améliorer les résultats en mobilisant les nouvelles acquisitions Spot6/7 et Pléiades du projet Kalideos mais aussi de mobiliser les images de Sentinel2 de niveau L2A produite par le CESBIO dans le cadre de THEIA.
Réalisation
Mosaïques
Dans un premier temps nous avons mosaïqué les images Spot6/7 et Pléiades (acquises corrigées en TOA et orthorectifiées par le projet Kalideos). Il s’agissait de produire pour chaque capteur une mosaïque 2017 avec le moins de nuages possible.
La mosaïque Pléiades a été utilisée pour mettre à jour la base de données de terrain afin de profiter de la résolution spatiale de 50 cm qui permet de distingue de nombreux détails sur les cultures. Dans la figure 1 il est en effet possible d’identifier les parcelles de maraichage et de plantations d’agrumes alors que c’est plus difficile sur Spot6/7 et impossible sur Sentinel 2.
Figure 1 : Comparaison de la résolution spatiale des images utilisées
Pléiades a également été utilisée dans le processus de classification mais uniquement pour le calcul d’indices de textures car la segmentation n’a pas aboutie compte tenu de la taille de l’image (environ 130 Go). Ce traitement a donc été effectué avec la mosaïque Spot6/7 de 2017.
Base de données d'apprentissage
Un gros effort de numérisation a été effectué afin d’augmenter de façon significative le nombre de parcelles d’apprentissage et de modifier la nomenclature afin qu’elle corresponde mieux aux spécificités de la zone. Voici une brève description des sources et techniques utilisées en fonction des groupes d’occupation du sol :
- Espaces agricoles : Nous avons sélectionné des parcelles de la couche RPG 2016 (Registre Parcellaire Graphique) diffusée par l’IGN. Ces parcelles ont été vérifiées par photo-interprétation de la mosaïque Pléiades afin de modifier les contours des polygones et de vérifier si la culture était toujours la même en 2017. Cependant le RPG ne concerne que les cultures déclarées par les agriculteurs et il ne s’agit pas d’une information exhaustive. Pour les cultures suivantes nous avons procédé différemment :
- Pour l’arboriculture, nous avons fait appel à nos collègues du Cirad spécialistes de ces cultures afin de localiser les parcelles et d’ainsi créer 3 classes (Manguiers, litchi/longani et agrumes). Une validation sur l’image Pléiades était là aussi necessaire afin de vérifier que la parcelle n’avait pas été modifiée.
- Une distinction prairies pâturées Vs prairies fauchées a été faite par photo-interprétation de l’image Pléiades. Les critères utilisés sont que pour, les prairies fauchées, on arrive sur l’image à identifier les traces laissées par les engins de fauchage ou les balles enrubannée laissées en bordure du champ. Les prairies pâturées ont une végétation plus hétérogène (texturée) et il est parfois possible de distinguer les troupeaux (si elles étaient pâturées lors de la prise de vue). Nous avons toutefois constaté que certaines parcelles étaient à la fois pâturées et fauchées…
- Les parcelles de la classe « culture sous serre ou sous ombrages » sont issues de la couche « bâti industriel » de la BD Topo de l’IGN. Une sélection aléatoire de 20% polygones dans le champ hauteur de couche de l’IGN permet de conserver une diversité des types de serre. Chacun des polygones a été vérifié par photo-interprétation de l’image Pléiades. Si la serre ou l’ombrage n’était pas visible sur l’image le polygone était supprimé.
- Autres classes : Les parcelles caractérisant les espaces naturels et les surfaces en eau ont été localisées avec le support se couches SIG transmises par la DEAL de la Réunion. Deux classes spécifiques ont été ajoutées pour répondre aux problématiques des images satellites : une classe des ombres dues aux reliefs escarpés de l’ile (zones non visibles à cause de l’ombre portée) et une classe de végétation localisée sur les pentes escarpées orientée au soleil du matin appelée « lande de rempart ». Les espaces bâtis sont issus d’une sélection de polygones de bâti sont issus de la BD TOPO de l’IGN.
La BD terrain pour 2017, est constituée de 6526 parcelles réparties en 5002 polygones pour la BD d’apprentissage et 1254 polygones pour la BD de validation.
Série temporelle d’images Sentinel-2 et Landsat-8
Nous avons utilisé en 2017 64 images : 22 L-8, 29 S-2A et 13 S-2B (Cf. Figure 2).
Figure 2 : Série temporelle 2017 d'images HRS
La Figure 3 illustre le nombre de fois qu’un pixel n’est pas couvert par les nuages dans la série temporelle d’images S-2 et L-8. Les zones où la couverture nuageuse est importante sont mises en évidence. Il est possible que les résultats de classifications soient moins bons dans ces zones.
Figure 3 : Nombre d’acquisition sans nuage pour la série temporelle 2017 utilisée
Résultats de classification
Les résultats de classification ont été diffusés sur aware.cirad.fr en 3 niveaux de précision correspondants aux 3 niveaux de la nomenclature. Les couches diffusées ont avant été croisées avec la couche des terres cultivables transmise par la SAFER afin de corriger certaines erreurs de classification :
- La classification de niveau 1 (cf. figure 4) présente une précision globale de 98% et un indice de kappa de 0.99. Elle est disponible ici.
- La classification de niveau 2 (cf. figure 5) présente une précision globale de 93% et un indice de kappa de 0.94. Elle est disponible ici.
- La classification de niveau 3 (cf. figure 6) présente une précision globale de 86% et un indice de kappa de 0.87. Elle est disponible ici.
Figure 4 : Classification de niveau 1
Figure 5 : Classification de niveau 2
Figure 6 : Classification de niveau 3
Les précisions globales et les indices de kappa sont bons pour chaque niveau mais les classes de maraichage et d’arboriculture du niveau 3 ont une précision assez faible. Les résultats détaillés de la validation sont expliqués sur cette fiche.
Pour le niveau 3, la principale confusion concerne les classes « vergers d’agrumes » et « Autres cultures maraichères ». Ceci peut s’expliquer d’une part par la petite taille des parcelles de ces 2 types de culture mais aussi par la configuration sur le terrain puisque ces cultures sont imbriquées souvent dans une même exploitation. D’autre part la grande hétérogénéité des parcelles d’agrume complique la distinction. En effet, certaines plantations sont très anciennes (les arbres se touchent) alors que d’autres sont plus jeunes ou alors constituées de petits arbres (comme les combavas).