Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras.
Main Author: | |
---|---|
Other Authors: | |
Format: | info:eu-repo/semantics/masterThesis biblioteca |
Language: | spa |
Published: |
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
|
Subjects: | AGRICULTURA, APRENDIZAJE AUTOMATICO, CLASIFICACION SUPERVISADA Y NO SUPERVISADA, GOOGLE EARTH ENGINE, IMAGENES SATELITALES, METRICAS FENOLOGICAS, SENTINEL, t-SNE, XGBoost, AGRICULTURE, MACHINE LEARNING, SUPERVISED AND UNSUPERVISED CLASSIFICATION, SATELLITE IMAGES, PHENOLOGICAL METRICS, |
Online Access: | https://hdl.handle.net/20.500.12110/tesis_n7436_CalAlvarez http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7436_CalAlvarez_oai |
Tags: |
Add Tag
No Tags, Be the first to tag this record!
|
Summary: | El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras. |
---|