Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay

El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras.

Saved in:
Bibliographic Details
Main Author: Cal Álvarez, Adrián Tabaré
Other Authors: Musé, Pablo
Format: info:eu-repo/semantics/masterThesis biblioteca
Language:spa
Published: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Subjects:AGRICULTURA, APRENDIZAJE AUTOMATICO, CLASIFICACION SUPERVISADA Y NO SUPERVISADA, GOOGLE EARTH ENGINE, IMAGENES SATELITALES, METRICAS FENOLOGICAS, SENTINEL, t-SNE, XGBoost, AGRICULTURE, MACHINE LEARNING, SUPERVISED AND UNSUPERVISED CLASSIFICATION, SATELLITE IMAGES, PHENOLOGICAL METRICS,
Online Access:https://hdl.handle.net/20.500.12110/tesis_n7436_CalAlvarez
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7436_CalAlvarez_oai
Tags: Add Tag
No Tags, Be the first to tag this record!
id oai:RDI UBA:aextesis:tesis_n7436_CalAlvarez_oai
record_format koha
institution UBA
collection DSpace
country Argentina
countrycode AR
component Bibliográfico
access En linea
databasecode dig-ubavet
tag biblioteca
region America del Sur
libraryname Biblioteca Facultad de Veterinaria
language spa
topic AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
spellingShingle AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
Cal Álvarez, Adrián Tabaré
Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
description El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras.
author2 Musé, Pablo
author_facet Musé, Pablo
Cal Álvarez, Adrián Tabaré
format info:eu-repo/semantics/masterThesis
topic_facet AGRICULTURA
APRENDIZAJE AUTOMATICO
CLASIFICACION SUPERVISADA Y NO SUPERVISADA
GOOGLE EARTH ENGINE
IMAGENES SATELITALES
METRICAS FENOLOGICAS
SENTINEL
t-SNE
XGBoost
AGRICULTURE
MACHINE LEARNING
SUPERVISED AND UNSUPERVISED CLASSIFICATION
GOOGLE EARTH ENGINE
SATELLITE IMAGES
PHENOLOGICAL METRICS
SENTINEL
t-SNE
XGBoost
author Cal Álvarez, Adrián Tabaré
author_sort Cal Álvarez, Adrián Tabaré
title Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_short Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_full Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_fullStr Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_full_unstemmed Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay
title_sort metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en uruguay
publisher Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
url https://hdl.handle.net/20.500.12110/tesis_n7436_CalAlvarez
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7436_CalAlvarez_oai
work_keys_str_mv AT calalvarezadriantabare metodologiaautomaticaparamapeoyseguimientodelacondiciondecultivosagricolasdurantelazafraapartirdeimagenessatelitalesyaprendizajeautomaticoenuruguay
AT calalvarezadriantabare automaticmethodologyformappingandmonitoringtheconditionofagriculturalcropsduringtheseasonusingsatelliteimageryandmachinelearninginuruguay
_version_ 1794794482483331072
spelling oai:RDI UBA:aextesis:tesis_n7436_CalAlvarez_oai2024-02-14 Musé, Pablo Preciozzi, Javier Cal Álvarez, Adrián Tabaré 2022-11-28 El presente trabajo tiene como principal objetivo el desarrollo de una metodología para la identificación de cultivos agrícolas de verano en Uruguay, a partir del uso de imágenes satelitales y aprendizaje automático. Para ello, como insumo se utilizaron bases de datos con información georreferenciada de campo, e imágenes satelitales de libre acceso. De las bases, dos fueron proporcionadas por organizaciones de productores agropecuarios y son de chacras con agricultura, y otras del Ministerio de Ganadería, Agricultura y Pesca de Uruguay (MGAP). Una con información de coberturas y usos del suelo, y otra de chacras con planes de uso para conservación del suelo por erosión. Los cultivos agrícolas presentes en las bases son maíz, soja y sorgo. Las imágenes utilizadas provienen de los satélites de tipo óptico, Sentinel 2 y Terra, y de Sentinel 1, que tiene un sensor radar de apertura sintética. De estos satélites, en particular de Sentinel 1 y 2, se obtuvieron series temporales de varias bandas del espectro electromagnético. El procesamiento de los datos se hizo a través del uso combinado de algoritmos de clasificación no supervisada, supervisada y de reducción de la dimensionalidad. De los no supervisados se evaluaron Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Self Organizing Map (SOM) de Kohonen y Spectral Clustering. De los supervisados se evaluaron AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM) y XGBoost. El algoritmo de reducción de la dimensionalidad utilizado fue t-Distributed Stochastic Neighbor Embedding (t-SNE). Una de las herramientas utilizadas para el procesamiento de los datos georreferenciados y las imágenes satelitales es la moderna y potente plataforma de análisis geoespacial en la nube Google Earth Engine (earthengine.google.com). Con el uso de esta herramienta se generaron mapas a nivel nacional clasificados pixel a pixel. Combinando clasificación no supervisada con el algoritmo de t-SNE se desarrolló una técnica para identificar y depurar datos mal etiquetados, así como zonas sin agricultura dentro de las chacras. Para la clasificación supervisada se generaron modelos que en la dimensión espacial trabajan clasificando puntos georreferenciados, o a nivel nacional, pixel a pixel, y a nivel de cultivo estos indican si hay agricultura o no (modelos binarios) y el tipo de cultivo específico (maíz, soja o sorgo). De los algoritmos supervisados, Random Forest y XGBoost fueron los de mejor desempeño. Para los modelos de clasificación binaria, el mejor desempeño fue 98,5 de F1-Score. Para los modelos de cultivo a nivel de chacra, en maíz y sorgo, el mejor desempeño fue 75,3 y 77,5 de F1, y en soja 98,5, siendo este último superior al obtenido en varios trabajos internacionales. Otro de los objetivos específicos de este trabajo fue poder realizar el seguimiento de la condición de los cultivos en la chacra durante la zafra. Para ello se desarrolló una metodología que utilizando K-Means realiza la zonificación de la chacra en dos o más zonas de acuerdo con la evolución temporal del índice NDVI desde la siembra. Además, a partir de la firma fenológica mediana de la chacra, suavizada a paso diario, y con análisis de derivada primera, se extrajeron las métricas fenológicas de mínimo, punto de inflexión, máximo, días desde mínimo a máximo, amplitud de NDVI entre mínimo y máximo, entre otras. A partir de estás métricas se puede caracterizar una chacra y hacer comparaciones con otras. This work primarily aims to develop a methodology for identifying summer crops in Uruguay, utilizing satellite images and machine learning. For this, databases with georeferenced field information and freely accessible satellite images were used as input. Agricultural producer organizations provided two of the databases, related to farms with agriculture, and others came from the Ministry of Livestock, Agriculture, and Fisheries of Uruguay (MGAP). One database contained information on land cover and land uses and another offered plans for soil conservation due to erosion. The crops present in the databases are corn, soybeans, and sorghum. The images used derive from optical-type satellites Sentinel 2 and Terra and from Sentinel 1, which has a synthetic aperture radar sensor. From these satellites, particularly from Sentinel 1 and 2, time series were obtained from various electromagnetic spectrum bands. Data processing was done through the combined use of unsupervised, supervised, and dimensionality reduction classification algorithms. Among the unsupervised ones, Gaussian Mixture Model (GMM), K-Means, Learning Vector Quantization (LVQ), Kohonen's Self Organizing Map (SOM), and Spectral Clustering were evaluated. Among the supervised ones, AdaBoost, Gradient Tree Boosting, Random Forest, Support Vector Machine (SVM), and XGBoost were assessed. The dimensionality reduction algorithm used was t-Distributed Stochastic Neighbor Embedding (t-SNE). Using the modern and powerful cloud-based geospatial analysis platform Google Earth Engine (earthengine.google.com), maps were generated at the national level, classified pixel by pixel. Combining unsupervised classification with the t-SNE algorithm, a technique was developed to identify and clean mislabeled data and areas without agriculture within the farms. For supervised classification, models were generated that work classifying georeferenced points in the spatial dimension, or nationally, pixel by pixel, and at the crop level, these indicate whether there is agriculture or not (binary models) and the specific type of crop (corn, soybeans, or sorghum). Regarding the supervised algorithms, Random Forest and XGBoost had the best performance. For the binary classification models, the best performance was 98.5 F1-Score. For the crop models at the farm level, in corn and sorghum, the best performance was 75.3 and 77.5 F1, and in soybeans, 98.5, the latter being higher than that obtained in various international works. Another specific objective of this work was to monitor the condition of the crops on the farm during the season. For this, a methodology was developed that, using K-Means, segmented the farm into two or more areas according to the temporal evolution of the NDVI index from sowing. Also, based on the median phenological signature of the farm, smoothed on a daily step, and with first derivative analysis, phenological metrics of minimum, inflection point, maximum, days from minimum to maximum, NDVI amplitude between minimum and maximum, among others, were extracted. From these metrics, one can characterize a farm and make comparisons with others. Fil: Cal Álvarez, Adrián Tabaré. Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales; Argentina. application/pdf https://hdl.handle.net/20.500.12110/tesis_n7436_CalAlvarez spa Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales info:eu-repo/semantics/openAccess https://creativecommons.org/licenses/by-nc-sa/2.5/ar AGRICULTURA APRENDIZAJE AUTOMATICO CLASIFICACION SUPERVISADA Y NO SUPERVISADA GOOGLE EARTH ENGINE IMAGENES SATELITALES METRICAS FENOLOGICAS SENTINEL t-SNE XGBoost AGRICULTURE MACHINE LEARNING SUPERVISED AND UNSUPERVISED CLASSIFICATION GOOGLE EARTH ENGINE SATELLITE IMAGES PHENOLOGICAL METRICS SENTINEL t-SNE XGBoost Metodología automática para mapeo y seguimiento de la condición de cultivos agrícolas durante la zafra a partir de imágenes satelitales y aprendizaje automático en Uruguay Automatic methodology for mapping and monitoring the condition of agricultural crops during the season using satellite imagery and machine learning in Uruguay info:eu-repo/semantics/masterThesis info:ar-repo/semantics/tesis de maestría info:eu-repo/semantics/publishedVersion http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7436_CalAlvarez_oai