Estimación robusta en modelos de regresión funcional

La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas.

Saved in:
Bibliographic Details
Main Author: Parada, Daniela Laura
Other Authors: Boente Boente, Graciela Lina
Format: info:eu-repo/semantics/masterThesis biblioteca
Language:spa
Published: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Subjects:DATOS FUNCIONALES, MODELO DE REGRESION FUNCIONAL, ESTIMACION ROBUSTA, DIRECCIONES PRINCIPALES ESFERICAS, MM-ESTIMADORES, FUNCTIONAL DATA, FUNCTIONAL REGRESSION MODEL, ROBUST ESTIMATION, SPHERICAL PRINCIPALCOMPONENTS, MM-ESTIMATORS,
Online Access:https://hdl.handle.net/20.500.12110/tesis_n7298_Parada
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n7298_Parada_oai
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:La mayoría de los procedimientos estadísticos clásicos están basados en modelos con hipótesis rígidas, tales como errores normales u observaciones equidistribuídas, entre otros. Bajo estas hipótesis, se deducen procedimientos óptimos. Sin embargo, estos métodos son muy sensibles al incumplimiento de las hipótesis que los generaron. Los métodos estadísticos robustos tienen como objetivo permitir inferencias válidas cuando el modelo no se cumple exactamente y, al mismo tiempo, ser altamente eficientes bajo el modelo central. Por otra parte y en muchas aplicaciones, los datos observados provienen de fenómenos que son continuos en el tiempo o en el espacio y que pueden ser supuestos como curvas o funciones suaves más que como vectores de dimensión finita. El análisis de datos funcionales ha recibido considerable atención por su versatilidad en estos contextos. Cabe mencionar que el análisis de este tipo de datos requiere herramientas propias ya que, en muchas ocasiones, las extensiones naturales de las técnicas estadísticas multivariadas usuales no son adecuadas. El objetivo de esta tesis de maestría es hacer una revisión bibliográfica del tema, en particular, de los procedimientos existentes para estimar los parámetros en un modelo regresión funcional cuando las covariables son funcionales y cumplen un modelo lineal o cuadrático, a la vez que proponer estimadores robustos de los parámetros involucrados. En particular, se considera el modelo cuadrático dado en Yao y Müller (2010) y en Horváth y Reeder (2013), así como sus propuestas de estimación. Como la presencia de valores atípicos en las covariables funcionales puede afectar el procedimiento de estimación cuando se utilizan las componentes principales muestrales para reducir la dimensión y estimar los parámetros de la regresión, se definen estimadores robustos para el modelo cuadrático utilizando estimadores de las direcciones principales esféricas (Locantore et al., 1999; Gervini, 2008). Más específicamente, proponemos usar estimadores robustos de las direcciones principales para generar los espacios de dimensión finita que constituyen los posibles candidatos tanto para el parámetro de regresión funcional como el operador cuadrático, para luego usar MM−estimadores de regresión (Yohai, 1987). Se analiza la sensibilidad de estos estimadores ante la presencia de distintos porcentajes de datos atípicos, tanto en los residuos como en las covariables emulando las propuestas de simulación de Yao y Müller (2010) y Boente et al. (2020). Por último, se aplican estas técnicas a dos conjuntos de datos espectrales diferentes, ambos conocidos por presentar observaciones atípicas.