Estimación robusta para un modelo de reducción de la dimensión

Las técnicas no paramétricas son herramientas flexibles para poder estudiar la relación entre una variable aleatoria continua y un vector de covariables explicativas, pero para su aplicación requieren un número de observaciones que crece exponencialmente con la dimensión p del vector de covariables. Una manera de poder enfrentar la estimación no-paramétrica con una muestra de tamaño moderado y p grande, es obtener un número reducido de nuevas variables explicativas sin disminuir la información que ellas provean sobre la variable respuesta. Las diversas estrategias para encarar este problema se engloban en lo que se denomina reducción de la dimensión. Cook [2007] introduce el concepto de reducción suficiente, y el modelo de principal fitted components (PFC). Cook y Forzani [2008] calcula el estimador de máxima verosimilitud (MV) para el modelo PFC suponiendo que los errores tienen distribución normal multivariada. Sin embargo, cuando hay contaminación o la distribución de los errores no es normal multivariada, los estimadores de MV se ven muy afectados y por lo tanto en estos casos, pueden ser muy poco informativos. En esta tesis proponemos estimadores robustos de tipo τ para estimar el modelo PFC y por consiguiente para la correspondiente reducción suficiente. Estos estimadores están basados en una τ-escala (ver Yohai y Zamar [1988]). Definimos el τ-funcional de estimación del cual se derivan los τ-estimadores propuestos. Se demuestra que bajo condiciones generales estos estimadores son fuertemente consistentes. A partir de las ecuaciones de estimación se obtiene una expresión para los τ-estimadores similar a la de MV, excepto que las observaciones aparecen acompañadas por pesos que, a su vez, dependen de los parámetros. Esto sugiere un algoritmo iterativo natural para computar los τ . También se discute cómo obtener valores iniciales para este algoritmo. Un estudio de Monte Carlo permite comparar los τ -estimadores y los estimadores de MV bajo el modelo PFC y bajo contaminación por outliers. Los resultados de esta simulación muestran claras ventajas para los τ -estimadores. También se presenta una propuesta de selección de la dimensión del espacio de reducción basada en validación cruzada. Finalmente, ilustramos la aplicación del método con dos ejemplos de datos reales. Las demostraciones de los resultados se presentan en varios apéndices.

Saved in:
Bibliographic Details
Main Author: Szretter Noste, María Eugenia
Other Authors: Yohai, Víctor Jaime
Format: info:eu-repo/semantics/doctoralThesis biblioteca
Language:spa
Published: Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Subjects:REDUCCION DE LA DIMENSION, PRINCIPAL FITTED COMPONENTS, ESTIMACION ROBUSTA, T-ESTIMADOR, REDUCCION SUFICIENTE, REGRESION INVERSA, SELECCION DE LA DIMENSION, DIMENSION REDUCTION, ROBUST ESTIMATION, T-ESTIMATOR, SUFFICIENT REDUCTION, INVERSE REGRESSION, DIMENSION SELECTION,
Online Access:https://hdl.handle.net/20.500.12110/tesis_n6322_SzretterNoste
http://repositoriouba.sisbi.uba.ar/gsdl/cgi-bin/library.cgi?a=d&c=aextesis&d=tesis_n6322_SzretterNoste_oai
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:Las técnicas no paramétricas son herramientas flexibles para poder estudiar la relación entre una variable aleatoria continua y un vector de covariables explicativas, pero para su aplicación requieren un número de observaciones que crece exponencialmente con la dimensión p del vector de covariables. Una manera de poder enfrentar la estimación no-paramétrica con una muestra de tamaño moderado y p grande, es obtener un número reducido de nuevas variables explicativas sin disminuir la información que ellas provean sobre la variable respuesta. Las diversas estrategias para encarar este problema se engloban en lo que se denomina reducción de la dimensión. Cook [2007] introduce el concepto de reducción suficiente, y el modelo de principal fitted components (PFC). Cook y Forzani [2008] calcula el estimador de máxima verosimilitud (MV) para el modelo PFC suponiendo que los errores tienen distribución normal multivariada. Sin embargo, cuando hay contaminación o la distribución de los errores no es normal multivariada, los estimadores de MV se ven muy afectados y por lo tanto en estos casos, pueden ser muy poco informativos. En esta tesis proponemos estimadores robustos de tipo τ para estimar el modelo PFC y por consiguiente para la correspondiente reducción suficiente. Estos estimadores están basados en una τ-escala (ver Yohai y Zamar [1988]). Definimos el τ-funcional de estimación del cual se derivan los τ-estimadores propuestos. Se demuestra que bajo condiciones generales estos estimadores son fuertemente consistentes. A partir de las ecuaciones de estimación se obtiene una expresión para los τ-estimadores similar a la de MV, excepto que las observaciones aparecen acompañadas por pesos que, a su vez, dependen de los parámetros. Esto sugiere un algoritmo iterativo natural para computar los τ . También se discute cómo obtener valores iniciales para este algoritmo. Un estudio de Monte Carlo permite comparar los τ -estimadores y los estimadores de MV bajo el modelo PFC y bajo contaminación por outliers. Los resultados de esta simulación muestran claras ventajas para los τ -estimadores. También se presenta una propuesta de selección de la dimensión del espacio de reducción basada en validación cruzada. Finalmente, ilustramos la aplicación del método con dos ejemplos de datos reales. Las demostraciones de los resultados se presentan en varios apéndices.