CEMRepBoot: una aplicación en R Shiny para el cálculo de errores muestrales por replicaciones Bootstrap en las encuestas del INDEC

El Instituto Nacional de Estadística y Censos (INDEC) tiene la labor de diseñar, recolectar y analizar encuestas a hogares a partir de las cuales se construyen gran parte de los indicadores que produce. Estas encuestas se basan en muestreos probabilísticos, donde en el diseño se incluyen diferentes niveles de estratificación, selección con probabilidades no uniformes y varias etapas de selección. Este diseño complejo más los ajustes por cobertura, no respuesta y calibración de los factores de expansión de las encuestas impide obtener una expresión analítica sencilla para los errores de muestreo. Para resolver esta dificultad y, respondiendo al objetivo de estandarizar los procesos estadísticos y unificar el cálculo de los errores de muestreo en las distintas de encuestas a hogares, el INDEC utiliza la metodología de replicación de factores de expansión mediante Bootstrap desarrollado por Rao y Wu (1988) y Rao, Wu y Yue (1992). La misma se encuentra documentada en las Notas Técnicas asociadas a las encuestas en cuestión y a disposición de todos los usuarios en el sitio web del Instituto. Pese a utilizar la metodología Bootstrap, realizar estimaciones de los errores de muestreo bajo un diseño complejo implica un conocimiento avanzado de algún software estadístico, tarea que puede resultar compleja para los usuarios no especializados. Con el objetivo de brindarles asistencia, el Instituto ha desarrollado una herramienta interactiva, denominada CemRepBoot que emplea el paquete Shiny de R para facilitar el cálculo de las medidas de error asociadas a las estimaciones. La herramienta aplica sobre la base usuaria de los microdatos de las encuestas que comparte el INDEC al público en general, y, con conocimientos mínimos, habilita a los usuarios a que puedan efectuar los mismos cálculos que emplea el Instituto para sus estimaciones, y de las medidas de error asociadas. El producto estará a disposición de los usuarios en el micrositio de cada encuesta, conjuntamente con la documentación o guía de uso, y las notas aclaratorias correspondientes de la versión definitiva.

Saved in:
Bibliographic Details
Main Authors: Ciardullo, Emanuel, García, Gregorio, Marí, Gonzalo, Mitas, Gerardo
Format: video biblioteca
Language:spa
Published: 2020-10
Subjects:R shiny, Estadísticas oficiales, Muestreo, Diseño complejo, Error de muestreo, Bootstrap,
Online Access:http://hdl.handle.net/11086/16864
Tags: Add Tag
No Tags, Be the first to tag this record!
Description
Summary:El Instituto Nacional de Estadística y Censos (INDEC) tiene la labor de diseñar, recolectar y analizar encuestas a hogares a partir de las cuales se construyen gran parte de los indicadores que produce. Estas encuestas se basan en muestreos probabilísticos, donde en el diseño se incluyen diferentes niveles de estratificación, selección con probabilidades no uniformes y varias etapas de selección. Este diseño complejo más los ajustes por cobertura, no respuesta y calibración de los factores de expansión de las encuestas impide obtener una expresión analítica sencilla para los errores de muestreo. Para resolver esta dificultad y, respondiendo al objetivo de estandarizar los procesos estadísticos y unificar el cálculo de los errores de muestreo en las distintas de encuestas a hogares, el INDEC utiliza la metodología de replicación de factores de expansión mediante Bootstrap desarrollado por Rao y Wu (1988) y Rao, Wu y Yue (1992). La misma se encuentra documentada en las Notas Técnicas asociadas a las encuestas en cuestión y a disposición de todos los usuarios en el sitio web del Instituto. Pese a utilizar la metodología Bootstrap, realizar estimaciones de los errores de muestreo bajo un diseño complejo implica un conocimiento avanzado de algún software estadístico, tarea que puede resultar compleja para los usuarios no especializados. Con el objetivo de brindarles asistencia, el Instituto ha desarrollado una herramienta interactiva, denominada CemRepBoot que emplea el paquete Shiny de R para facilitar el cálculo de las medidas de error asociadas a las estimaciones. La herramienta aplica sobre la base usuaria de los microdatos de las encuestas que comparte el INDEC al público en general, y, con conocimientos mínimos, habilita a los usuarios a que puedan efectuar los mismos cálculos que emplea el Instituto para sus estimaciones, y de las medidas de error asociadas. El producto estará a disposición de los usuarios en el micrositio de cada encuesta, conjuntamente con la documentación o guía de uso, y las notas aclaratorias correspondientes de la versión definitiva.