Documentación

Documentación

doc

Ejemplo de Documento word

ppt

Ejemplo de un documento Power point
imagen_docuemnto_logos

pdf

Logos Encuesta Andaluza de Salud
Categorías
Categorías

Técnicas de ponderación implementadas

En el muestreo de encuestas, la ponderación es uno de los pasos críticos. Para una encuesta dada, a cada unidad de la muestra seleccionada se le asigna un peso que se utiliza para obtener estimaciones de parámetros poblacionales de interés. La producción de estimaciones sin sesgo solo será posible con ponderaciones adecuadas.

Para resolver los problemas derivados de sesgos de selección, de falta de respuesta o de falta de representatividad en las encuestas, se pueden utilizar diversas técnicas de reponderación. Las más sencillas se basan en reponderar la muestra asignando pesos nuevos de forma que la representación de algunos grupos sociodemográficos en la muestra sea la misma que estos grupos tienen en la población. Otras técnicas de ponderación se centran en la estimación de las probabilidades de participar en la encuesta y de responder a las preguntas.

Independientemente del enfoque elegido, la clave para una ponderación eficaz que elimine el sesgo en las encuestas no probabilísticas reside en el uso de información auxiliar eficaz.  Esta información auxiliar puede estar disponible en diferentes formatos. Distinguimos tres casos: Información básica, Información parcial, Información completa según la información disponible.

  • Información básica: Solo se conocen los totales poblacionales de las variables auxiliares (a menudo denominados totales de control). Las posibles fuentes de información son un censo de la población objetivo, un registro administrativo, etc. Uno de los totales de control más sencillos y utilizados se da cuando la información consiste en recuentos conocidos de un conjunto de grupos de población. 

 

  • Información parcial: Los valores de las variables auxiliares están disponibles para cada elemento de una muestra probabilística de referencia. Esta se realiza sobre la misma población objetivo que la encuesta a analizar, con la principal diferencia de que la primera tiene mayor cobertura y tasas de respuesta más altas que la segunda, por lo que es adecuada para representar el comportamiento que debería tener la población objetivo.

 

  • Información completa: Los valores de las variables auxiliares están disponibles para cada elemento de la población, es decir se dispone de un censo de la población objetivo con los valores de algunas variables que pueden ser usadas para ajustar la muestra.

 

Según el tipo de información auxiliar de que se disponga se podrán aplicar diversos métodos de reponderación. En esta aplicación se han implementado algunas de las principales técnicas de reponderación aplicables en cada situación.

Una vez obtenidos estos pesos nuevos se han de utilizar en los diversos procedimientos de inferencia que el investigador quiera realizar. Por ejemplo, se puede utilizar el estimador de Horvitz-Thompson para obtener estimaciones de la media poblacional (Horvitz y Thompson, 1952) o aplicar una regresión ponderada.

Tras calculados los pesos, la plataforma BETTERSURVEYS permite estudiar las características de los nuevos pesos, proporcionando medidas descriptivas así como representaciones gráficas de ellos. Esto permite detectar posibles problemas de pesos extremos o una gran variabilidad de los pesos que influya en el aumento del error en las estimaciones.

La plataforma también permite comparar entre sí los pesos obtenidos frente a los pesos originales de la muestra, así como comparar entre sí los pesos obtenidos mediante los diferentes procedimientos de reponderación implementados.

Método de Calibración (información básica)

Método Propensity Score Adjustment (PSA) (información parcial)

Método Kernel Weighting (KW) (información parcial)

El método de Kernel Weighting (Wang et al., 2020, Kern et al., 2021 )utiliza las probabilidades de participar en la muestra no probabilística que proporciona el método PSA. Concretamente, calcula las diferencias en dicha probabilidad entre cada unidad de la muestra probabilística y cada unidad de la muestra no probabilística. Estas diferencias se suavizan utilizando una función Kernel, y los pesos finales para un individuo de la muestra no probabilística se obtienen sumando los pesos de diseño de cada unidad de la muestra probabilística multiplicados por la diferencia suavizada de esa unidad con la unidad de la muestra no probabilística cuyo peso vamos a obtener. El método KW utiliza las propensidades como medida de similitud y es menos sensible a la especificación incorrecta del modelo, al tiempo que evita los pesos extremos del método PSA.

Al igual que en el método anterior la plataforma incluye dos variantes de KW:

  • Kernel Weighting con regresión logística. Seleccionando esta opción se emplea la regresión logística para la predicción de propensidades como en el trabajo original de Wang et al., 2020.
  • Kernel Weighting con Gradient Boosting. Seleccionando esta opción se emplea el algoritmo de aprendizaje automático Histogram-Based Gradient Boosting Classification Tree (Guryanov, 2019) para la predicción de propensidades.

 

Cuando existe información completa de cada unidad del marco

En esta situación se puede aplicar tanto la calibración (obtenidendo los totales a partir de los datos del censo) como los métodos  PSA y KW (considerando el censo como encuesta probabilística de referencia)  para calcular los nuevos pesos ajustados.

Estas técnicas de reponderación pueden combinarse entre sí. Por ejemplo, una técnica que ha dado buenos resultados para ajustar el sesgo de selección en encuestas no probabilísticas es la combinación del método PSA con la calibración: en una primera etapa se obtienen los pesos estimados mediante PSA y estos pesos se utilizan como base para la calibración en una segunda etapa (Lee and Valliant, 2009) . Del mismo modo se puede hacer calibración a partir de los pesos obtenidos mediante KW.