ENIGH 2018

Para el análisis de la ENIGH 2018 se hará uso del repositorio que se encuentra en el repositorio de bitbucket:
       
https://bitbucket.org/vrffelipe/enigh/src/master/            
 

Dado que no encontré una función para crear deciles, cree una función que lo hace a partir de la frecuencia acumulada. La función espera cuatro parámetros que son

$deciles\left ( df,col,col1,col2,col3 \right )$

donde:

$df=$ data frame al que se le aplicará la función
$col=$ columna donde se encuentra la frecuencia
$col1=$ vector según el cual se ordenará el data frame de entrada
$col3=$ vector según el cual se ordenará el data frame de salida
$col3=$vector según el cual se ordenará el data frame de salida

La función ordena los datos entrantes típicamente según el ingreso y, en el caso de la ENIGH, para devolverlos al orden inicial los ordena según el folio de la vivienda y del hogar en el caso de la tabla Concentrado.
Conceptualmente los deciles se crean acumulando la frecuencia y dividiéndola entre el total de los datos, lo que hace que la muestra se divida en partes iguales. Posteriormente sólo se toma el porcentaje de la muestra que corresponde, por ejemplo, para un quintil, 20%, para un decil el 10%.

La fórmula es:

$Fa_{i}=\frac{{\sum_{i}^{N}} X_i}{N }$

Donde:
$Fa_{i} =$Frecuencia acumulada hasta el elemento i
${X_i}= $Suma de las frecuencias hasta el elemento i
$N =$Número total de elementos de la muestra

El archivo que tiene esta función es deciles.R




Comentarios

Entradas populares de este blog

El ejército revolucionario de Chihuahua y la División del Norte (1911-1915)

Reflexiones sobre la experiencia de la industrialización en relación a la experiencia de la modernidad en México.