AD ASTRA

viernes, 25 de diciembre de 2020

Agrupaciones por intervalos

Con el fin de facilitar el análisis y la interpretación de los datos, los datos de una variable se pueden agrupar por intervalos. No obstante, esta práctica está en desuso debido a que la estadística ya se hace con ordenadores.


1.- Conceptos básicos

Un intervalo son dos valores de una variable cuantitativa separados por un guión y abarcados con corchetes y/o paréntesis. Por ejemplo, [5 - 10], (1 - 3), [45 - 47), (56 - 78] ...

  • Los corchetes incluyen al valor en el intervalo. Por ejemplo, en el caso del intervalo [5 - 10) el 5 está incluido en este intervalo. 
  • Los paréntesis excluyen al valor en el intervalo. Por ejemplo, en el intervalo [5 - 10) el 10 no está incluido en el intervalo.

Los dos valores del intervalo se llaman extremos de clase. En cada intervalo hay un límite inferior y un límite superior. En el ejemplo [5 - 10) el límite inferior es 5 y el superior es 10. 

La marca de clase es el punto medio del intervalo y se calcula en cada intervalo con la siguiente fórmula: (Límite inferior + Límite superior) / 2. En el ejemplo [5 - 10) la marca de clase es 7,5 porque (5 + 10) / 2 = 7,5

Llamamos amplitud o tamaño del intervalo a la resta del límite superior menos el límite inferior. En el ejemplo [5 - 10) la amplitud es 5 porque 10 - 5 = 5.


2.- Diseño de intervalos

Normalmente los intervalos no se construyen bajo el criterio del investigador, sino bajo un criterio matemático. En este epígrafe veremos las dos fórmulas principales que podremos usar para saber el número de intervalos que tendremos y su amplitud recomendable.

1) Para saber el número ideal de intervalos k que podremos hacer se recomienda usar la fórmula de Sturges (1926).

No obstante, existe otro criterio para establecer el número ideal de intervalos: criterio de Kaiser. Se trata de la raiz cuadrada del número total de observaciones.

2) Para saber la amplitud que tendrán nuestros k intervalos se recomienda aplicar la siguiente fórmula:


3.- Guía para llevar a casa

Haz clic en el siguiente enlace para acceder desde la nube de Box la guía sobre los agrupamientos por intervalos. Puedes leerla en línea o descargarla en tu dispositivo en formato PDF.

Guía de Agrupamientos por Intervalos (Clic aquí para acceder)


En ella podrás aprender a expresar un intervalo cualquiera matemáticamente, conocer el concepto de amplitud variable y constante, o ver un ejemplo práctico de las dos sencillas fórmulas para construir intervalos.



Fuente bibliográfica

  • Sturges, H. (1926). The choice of a class-interval. Journal of American Statistical Association, 21, 65-66.


Sigma y Jacob Sierra Díaz

domingo, 20 de diciembre de 2020

Tablas de distribución de Frecuencias

Una de las técnicas más básicas para resumir datos consiste en agrupar las distintas observaciones en cada una de las categorías correspondientes y reflejarlas en una tabla. A esas tablas se les conoce como tablas de distribución de frecuencias.  


1.- Tipos de tablas de distribución

Podemos distinguir tres tipos de tablas en función del tipo de variable con la que estemos trabajando (variable cualitativa o cuantitativa). La diferencia de cada una de ellas radica en la primera columna que corresponderá con las categorías o modalidades de la variable

Si las categorías de esta primera columna contienen palabras, estamos ante una tabla de distribución de una variable cualitativa. Si, por el contrario, contiene valores numéricos, estamos ante una tabla de distribución de una variable cuantitativa. A su vez, las variables cuantitativas se pueden agrupar en intervalos; por lo que diremos que estamos ante una tabla agrupada.




2.- Elementos de una tabla de distribución

Una tabla de distribución de frecuencia tiene básicamente cinco columnas. No obstante, también puedes encontrarte tablas que incluyan más información.

En la primera columna, se reflejan las categorías, valores o modalidades de la variable. 

En la segunda columna, se incluyen las frecuencias que tiene cada una de las categorías de la variable observadas en la muestra. A este valor se le llama oficialmente frecuencia absoluta ni (xi o ii en función de la naturaleza de la variable). 
  • La suma de todas las frecuencias absolutas nos da la frecuencia total n o el número total de participantes de la muestra.

En la tercera columna, se muestra la frecuencia relativa fi o fr. Esta es la división entre la frecuencia absoluta (de cada categoría) entre el número total de la muestra.

  • La suma de esta columna deberá de dar 1.
  • Podemos calcular el porcentaje de individuos pi de cualquier categoría o valor multiplicando la frecuencia relativa fi por 100.

En la cuarta columna, se refleja la frecuencia absoluta acumulada Ni. Esta es la suma de las frecuencias absolutas anteriores hasta una categoría dada.
  • El último valor debe coincidir con el número total de la muestra.

Finalmente, la quinta columna, incorpora la frecuencia relativa acumulada Fi. Esta es la división de la frecuencia acumulada entre el número total de individuos de la variable.

  • El último valor debe dar 1.


3.- Guía para llevar a casa

Para conocer en profundidad cómo se elabora una tabla de distribución de frecuencias, puedes hacer clic en el siguiente enlace. Puedes leer o descargarla la guía en tu dispositivo.


En esta guía aprenderemos conceptos generales, descubriremos las fórmulas detrás de las tablas y analizaremos paso a paso cómo diseñar una tabla de distribución a través de un caso práctico. ¿Aún así tienes dudas? ¡No hay problema! No olvides que también puedes escribir un comentario aquí si tienes alguna duda sobre este apasionante tema.




4.- Ejemplo práctico

Mediante una encuesta por teléfono se ha obtenido información del nivel de estudios a 120 personas. Esta variable tiene cuatro categorías: sin estudios, Primaria, Secundaria y Universitario.

Para presentar los datos, se ha elaborado una tabla de distribución de frecuencias:




Sigma y Jacob Sierra Díaz