ENIGMÁTICAMENTE: ¿Cómo "funciona" la Desviación Típica realmente?

sábado, 20 de febrero de 2021

¿Cómo "funciona" la Desviación Típica realmente?

La Desviación Típica es una medida de dispersión muy empleada cuando se da la media aritmética de una variable. Esta medida es "prima-hermana" de la varianza, ya que se calcula a través de esta. Hoy vamos a ver un ejemplo práctico para entender cómo funciona la Desviación Típica.

Hemos cogido cinco personas y hemos medido su estatura en centímetros. Estos son sus valores:

120 118 111 122 183

Para calcular la desviación típica de estos datos tendremos que calcular previamente la media aritmética y la varianza. Para ello, vamos a seguir los pasos que propone Rowntree (2018).

1.- En primer lugar, vamos a calcular la media aritmética, la cual es la suma de todos los valores partido por el número total de individuos que componen la observación (la muestra, n).

(120 + 118 + 111 + 122 + 183) / 5 = 130,8

2.- Ahora, vamos a ver cómo los valores anteriores difieren de nuestra media 130,8. Para ello, vamos a ordenar las observaciones de menor a mayor. A continuación, simplemente restaremos a cada observación el valor de la media aritmética.

3.- Si cogiésemos la media de las desviaciones tal cual, las medidas positivas se contrarrestarían con las medidas negativas. Por ese motivo, elevamos al cuadrado cada desviación y así nos desharemos de los signos negativos.

4.- Ahora tenemos que recurrir al cálculo de la varianza. La varianza es la media de las desviaciones elevadas al cuadrado respecto a la media aritmética del conjunto.

Varianza = (392,04+163,84+116,64+77,44+2724,84) / 5 = 694,96

5.- La varianza tiene un problema y es que los valores están en unidades (por ejemplo, centímetros) y, por lo tanto, la varianza elevará al cuadrado esas unidades (por ejemplo, centímetros al cuadrado). Entonces, necesitamos una medida que devuelva las mismas unidades originales. ¡Aquí entra en juego la Desviación Típica!, la cual es la raíz cuadrada de la varianza.

Ahora bien, si pasamos estos datos a un paquete estadístico, por ejemplo R, nos daremos cuenta que la varianza y desviación típica no coinciden con nuestros resultados. Esto es devido a que muchos paquetes estadísticos realmente calculan lo que se denomina la cuasivarianza y la cuasidesviación típica (García-Pérez, 2015). La principal diferencia entre la varianza y la cuasivarianza es que en el denominador habría que poner n-1. Es decir, en nuestro caso dividiríamos entre 4. Si lo hiciésemos así, obtendríamos 838,7 y nuestros datos coincidirían con los resultados del programa.

- Cálculo de los datos usando el programa estadístico R.

Este es el "funcionamiento básico" de la Desviación Típica. Por supuesto, para ilustrar el ejemplo hemos usado un ejemplo sencillo, y tal vez algo irreal. Pero, independientemente de la cantidad de datos que tengamos, el proceso es igual.