AD ASTRA

viernes, 2 de febrero de 2018

Distribución bidimensional. Regresión lineal


1.- Definición
Son el resultado de observar un fenómeno cualquiera y extraer del mismo un par de medidas X e Y, que llamaremos variables.

Por ejemplo, cogemos a una clase de 10 niños de sexto de Primaria. De cada niño obtenemos el peso (llámese por ejemplo variable X) y la talla (llámese por ejemplo variable Y).

Los valores de una variable bidimensional son pares de números reales.


2.- Representación gráfica
Estas dos variables se representan en un eje cartesiano llamado Diagrama de dispersión o Nube de puntos, en donde la variable X se pone en el eje horizontal y la variable Y se pone en el eje vertical.

A cada sujeto le corresponde dos variables, supongamos que Jaimito mide 170 cm y pesa 70 kg. En el diagrama de dispersión buscamos en el eje X 170 y en en eje Y el 70, en su intersección hacemos un punto.


3.- Parámetros estadísticos
Existen cuatro parámetros básicos para estas variables:
- Media de la variable X y de la variable Y
- Varianza de la variable X y de la variable Y
- Desviación típica de la variable X y de la variable Y (raíz cuadrada de la varianza)
- Covarianza. Lo que varía la variable X y la variable Y


4.- Correlación
Es el estudio de la relación o dependencia entre las dos variables X e Y. ¿X depende de Y? ¿Cuando X aumenta, Y también lo hace?.

Para ello, el coeficiente de correlación de Pearson (r) nos indica el grado de dependencia que hay entre las variables. 
- Si r es negativo, indicará que el aumento de una variable supondrá la reducción de la otra. 
- Si r es positivo, indica que el aumento de una variable supone el aumento de la otra
- Si r es 0, no hay relación entre las variables

Con la recta de regresión podremos predecir el comportamiento de una variable (desconocida), conociendo la otra variable.

La fórmula de la función de regresión lineal es y = a + bx

Jacob Sierra Díaz

No hay comentarios:

Publicar un comentario