AD ASTRA

sábado, 24 de abril de 2021

Análisis exploratorio de datos en SPSS

Uno de los primeros pasos que deberíamos hacer cuando hayamos creado nuestra base de datos en SPSS es la de hacer un análisis descriptivo exploratorio previo. Con la función Explorar de dicho programa podremos conocer el tamaño muestral, si hay algún dato perdido, información sobre la media, mediana, desviación típica y más información de cada variable, los percententiles y las pruebas de normalidad. Por otro lado, esta función también nos permite obtener gráficos como los gráficos Q-Q (complementan las pruebas de normalidad) o los gráficos de cajas con bigotes (box-plot). Hoy aprenderemos a usar esta importante función.


1.- ¿Qué ofrece el análisis exploratorio?

Tal vez convendría empezar a decir que se recomienda ejecutar este análisis siempre que queramos realizar otros análisis más complejos, ya que como su propio nombre indica, nos permitirá explorar y familiarizarnos con nuestros datos. Además, la mayoría de información descriptiva que necesitamos la solemos encontrar en esta función. 

Esta es una lista extensa de los resultados que nos dará el análisis exploratorio:
  • Procesamiento de casos
  • Análisis descriptivo
    • Media
    • Error estándar
    • Intervalo de confianza al 95%
    • Media recortada al 5%
    • Mediana
    • Varianza
    • Desviación estándar o típica
    • Valor mínimo
    • Valor máximo
    • Rango
    • Rango intercuartílico
    • Asimetría
    • Curtosis
  • Percentiles y cuartilies (incluyendo bisagras de Tukey)
  • Valores extremos o outliers
  • Pruebas de normalidad
    • Prueba Kolmogorov-Smirnov
    • Shapiro-Wilk
  • Histogramas
  • Diagrama de tallo y hojas
  • Gráficos Q-Q (estudio de la normalidad)
  • Box-plot o gráficos de cajas con bigotes



2.- Procedimiento en SPSS

Efectuar el análisis exploratorio en SPSS es tan sencillo como seguir esta ruta:

Analizar > Estadísticos descriptivos > Explorar



En la siguiente ventana meteremos las variables que queramos explorar. Para ello, podemos hacer un análisis solo de algunas (o todas) las variables dependientes [variables que dependen de una característica o variable independiente] o podemos explorar un "sistema" introduciendo variables dependientes con variables independientes o factores [aquellas variables ya están configuradas de modo natural como el sexo o el grupo sanguíneo, por ejemplo].



En el botón Estadísticos pulsaremos en la opción de Descriptivos, Valores atípicos y Percentiles. En el botón de Gráficos pulsaremos la opción Gráficos de normalidad con pruebas.




3.- Interpretación de resultados

Hacer una interpretación de las tablas de los análisis exploratorios es muy sencillo cuando se tienen pequeñas nociones estadísticas. No obstante, te recomendamos que te descargues la siguiente guía para conocer en profundidad el significado de cada una de las tablas de resultados que nos ofrece SPSS con el objetivo de sacarle el máximo partido a tus datos.



4.- Guía para llevar a casa

Tal y como te acabamos de comentar, puedes escanear con tu dispositivo móvil el siguiente código QR o hacer clic en el siguiente enlace para descargarte la guía sobre los análisis exploratorios en SPSS.




En esta guía veremos mediante un caso práctico real todas las funciones de los análisis exploratorios. En concreto veremos qué significa cada una de las tablas y cómo se interpretan los gráficos que hemos solicitado. Por otro lado, veremos qué tablas son las que más nos interesa consultar y qué información es la más relevante para reflejar en nuestros informes o artículos.




5.- Banco de datos

¿Quieres "jugar" con una base de datos antes de usar la tuya? Haz clic en el siguiente enlace para acceder a los datos .sav que han sido usados para la elaboración de la guía. Así podrás seguir y verificar paso a paso cada uno de los procedimientos y resultados descritos en la misma.


Nuestra base de datos contiene tres calificaciones de un examen de inglés que han realizado 30 personas. En concreto se realizaron tres pruebas para medir el nivel de habla (speaking), lectura (reading) y escucha (listening) de 10 españoles, 10 franceses y 10 alemanes. Las pruebas se puntuaban sobre 100 (el máximo que se puede sacar en cada prueba). En este caso, la variable independiente o factor es la Nacionalidad y las variables dependientes son las tres prueba citadas anteriormente.

- Simplemente se desea conocer la estadística descriptiva más relevante de estos datos y valorar los siguientes pasos para un análisis estadístico más complejo.





Sigma y Jacob Sierra Díaz

domingo, 4 de abril de 2021

La prueba Shapiro-Wilk con SPSS

La prueba Shapiro-Wilk es un test estadístico muy similar a la prueba Kolmogorov-Smirnov que nos ayuda a saber si los datos de nuestra muestra proceden de una población que sigue una distribución normal. La principal diferencia de esta prueba con la de Kolmogorov-Smirnov reside en el tamaño muestral: esta prueba se aplica para variables cuantitativas con muestras menores o iguales a 50 participantes o items. Si la muestra es mayor, deberás realizar el prueba Kolmogorov-Smirnov, que se detalla haciendo clic en el siguiente enlace:



1.- ¿Qué es la prueba Shapiro-Wilk?

Al igual que la prueba Kolmogorov-Smirnov, es un test estadístico de bondad de ajuste a una distribución normal que se aplica en determinadas circunstancias para determinar si los datos de la muestra objeto de estudio se han extraído aleatoriamente de una población que siga un modelo de probabilidad ajustado a una distribución normal.


El test Shapiro-Wilk consiste en una prueba de significación estadística que contrasta las mismas hipótesis que en el caso de su "test hermano" Kolmogorov-Smirnov.

  • Hipótesis nula (Ho). La muestra procede de una población que sigue una distribución normal. Aceptaremos esta hipótesis tan deseada cuando el p-valor (significatividad) es mayor a 0,050.

  • Hipótesis alternativa (H1 o Ha). La muestra no procede de una población que se distribuye según un modelo de probabilidad normal. Por el contrario, aceptaremos esta hipótesis cuando el p-valor de la prueba sea menor que 0,050.




2.- ¿Qué requisitos se deben cumplir para realizar esta prueba?

Al contrario de su prueba "hermana" K-S, la muestra debe ser inferior o igual a 50 participantes o items y se debe efectuar para variables dependientes cuantitativas.




3.- Procedimiento en SPSS

Este tipo de análisis es muy sencillo en SPSS. Simplemente se debe seguir la siguiente ruta:

Analizar > Estadísticos descriptivos > Exploratorios


En la ventana introduciremos las variables objeto de estudio en el espacio Lista de dependientes. A continuación, se pulsará el botón Gráficos y se seleccionará Gráficos de normalidad con pruebas. Por último, pulsamos en Continuar y Aceptar.




4.- Interpretación de los resultados

En la Ventana de resultados se nos mostrarán las tablas. La que más nos interesa es la que tiene como título Pruebas de normalidad. En dicha tabla, podemos ver los resulados de las dos pruebas de bondad de ajuste a una distribución normal (la K-S y la S-W). Lo que tenemos que mirar es la columna de la Sig. (significación; p-valor) y determinar si aceptamos o rechazamos la hipótesis nula. Además, aconsejamos reflejar su correspondiente Estadístico (W).


En este caso miraremos la columna de Shapiro-Wilk, porque como se ha señalado anteriormente, nuestra muestra es menor que 50. No obstante, démonos cuenta que ambas pruebas nos llevan a la misma conclusión. En el ejemplo de la tabla debemos rechazar la hipótesis nula y concluir que nuestros datos proceden de una población que no se sigue una distribución  normal.


Podemos seguir los consejos de la guía APA para reportar esta prueba en un informe o artículo científico. Esta guía nos sugiere que empecemos diciendo si la variable procede de una población que sigue una distribución normal. A continuación, reflejaremos el estadístico W de la prueba seguido de los grados de liberad entre paréntesis y finalizando con el p valor. Si nos damos cuenta, seguimos el orden con el que viene reflejado en la tabla. Veamos un ejemplo:
  • El test Shapiro-Wilk indica que la variable Velocidad no sigue una distribución normal: W(24) = 0,882; p = 0,009.
  • The Shapiro-Wilk test shows taht the variable "Velocidad" do not follow a normal distribution: W(24) = 0,882; p = 0,009.



5.- Guía para llevar a casa

Puedes escanear el siguiente código QR o hacer clic en el enlace para descargarte la guía de funcionamiento de esta prueba. Esto te permitirá llevarla a cualquier sitio e incluso imprimirla.


En esta guía vamos a aprender que es eso de la prueba Shapiro-Wilk y los supuestos que debemos cumplir para usarla. Además, descubriremos otra información de especial relevancia para nuestros análisis de la variable objeto de estudio. Puedes dejar tu comentario abajo sobre cualquier tema relacionado con la guía o con la prueba.


Sigma y Jacob Sierra Díaz