AD ASTRA

lunes, 6 de julio de 2020

1.0.- Preparación de la base de datos

Un pequeño repaso

En el apartado anterior hemos visto qué es una variable. Además, hemos aprendido que las variables se dividen en dos grandes grupos [cualitativa y cuantitativa]. A su vez, cada grupo se subdivide en dos categorías más:
  • Las variables cualitativas pueden ser nominales (no orden) u ordinales (orden).
  • Las variables cuantitativas pueden ser discretas (números enteros) o continuas (cualquier valor).

Puedes volver a repasar el concepto de variable y sus clasificaciones haciendo clic en el siguiente enlace:



¿Por dónde c*** empiezo con el SPSS?

Abrir por primera vez el SPSS puede ser muy abrumador para las personas que no están familiarizadas con el tratamiento estadístico en software específicos. El SPSS es como una hoja de cálculo de Excel o Numbers, pero con diferencias muy importantes. Por lo tanto, no es de extrañar que la primera pregunta que se hagan los intrépidos usuarios noveles al ver las ventanas abiertas del programa sea: ¿por dónde empiezo?

La respuesta es asombrosamente sencilla: por la Vista de variables. ¿Por qué? Porque el primer paso que tenemos que dar incluso antes de comenzar a meter los datos que hayamos recogido en nuestras intervenciones es la de crear las variables objeto de estudio. Y eso se hace en esta ventana.



Indicaciones previas

Antes de comenzar a introducir variables a lo loco debes conocer una serie de normas y recomendaciones que serán importantes a la hora de crear nuestro listado de variables:
  • Cada fila (en la ventana Vista de variable) representa una variable. Así, por ejemplo, si tenemos 100 variables, deberemos rellenar las primeras 100 filas.
  • Las casillas más importantes que especificar a la hora de crear una nueva variable son: NombreTipoDecimalesEtiquetasValores y Medida. Las otras casillas tienen menos relevancia a la hora de especificar las variables.
  • En la primera casilla (Nombre) es recomendable que uses más de 8 caracteres para nombrar una variable. Así por ejemplo, en lugar de llamar a la variable Identificación_Sujeto, acórtalo poniendo simplemente ID

  • En la primera casilla (Nombre) no podrás separar el nombre de la variable por espacios.
    • En el caso de quieras usar un espacio en el nombre de una variable, debes usar la barra baja (_). Por ejemplo, para la variable número de hermanos deberás poner Num_Hermanos (o simplemente Hermanos).
    • Usa la casilla Etiqueta para detallar el nombre de las variable. En este apartado podrás usar espacios e incluso oraciones para describir la variable. Por ejemplo, si una variable se llama Preg_1 en la casilla Etiqueta podrás escribir toda la pregunta a la que hace referencia la variable.
  • En la primera casilla (Nombre) no podrás empezarla con un número. Así, por ejemplo, deberás poner Item_1 en lugar de 1_Item.
  • Es recomendable que para variables cualitativas o continuas discretas quites los decimales en la casilla Decimales, ya que puede ser molesto u resultar sobrecargado ver con posterioridad 1,00; 2,00; 4,00; 5,00.
  • Siempre y cuando tengas una variable [normalmente cualitativa] que esté compuesta por varios grupos (por ejemplo hombre o mujer), deberás codificar y especificar cada grupo en la casilla Valores.
  • Tipifica todas las variables cuantitativas como Escala (en la casilla de Medida).


Caso práctico: una base de datos para individuos

Con el objetivo de mejorar la comprensión de los pasos que debemos realizar a la hora de crear nuestra base de datos, vamos a contexualizar el procedimiento con un caso práctico. Nuestra base de datos está compuesta por personas, y más concretamente, por niños y niñas de un colegio público de una gran ciudad.

Ya que estamos ante personas, las primeras variables que crearemos (y que previamente hemos obtenido en la intervención) serán de tipo sociométrico: género, edad, curso, número de hermanos... A continuación, meteremos todas las variables que realmente sean objeto de estudio de nuestra investigación: resultados de un cuestionario, escalas de Likert... Date cuenta que se suelen poner en las variables de tipo cualitativas que "vienen dadas por cada sujeto" (variables independientes) en primer lugar. Después se suelen ubicar las variables dependientes que en su mayoría suelen ser de tipo cuantitativo (aunque también hay otras de tipo cualitativo que pueden ser dependientes como pueden ser "lector o no lector en tiempo libre"). 

No te preocupes si tus investigaciones no consisten en examinar personas. El procedimiento de creación de variables en el programa es similar independientemente de la naturaleza de la intervención y futuro análisis estadístico.


Creando nuestras primeras variables

1) ID como primera variable

La primera variable que debemos crear (independientemente de la naturaleza de nuestra muestra) es la de Identificación. Por un lado, nos permitirá identificar a cada uno de nuestros sujetos que forman parte de nuestra muestra. Para ello, debemos tener un documento a parte con la relación de los nombre y el número de identificación (que a la hora de ponerlo suele ir en orden). Por otro, nos permitirá ordenar la variable en el orden original en el que introducimos a cada sujeto. Esto es muy útil si previamente le hemos ordenado la base con otro criterios como puede ser, por ejemplo, según el curso académico.

¡Manos a la obra! A continuación, vamos a detallar lo que deberemos poner en cada una de las casillas de Vista de variables para crear nuestra primera variable de identificación.

  • Nombre: ID 
  • Tipo: Numérico - Por omisión
  • Anchura: 8 - Por omisión
  • Decimales: 0 - Se trata de una variable que usa números enteros (1,2,3...145...)
  • Etiqueta: Identificación del alumno - Podemos poner cualquier otra explicación
  • Valores: Ninguno
  • Columnas: 8 - Por omisión
  • Alineación: Derecha - Por omisión
  • Medida: Ordinal - Es cierto que es una variable cuantitativa discreta, pero también es cierto que se establece un orden.
  • Rol: Entrada - Por omisión

En definitiva, tenemos que tener algo parecido a esto:



2) Género: una variable con dos valores


Siempre y cuando tengamos una muestra compuesta por hombres y mujeres tenemos que crear una variable para el género. Esta variable cualitativa y nominal está compuesta, generalmente, dos valores o subgrupos: hombre y mujer. Los valores de una variable se indican precisamente en la casilla de Valores.

Llegados a este punto, es preciso advertir que nuestra base de datos estará compuesta mayoritariamente por números. Sin embargo, muchos de esos números no tendrán una función aritmética. Es preciso codificar cada valor de la variable con números. Así por ejemplo, para nuestra variable Género el valor 1 será para los hombres y el 2 para las mujeres.

Para poner valor a una variable, deberemos hacer clic en los tres puntos horizontales de la casilla de Valores. A continuación, en la ventana emergente, indicaremos el valor numérico y su correspondencia al grupo (1---hombre) y le daremos al botón Añadir. Cuando hayamos acabado e introducir todos los valores o subgrupos de la variable, le daremos al botón Aceptar.

Entonces esta variable quedaría tal que así [No se han indicado las casillas que no hay que alterar]:
  • Nombre: Género
  • Decimales: 0 - Se trata de una variable que usa el valor 1 o 2
  • Etiqueta: Género del alumno - Podemos poner cualquier otra explicación
  • Valores: 1 para Chico y 2 para Chica
  • Medida: Nominal - Aunque el 1 sea el código Chico y el 2 sea el código Chica, no hay ningún orden.


No hay comentarios:

Publicar un comentario