Science">
Nothing Special   »   [go: up one dir, main page]

Paquete Estadístico para Las Ciencias Sociales (SPSS) Tarea EQUIPO 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 18

Universidad Autónoma De Santo Domingo

Facultad De Educación

Escuela De Educación

Nombre asignatura: Metodología Inv Educativa

Nombres de las alumnas/os:

Carla Andreina Del cristo Pérez--100624293

Rodis Adalisa Zabala De La Rosa---100138985

Nedys Margarita Báez Vargas--100290422

Maridalia Peña Trinidad ---100157136

Maris Dolores Matos ---100278353

Eusebia Vásquez Sena --- 100234764

Tema: Paquete estadístico para las ciencias sociales (spss)tarea

Sección: R1

Periodo académico: Primer semestre 2022

Nombre profesor: Mariolin Montero Bocio


Paquete estadístico para las ciencias sociales (spss)
Elementos previos al análisis.
La vista de datos contiene la matriz con cada uno de los casos (individuos,
territorios, organizaciones, etc.) y sus respectivos valores (o categorías de
respuesta) en las distintas variables. La vista de variables incluye la información
relevante de cada una de las variables que han sido obtenidas. Los aspectos
centrales de la misma son:
El nombre por el cual se identifica la variable
Tipo (pueden existir numéricas o de cadena). Las numéricas son aquellas
que contienen valores numéricos, ya sean las variables cualitativas nominales,
cualitativas ordinales o cuantitativas. Se trata de una variable de cadena cuando
se escribe un texto (por ejemplo, que explique algunas de las respuestas que
han sido seleccionadas en alguna pregunta del cuestionario).
Decimales, se señalan cuantos si se da el caso que alguna variable los
contenga. Un ejemplo podría ser el porcentaje de inmigrantes en diferentes
territorios.
Etiqueta, se puede incluir una descripción más detallada del tema de la
variable.
Valores, se incluyen las categorías de respuesta de las distintas variables o
valores. No se incluyen las categorías de respuesta únicamente cuando se tratan
de variables cuantitativas como por ejemplo podría ser la edad o el porcentaje
de inmigrantes en territorios determinados.
Perdidos, esta es una de las opciones más importantes de la vista de variables
ya que su no correcta utilización puede condicionar los resultados obtenidos en
los diferentes estadísticos. Es importante que antes de cualquier análisis se
compruebe que los valores perdidos de una determinada variable hayan sido
declarados como tal ya que pueden estar rompiendo la ordinalidad (más adelante
será explicado). Las categorías de respuesta que se suelen declarar como
valores perdidos son (aproximativo): No sabe, No contesta. Pueden existir otros
muchos casos.
Datos muéstrales y datos poblacionales.
Un elemento del que se debe ser consciente antes de realizar cualquier análisis
es si los datos con los que se trabajan son de una población completa o se tratan
de datos muéstrales. Los datos muéstrales se obtienen mediante técnicas
estadísticas que permiten que un conjunto delimitado de individuos pueda ser
representativo de una población completa con un margen de error determinado.
En este caso, los diferentes test de hipótesis lo que permiten es contrastar si las
diferencias que se observan para una muestra concreta pueden extrapolarse de
forma representativa para todo el conjunto de la población que representa.
El output más básico que ofrece cualquier Análisis Descriptivo Univariado es la
tabla de frecuencias. Una distribución de frecuencias informa sobre los valores
concretos que adopta una variable y sobre el número (y porcentaje) de veces
que se repite cada uno de esos valores.
La frecuencia ofrece la información a cerca de cuantas personas, en términos
absolutos, se sitúan en cada categoría respecto del total. Los porcentajes
describen la distribución porcentual de los individuos en cada categoría. El
porcentaje valido describe la distribución porcentual de los individuos (igual que
la anterior) pero recalcula los porcentajes, restando los casos que están dentro
de categorías que se han declarado como perdidas2. El porcentaje acumulado
ofrece información acerca del sumatorio de los porcentajes de las distintas
categorías.
El procedimiento de Frecuencias permite, como hemos visto, obtener
distribuciones de frecuencias en las diferentes categorías de respuesta de una
variable, pero además contiene opciones para:
• Calcular algunos de los estadísticos descriptivos más utilizados (sobre
tendencia central, posición, dispersión, asimetría, etc.).
• Construir algunos diagramas básicos (gráficos de barras, de sectores e
histogramas).
• Controlar el formato de presentación de las distribuciones de frecuencias.
Naturaleza de las variables y estadísticos.
Los estadísticos que se han de seleccionar en cada caso dependerán de la
propia naturaleza de la variable.
Naturaleza de las variables
A grandes rasgos se debe considerar que existen tres tipos de variables en
relación a su naturaleza: cualitativas, cualitativas ordinales y cuantitativas (de
intervalo o de razón).
Cualitativas: son aquellas compuestas por diferentes categorías de respuesta
en las que se distribuyen las distintas frecuencias, sin que estas sigan algún tipo
de ordinalidad (de mayor a menor o de menor a mayor). Las categorías son
valores diferentes por una cualidad, no por una cantidad. Ningún “valor” puede
ser considerado mayor o menor que otro. La variable que ha sido escogida en el
anterior apartado sería un ejemplo de una variable de esta naturaleza. Otros
ejemplos serian: partido político al que votó; región en la que vive; sexo; estado
civil; marca de coche que conduce.
Cualitativas ordinales: se componen de categorías de respuesta que se
ordenan o pueden ordenarse de mayor a menor o de menor a mayor. Un ejemplo
de este tipo de variable seria: 1). Del 1 al 10 cuan feliz se siente (siendo 1 nada
feliz y 10 máxima felicidad) o 2). ¿Qué clase social considera que es? (baja,
mediabaja, media, media-alta, alta). Por lo tanto, sus valores son “categorías”
como en las variables cualitativas, pero cada valor es “mayor que” o “menor que”
los demás valores, como en las variables cuantitativas.
Cuantitativas (de intervalo o de razón): los valores de la variable son
“números” = cada valor posible es menor o mayor que otro valor. El conjunto de
valores forman una escala de intervalo. “Intervalo”: distancia entre valores. En
las variables cuantitativas se puede calcular la distancia o intervalo entre
cualquier par de valores de la variable. La diferencia fundamental con las
variables cualitativas ordinales es, por tanto, que en este caso se puede medir la
distancia entre los valores. Ejemplos: edad, ingresos, nota en un examen,
número de años de educación, kilómetros de distancia entre trabajo y residencia.
Lo relevante de entender las diferencias entre la naturaleza de las variables y
por tanto poder identificarlas, radica en que en función de estas diferencias se
deben desarrollar métodos estadísticos diferenciados. Concretamente existe una
progresión hacia estadísticos más complejos (completos), dependiendo de si se
tratan de variables cualitativas o cuantitativas.
Variables cualitativas.
Las variables cualitativas son aquellas que admiten una menor cantidad de
estadísticos dada su naturaleza nominal (no numérica ni ordinal). En este tipo de
variables únicamente tiene sentido analizar la moda (medida de tendencia
central). La moda nos indica cual es el valor con mayor frecuencia, es decir,
aquella categoría de respuesta que más se repite.
La tabla 2 es la tabla de frecuencias (tabla2) de la variable seleccionada, en este
caso, señala la actividad principal de los encuestados en los últimos siete días.
Se trata de una variable cualitativa nominal en tanto que está compuesta por
categorías de respuesta nominales que no pueden ser ordenadas de mayor a
menor (que tu actividad principal en los últimos siete días sea el trabajo
remunerado no puede ser situado por encima de que haya sido la educación, el
desempleo u otras).

Concretamente esta tabla permite afirmar que el trabajo remunerado es la


actividad principal de los encuestados (representativos de la totalidad del Estado
español dado que han sido seleccionados mediante un muestreo), ya que es la
categoría con mayor frecuencia y por tanto con mayor representatividad
porcentual (45,6%)3.

Variables cualitativas ordinales.

Dado que las variables cualitativas ordinales poseen la cualidad de poder ser
ordenadas de menor a mayor o viceversa –a pesar de que continúan siendo
categorías nominales-, en éstas aumenta el número de estadísticos descriptivos
que pueden ser utilizados para su descripción. Es el caso de los percentiles (o
cuartiles) y la mediana que se añaden a la moda.

 Cuartiles: Calcula los percentiles 25, 50 y 75, es decir, los valores por
debajo de los cuales se encuentra el 25 %, el 50 % y el 75 % de los casos,
respectivamente.
 Percentiles: Permite solicitar percentiles concretos (valores que acumulan
un determinado porcentaje de casos). Permite visualizar en que
categorías (plural) de respuesta se acumulan los primeros 10%, 30%,
70%, 90% (cualquiera que selecciones) de los casos.
 Mediana (tendencias central): Valor por debajo del cual se encuentran el
50 % de los casos (equivale al percentil 50).

La variable que ha sido seleccionada para ejemplificar el análisis de los


estadísticos descriptivos propios de las variables cualitativas ordinales ha sido la
percepción subjetiva de la salud.
Media o media aritmética: es la suma de todas las puntuaciones dividida por el
número de puntuaciones. Te permite conocer el valor promedio de la variable.

Varianza: medida de dispersión que se obtiene dividiendo por n-1 la suma de


los cuadrados de las diferencias entre cada puntuación y la media. El valor que
se obtiene es difícilmente interpretable, es decir, no se interpreta. A pesar de ello
siempre se pide esté estadístico ya que la desviación típica (que sí que se
interpreta) se deriva de la varianza.

Curtosis: es un indicador que pretende expresar de forma numérica si los


individuos se concentran en los valores centrales o si por el contrario están
igualmente distribuidos a lo largo de todas las categorías de respuesta.

Mesocurtica:

Cuando el valor del indicador es igual a 0,2663 se puede afirmar que se trata de
una variable que se distribuye de forma mesocurtica, es decir, que respeta la
distribución normal.

Platicurtica:

Cuando el valor del indicador es menor que 0,2663 se puede afirmar que la
variable se distribuye de forma mesocrática, es decir, hay aproximadamente los
mismos casos en cada uno de los valores de la variable.

Lepticurtica:

Si el valor del indicador es mayor que 0,2663 se puede afirmar que la variable
se distribuye de forma leptocurtica, es decir, los casos se concentran en los
valores centrales de la variable. La distribución de la curva, por tanto, será más
puntiaguda.

La variable seleccionada para ejemplificar el análisis de los estadísticos de las


variables cuantitativas, ha sido “peso de los encuestados”. La tabla de
frecuencias no ha sido insertada en este documento ya que ocupaba
aproximadamente cuatro páginas y aporta poca información para una
interpretación apropiada del comportamiento general de la variable, debido a la
gran variabilidad de los diferentes pesos de los encuestados.
Operaciones básicas con variables.

Este capítulo se centra en las diversas operaciones básicas que se pueden realizar con una variable.
Concretamente en la recodificación de variables, la construcción de índices y la elaboración de
tipologías.

Recodificación de variables.

La función de recodificar variables puede ser útil para diferentes objetivos: 1). Agrupar categorías
de respuesta de esa variable. 2). Cambiar el orden de la variable (de más a menos hacía de menos
a más).

Agrupar categorías de respuesta.

Las razones que pueden llevar a querer agrupar las categorías de respuesta de una variable en un
número menor de ellas son múltiples: 1). Pasar de una naturaleza determinada de una variable
(cuantitativa) a otra diferente (cualitativa ordinal). Por ejemplo, recodificar la edad en 4 grandes
grupos: 18-35, 36-55, 56-67, +68. 2). Que una de las categorías de respuesta tenga una frecuencia
inferior al 5%. 3). Razones teóricas. Por ejemplo, asumir que los diferentes grupos de edad se
corresponden a diferentes etapas de la vida laboral.

Transformar >> recodificar en distintas variables (siempre se selecciona en diferentes variables, ya


que si seleccionas la opción de recodificar en las mismas variables, estás perdiendo la variable
anterior) >> Aparece la interface (imagen 2) de “recodificar variables” >> Seleccionas la variable que
quieres recodificar en el recuadro de variables situado a la izquierda y la introduces al recuadro
blanco mediante la flecha >> Una vez introducida, se debe indicar un nombre y una etiqueta en el
recuadro de variable de resultado, y clicar cambiar >> clicas valores antiguos y nuevos >> Aparece
la interface de Valores antiguos y nuevos (imagen 3). Si se observa la interface, se distinguen dos
espacios bien definidos. Uno con el nombre de valor antiguo y otro con el de valor nuevo. El espacio
de valor antiguo es para seleccionar los valores de la variable que deseas agrupar bajo una misma
categoría de respuesta. El espacio de valor nuevo, es para seleccionar bajo que categorías de
respuesta vas agrupar tales valores. Como se puede observar, hay diferentes formas de seleccionar
los valores que quieres agrupar.

Observatorio del Estudiante 23 Manual de SPSS. De un estudiante para los estudiantes Manual
SPSS. De un estudiante para los estudiantes Autor: Bernal, D. Imagen 2. Interface “recodificar en
distintas variables” Concretamente mediante la opción “valor” o “rango”. La opción valor es para
seleccionar únicamente un único valor (categoría de respuesta de la variable), la opción rango, sirve
para seleccionar un conjunto de valores o “categorías de respuesta” comprendidas entre el primer
valor que seleccionas y el último. Una vez seleccionados los valores antiguos, debes atribuirles un
nuevo valor o categoría de respuesta en la nueva variable, para ello se debe seleccionar ese nuevo
valor o categoría de respuesta en el apartado de valor nuevo y clicar añadir. Una vez has hecho
este proceso para todos los valores antiguos y nuevos, debes clicar “todos los demás valores” en el
apartado de valores antiguos y clicar “perdido del sistema” en “valores nuevos” y clicas añadir >>
Completado este proceso, clicas en continuar
ya tendrás la nueva variable recodificada que se situara al final del todo (ultima variable) en el
apartado “vista de variables”. ¿Ya se ha finalizado el proceso? Casi. Una vez construida la variable
se le deben poner las nuevas etiquetas. Ejemplo: La ESS (European Social Survey) recoge la
variable de confianza en los políticos mediante una escala que va desde “0” (ninguna confianza)
hasta 10 (completa confianza). Pero nos interesa resumir esa información que se distribuye a lo
largo de 11 categorías de respuesta en únicamente 3 (alta confianza, media confianza y baja
confianza). Este objetivo puede ser logrado, siguiendo los pasos que han sido explicados en el
recuadro azul. En un primer momento se debe tomar la decisión de que categorías de respuesta o
valores de la antigua variable serán agrupados dentro de cada una de las nuevas tres categorías
de respuesta que compondrán la nueva variable. En este caso, se ha decidido respetar los
parámetros de los valores de la antigua variable. Por tanto, “0, 1, 2, 3” pasaran a ser baja confianza,
“4, 5, 6” media y “7, 8, 9, 10” alta confianza

Una vez completada se debe clicar a continuar y aceptar. La variable habrá sido creada.
Si se analiza la nueva variable sin que se le haya asignado una etiqueta a las nuevas
categorías, el resultado sería el siguiente:

Frecuenci Porcentaje Porcentaje Porcentaje


a válido acumulado
Válido 1.00 1357 70.5 71.4 71.4

2.00 473 24.6 24.9 96.3

3.00 71 3.7 3.7 100.0

Total 1901 98.8 100.0


Perdid Sistema 24 1.2
os
Total 1925 100.0

Si lo que se quiere es que aparezcan las nuevas categorías de respuesta (alta confianza,
confianza media y baja confianza). Se debe etiquetar esta nueva variable. Para ello, se
debe ir a la interface de “vista de variables”, identificar la nueva variable (recordar que
siempre aparecerá al final), ir al apartado de valores y asignarle tales etiquetas al valor
que le corresponde.

Una vez completado este proceso, si se vuelve a analizar la variable la tabla que
aparecerá adoptara la siguiente forma.

Frecuenci Porcentaje Porcentaje Porcentaje


a válido acumulado
Válido Baja confianza 1357 70.5 71.4 71.4

Confianza 473 24.6 24.9 96.3


media

Alta confianza 71 3.7 3.7 100.0

Total 1901 98.8 100.0


Perdid Sistema 24 1.2
os
Total 1925 100.0

Cambiar el orden de la variable.

Otra de las opciones por las que puede interesar a un investigador recodificar
una variable es cambiar el orden o sentido de la variable, es decir, si esta
ordenada de menos a más, que pase a estar ordenada de más a menos. En el
caso de nuestra variable ya recodificada, el orden, se establece de menos a más
(de menos confianza a más confianza). Si interesa invertir el orden (de más
confianza a menos) se debe proceder a recodificar la variable invirtiendo el orden
de las categorías de respuesta, es decir, si el 1
es “baja confianza” en la nueva variable con el orden invertido, pasara a ser 3.
Si el 3 es “alta confianza”, en la nueva variable de orden invertido pasara a ser
1. Y el 2 “confianza media” seguirá ocupando la posición intermedia de 2.

Ejemplo:

Si se sigue el caso expuesto en el párrafo anterior y se realiza de forma correcta


se debería obtener una interface completada con los siguientes resultados
(imagen6):

Frecuenci Porcentaje Porcentaje Porcentaje


a válido acumulado
Válido Alta confianza 71 3.7 3.7 3.7

Confianza 473 24.6 24.9 28.6


media

Baja confianza 1357 70.5 71.4 100.0

Total 1901 98.8 100.0


Perdid Sistema 24 1.2
os
Total 1925 100.0

De nuevo, se deberían etiquetar las categorías de respuesta de la nueva variable


recordando que en esta nueva variable 1 “Alta confianza”, 2 “confianza media”,
3 “baja confianza”. Una forma de comprobar que se ha realizado de forma
correcta, es ver si los porcentajes de alta confianza en la variable invertida y no
invertida, se corresponden, a pesar de que no estén ubicadas en la misma
posición de la escala ordinal. En este caso es correcto.
Una forma de agrupar variables para construir dimensiones o conceptos es mediante la
creación de índices. Un índice se construye mediante la suma de variables cualitativas
ordinales o cuantitativas.

Elementos a tener en consideración para sumar variables.

1. Las variables que se van a sumar tienen que ser de la misma escala, es decir, no
puedes sumar variables compuestas por 5 valores o categorías de respuesta y variables
con 11 valores o categorías de respuesta. Para igualar las categorías de respuesta de
una variable se puede proceder a recodificarlas y homogeneizar el tamaño de todas
(siempre pasando las variables con más categorías al número de categorías de la que
menos tiene de todas aquellas seleccionadas para construir el índice).

2. Las variables tienen que tener el mismo sentido. No puedes sumar variables cuya
ordinalidad va de más a menos con variables que van de menos a más. Si este es tu
caso, tienes que homogeneizar el sentido de tus variables.

Ejemplo:
Si se propone estudiar la “confianza en la política” lo primero que se debe plantear un
investigador es como se puede medir ese concepto. Es decir, que indicador (variable)
puede reflejar la confianza que un individuo tiene en la política. Uno rápidamente puede
pensar que un indicador valido para medir la “confianza en la política” es la confianza
que los individuos dicen tener en los políticos, otro puede señalar que una mejor manera
de medirlo es la confianza que se tiene en el parlamento. Tal vez otro señale que lo
realmente relevante para medir la “confianza en la política” es la confianza que dicen
manifestar los individuos en los partidos políticos. Los ciertos es que todos estos
indicadores tienen la capacidad de medir diferentes aspectos representativos de la
“confianza en la política” y que por tanto seleccionar uno solo de ellos, puede estar
dejando escapar cierta información relevante. Es decir, que se esté escapando alguna
dimensión que permita captar el concepto de “confianza política” en toda su complejidad.

En el caso de que se haya hecho el proceso de forma correcta este debería ser el
resultado que se debería obtener (imagen 8). Una vez realizado el sumatorio se debe
clicar el botón de aceptar. El índice ya habrá sido creado y se ubicara como última
variable dentro de la interface de “vista de variables”. Una vez se ha creado el índice, se
procede a realizar un análisis de frecuencias para obtener el siguiente resultado (tabla
10).
Construcción de tipologías:

Construcción de tipologías. La elaboración de tipologías consiste en la


distinción, dentro de un conjunto de unidades determinadas (individuos, grupos
de individuos, hechos sociales. de grupos amplios que se pueden considerar
como homogéneos y que son definidos en torno a un conjunto de
características que comparten. Por lo tanto, la agrupación de esas unidades se
fundamenta en ciertas semejanzas definidas a partir de un sub-grupo de
características compartidas.
Las tipologías se construyen tanto con variables cuantitativas como cualitativas
ya que las variables cuantitativas se pueden cualificar. La sociología suele
trabajar más con tipologías que con índices ya que posee un carácter más
cualitativo. Además, la construcción de una tipología se sustenta en todo un
proceso previo de teorización y conceptualización. Una investigación que se
está llevando a cabo se necesita analizar cómo se comportan diversos
colectivos diferenciados de individuos.
Concretamente interesa saber el comportamiento de aquellos que ven
programas políticos y confían en la política, aquellos que ven programas
políticos y no confían en la política, aquellos que no ven programas políticos y
confían en la política y aquellos no ven programas políticos y no confían en la
política.
Además, nuestro marco teórico indica que aquellos a los que se pueden
considerar que realmente ven programas políticos son los que los consumen
más de 1,5 horas al día. Por otro lado, también señala que para capturar la
confianza en la política se necesita tener en consideración la opinión sobre los
políticos y aquella que vierten sobre la institución política central del país (el
parlamento). Para ello se cuenta con tres variables.
La dimensión uno “confianza en la política” se construye mediante dos
indicadores. Para ello se necesita previamente construir una nueva variable
(índice) que las agrupe (mirar el apartado de construcción de índices de este
mismo capítulo). Ahora bien, el marco teórico del que se parte no indica a partir
de qué valor se puede considerar que un individuo tiene confianza en la política
y cual no. Dado que se carece de un criterio teórico se opta por uno numérico:
0 a 4 (no confió), 5 (ni confió ni desconfió) y de 6 a 10 (confió). El valor central
“5” se declarara como caso perdido, ya que se asume que al ser el valor
situado en el centro de la escala los individuos que los seleccionan no se
posicionan ni en la confianza ni en la desconfianza. Así pues, en la nueva
variable (tipología) estarán presentes los que no confían (0-4) y los que confían
(6-10).

También podría gustarte