Manual de Excel
Manual de Excel
Manual de Excel
Curso 2018/2019
Isabel Parra Frutos
Contenido
1. Datos .................................................................................................................................................................... 2
2. Consejos metodológicos ....................................................................................................................................... 2
1. Datos
El fichero con los datos que se utilizan a lo largo de este documento lo encontrará en Recursos del aula virtual con
el nombre datos_manual2007.xlsx. Este fichero (véase la imagen siguiente) contiene las variables: Categoría, Salario,
Edad, Nº de bajas y Sexo. La columna Trabajador no es una variable sino un identificador del elemento poblacional
observado. En nuestro caso se podría poner el nombre, el DNI o cualquier otra identificación del empleado observado.
2. Consejos metodológicos
a) Una hoja de cálculo diferente para cada variable estadística permite una mejor organización del fichero de trabajo :
b) Es recomendable que los datos a analizar estén siempre en la columna A. Seleccione, en la hoja de cálculo Datos,
las observaciones de la variable que va a analizar (pinchando en la letra de columna correspondiente seleccionará la
columna completa), cópielos y péguelos en la columna A (pinche primero en la celda A1) de la nueva hoja.
c) La gran mayoría de las funciones de Excel en las que hay que introducir un rango de celdas admiten introducir
referencia a columna completa (pinchando en la letra de columna). Por ejemplo, la referencia A:A se refiere a la
columna A completa. Por ejemplo, =SUMA(A:A) obtiene la suma de todos los datos que haya en la columna A. De
esta forma, si se añaden datos en la columna A la suma se actualiza inmediatamente (pinchando en la letra de
columna Excel escribe automáticamente la referencia dentro de una fórmula).
d) Para seleccionar un rango de celdas en una columna: se pincha la primera celda y después manteniendo presionada
la tecla se presiona de forma consecutiva la tecla Fin y la tecla .↓..
Lo denotaremos como + .Fin. → .↓.. Si es la última celda la que se pincha se sustituiría la última tecla por la
tecla .↑.. Cuando tenga que seleccionar muchos datos este método es mucho más eficiente.
2
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
3. Atributos
La solución que debe obtener aparece en la imagen siguiente. A continuación se describe cómo se hace. Observe que
se ha utilizado una nueva hoja de cálculo, utilizando la columna A para los datos.
Solución
Las tablas dinámicas en Excel sirven para obtener los valores o modalidades de la variable de acuerdo con los datos
y su frecuencia. Una tabla dinámica se inserta de la siguiente forma:
PASO 1. Sitúe la celda activa entre los datos (pinchando con el ratón).
celda activa
PASO 3. Los datos se seleccionarán automáticamente si hizo el paso 1. En caso contrario seleccione ahora los datos
junto con su rótulo (celda A1), sin seleccionar celdas vacías (importante), con + .Fin. → .↓.. NO SELECCIONE
COLUMNA COMPLETA porque seleccionaría celdas vacías. Cuando sitúe el cursor en Ubicación, pinche la celda
de su hoja de cálculo donde quiera insertar la tabla. Pulse finalmente Aceptar.
3
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Celda seleccionada
en Ubicación
Pinche y arrastre el
nombre de la variable
(Categoría en este caso)
al área Rótulos de fila y
al área Σ Valores
Si en el campo Σ Valores, o en la tabla dinámica insertada, aparece Cuenta de nombre de la variable entonces se
calculan las frecuencias absolutas. En caso contrario debe modificarlo para que aparezca. Para ello pinche en
Configuración de campo y seleccione la opción Cuenta.
Se pueden modificar los rótulos de la tabla dinámica, tecleando los nuevos, y añadir a continuación los rótulos de
las columnas que quedan por calcular. Además, en esta imagen se han centrado las columnas:
Se teclean los
nuevos rótulos
NOTA: Si al pinchar en una celda de una tabla dinámica no le aparece la referencia a esa celda en su
fórmula sino que le aparece algo como
=IMPORTARDATOSDINAMICOS("Datos";$C$2;"Datos";1)
puede cambiarlo deseleccionando Usar funciones GetPivotData para referencias a tablas dinámicas,
en Menú Archivo/Opciones/Fórmulas:
Menú Archivo/Opciones/Fórmulas
Para insertar $ en la referencia a celda de una fórmula, puede pulsar la tecla F4 cuando tenga el cursor en su nombre
dentro de la barra de fórmulas (observe lo que ocurre cuando la pulsa varias veces).
Puede copiar y pegar o arrastrar hacia abajo el cuadro de llenado automático. Debe tener cuidado con las referencias
de celda relativas y absolutas (con $).
Fije 4 decimales para las fi, para ello seleccione las frecuencias relativas y pinche en menú Inicio/Número.
Se puede hacer de varias formas. Una de ellas consiste en insertar la fórmula =E3 en la cela F3 y copiarla hacia
abajo. Al hacerlo aparecerá exactamente lo mismo que hay en la columna E, a continuación hay que darle formato
porcentaje. Para ello, seleccione los datos de la columna F, obtenga otra vez el cuadro de dialogo anterior y seleccione
Porcentaje (con 2 decimales). También puede pinchar en los iconos correspondientes en la cinta de opciones del menú
Inicio como se ve a continuación.
6
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Se puede seleccionar el
rango de celdas con los
datos (xi,ni) para la
tabla o especificar los
datos de los ejes en la
parte de abajo.
Pinche en Agregar y seleccione los datos del eje Y: Después pinche Editar en Etiquetas del eje horizontal
y seleccione las categorías (datos del eje X):
Para la presentación final del gráfico (poner título al gráfico, rótulos en ejes y otras opciones):
Para establecer los datos que aparecen sobre el gráfico seleccionamos Etiquetas de datos y después Más opciones
de la etiqueta de datos:
7
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
En Excel 2013:
Solución
8
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Al realizar la tabla dinámica, Excel por defecto obtiene Suma de Nº de bajas. Como nos interesa la frecuencia
debemos cambiar a Cuenta pinchando en Configuración de campo o haciendo doble clic en la celda D2 de la
siguiente imagen:
Cambiar a
“Cuenta”
En el cálculo de las frecuencias acumuladas (Ni y Fi) la primera fórmula es diferente y la que se copia hacia abajo es
la segunda. Tenga en cuenta que:
N1 = n1 F1 = f1
Ni =
N i −1 + n i i=
2,3,... Fi =
Fi −1 + f i i=
2,3,...
9
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Solución
Para agrupar en intervalos presentamos dos opciones. La primera de ellas es válida en cualquier caso. La segunda
utiliza las tablas dinámicas de Excel. En ese caso existen limitaciones de uso que deben tenerse en cuenta y que se
explican más adelante.
Número de intervalos ≅ N
10
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Para agrupar en intervalos en una tabla dinámica, se sitúa el ratón sobre la columna de las xi de la tabla dinámica
insertada, se hace clic en el botón derecho y se selecciona Agrupar (en la cinta de opciones también aparece):
11
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Agrupar en intervalos
una tabla dinámica.
Limitación de uso: Debe tener en cuenta que los intervalos obtenidos así son semiabiertos por la derecha [Li,Li-1),
frente a los que se suelen utilizar en Estadística que son semiabiertos por la izquierda (Li,Li-1]. Los intervalos resultantes
y sus frecuencias coincidirían en los dos casos si los extremos de los intervalos no coinciden con datos. Esto sería así,
por ejemplo, si, los datos no tienen decimales y los extremos de los intervalos se expresan con algún decimal (distinto
de cero). O al revés, los datos tienen decimales y nosotros utilizamos números enteros en los extremos de los intervalos
(este sería nuestro caso aquí).
12
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
6. Atributos
Para CATEGORIA sólo es posible calcular la moda dado que se trata de un atributo nominal. Esto se puede hacer
observando la tabla y/o el gráfico.
7. Variables
Problema: Obtenga todas las medidas de posición y dispersión que conozca para las variables Número de
bajas y Salario. Para la variable Salario obtenga además el índice de Gini y la Curva de Lorenz.
Para la variable Nº de bajas añadimos un cuadro (columnas O y P de la siguiente imagen) con todos los estadísticos:
Solución
Las funciones de Excel que se han utilizado para calcular los estadísticos son las siguientes:
Una vez calculada la moda, por ejemplo, si desea saber cuántas veces aparece entre los datos (esto es, la frecuencia
absoluta del valor modal) sin realizar la tabla de frecuencias puede usar: =CONTAR.SI(A:A; valor modal).
13
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Para la variable Salario, además de los estadísticos anteriores, añadimos el cálculo del índice de Gini y la curva de
Lorenz en la hoja de cálculo que contiene sus datos.
Las fórmulas usadas para el cálculo del índice de Gini son las siguientes:
Para dibujar la curva de Lorenz el tipo de gráfico es “Dispersión con líneas rectas”. Se selecciona Pi para el eje X y
Qi para el eje Y. Hay que agregar otra serie para dibujar la bisectriz:
14
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
La resolución de este problema viene dada en la siguiente imagen. Más abajo se indica cómo se obtiene.
Solución
Para realizar la tabla de doble entrada se inserta una tabla dinámica de la siguiente forma:
15
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Para completar la tabla poniendo ceros en las celdas vacías hay que pinchar en la tabla dinámica para que aparezca
el menú Herramientas de tabla dinámica, pinchar en Opciones/Opciones de Tabla dinámica:
16
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
En este caso hay que agrupar las dos variables, por tanto se repite el proceso de agrupación para cada variable por
separado. Recuerde que los intervalos obtenidos así son semiabiertos por la derecha [Li,Li-1), frente a los que se suelen
utilizar en Estadística que son semiabiertos por la izquierda (Li,Li-1]. Los intervalos resultantes y sus frecuencias
coincidirían en los dos casos si los extremos de los intervalos no coinciden con datos.
Salario Edad
Solución
Solución
No es tabla
dinámica
Tenemos 2 formas de estudiar la independencia. En la forma 1 (véase imagen anterior) se calculan las distribuciones
de frecuencias relativas condicionadas a cada valor o modalidad de la otra variable y se comprueban si son iguales entre
sí e iguales a la distribución marginal de frecuencias relativas correspondiente. Si es así serían independientes. Para
obtener las tablas con las frecuencias relativas condicionadas hay que realizar estas modificaciones en la configuración
de campo valor:
17
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
En la forma 2 necesitamos calcular previamente las frecuencias relativas marginales y las conjuntas y comprobar si
todas las frecuencias relativas conjuntas (fij) se pueden obtener como el producto de las correspondientes frecuencias
relativas marginales. Para ello construimos una tabla donde se obtiene f i × f j . Esta tabla debe ser igual a la tabla de las
fij para que exista independencia. En este caso no son independientes.
(1) Filtrando los datos para extraer aquellos de interés para hacer gráficos y calcular estadísticos.
PASO 1. La celda activa debe encontrarse entre los datos. Seleccione la cinta Datos/Filtro. El resultado son unos
menús desplegables en los rótulos de los datos (celdas A1 y B1):
celda activa
PASO 2. Despliegue el menú para Categoría y seleccione solo Fábrica. Observe que al hacer esto se ocultan todas
las filas en las que no aparezca Fábrica, esto es, sólo quedan visibles los salarios de los trabajadores de fábrica.
PASO 3. A continuación seleccione las columnas A y B (pinche, manteniendo pulsada la tecla Ctrl , en las letras A
y B encima de las columnas), se copian y se pegan en otro sitio (en nuestro ejemplo en las columnas E y F).
PASO 4. Elimine el Filtro volviendo a hacer clic en Seleccione la cinta Datos/Filtro para que vuelvan aparecer las
filas que se ocultaron.
Finalmente disponemos de una columna con los salarios de los trabajadores de fábrica (columna F de la siguiente
imagen), los cuales se pueden tabular, representar gráficamente y calcular medidas descriptivas (medias, varianzas,
etc.).
18
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
También puede desplegar Categoría y seleccionar Fábrica como puede ver a continuación:
19
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Problema: Obtenga el número de trabajadores, el salario medio, el salario mínimo, el salario máximo, la
desviación típica del salario y el coeficiente de variación para cada Categoría de los trabajadores.
Para ello, resultan muy útiles las tablas dinámicas de Excel tal y como aparece en la imagen más abajo. El
coeficiente de variación no es una opción en una tabla dinámica y se debe calcular utilizando la correspondiente
fórmula con los resultados de la media y desviación típica obtenidos en la tabla dinámica.
Arrastramos
Salario 5 veces
al campo
Σ Valores
Para dar el formato de moneda hay que seleccionar los valores y, por ejemplo, pinchar en el icono de la cinta Inicio
señalado en la imagen.
20
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Problema: Obtenga el salario medio, el salario mínimo, el salario máximo, la desviación típica del salario y
el coeficiente de variación para cada Categoría de los trabajadores distinguiendo entre hombres y mujeres.
Nos piden estadísticos del salario condicionado a dos variables (Categoría y Sexo).
Solución
Para obtener esta solución hay que añadir la variable sexo en la columna C. Se puede volver a insertar la tabla
dinámica o se puede modificar la anterior incluyendo la variable sexo en los datos de la misma. Para ello, si sitúa la
celda activa en la tabla dinámica pinche en Herramientas de tabla dinámica/Opciones/Cambiar origen de datos,
como puede ver a continuación, y cambie los datos. Después debe modificar el diseño de la tabla incluyendo la variable
Sexo en Rótulos de columna.
21
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Problema: Dibuje el diagrama de dispersión de la variable bidimensional (Edad, Salario). Obtenga la recta
de regresión y la bondad del ajuste de la recta Salario/Edad. ¿Cuál sería el salario, de acuerdo con el modelo
lineal) de una persona con 30, 55 y 61 años? ¿Son fiables las predicciones?
Solución
Para realizar el diagrama de dispersión se utiliza el tipo de gráfico “Dispersión”. Se selecciona el primer subtipo que
no conecta los puntos. Para insertar la recta de regresión en la nube de puntos junto con la función matemática y el valor
de R2, hay que hacer clic en el gráfico y pinchar en Herramientas de gráficos/Presentación/Línea de tendencia/Más
opciones de línea de tendencia… como se indica en la imagen siguiente.
22
Estadística descriptiva con Microsoft Excel 2007 2245. Estadística básica para la Economía
1º GECO Isabel Parra Frutos
Al insertar la expresión de la recta en el diagrama de dispersión aparece por defecto x e y, esto es, y=20,252x+4,3399.
En la imagen con la solución x e y se han sustituido por los nombres de las variables de este ejemplo (salario y edad),
teniendo en cuenta que y se refiere al valor estimado o ajustado por la recta, no al observado.
En Excel 2013:
23