Nothing Special   »   [go: up one dir, main page]

Manual de R y Rstudio - Probabilidad

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 38

Historia e instalación del programa R & RStudio

Gráficas de barras apiladas en Excel y R & RStudio

Trabajo elaborado por:

Laura Catalina Becerra Ramírez - 617503


Yeraldy Villota Londoño - 617546

Universidad Nacional de Colombia Sede Palmira


Facultad de Ingeniería y Administración
Administración de Empresas
Probabilidad y Estadística
2019

1
Historia e instalación del programa R & RStudio
Gráficas de barras apiladas en Excel y R & RStudio

Trabajo elaborado por:

Laura Catalina Becerra Ramírez - 617503


Yeraldy Villota Londoño - 617546

Trabajo presentado a:
Docente. Viviana Vargas

Universidad Nacional de Colombia Sede Palmira


Facultad de Ingeniería y Administración
Administración de Empresas
Probabilidad y Estadística
2019

2
CONTENIDO

 Introducción…………………………………………………………………….. 4
 Objetivos………………………………………………………………………… 5
o Objetivo General………………………………………………………. 5
o Objetivos Específicos……………………………………………………
5
 R y RStudio…………………………………………………………………………
6
o Concepto…………………………………………………………………
6
o Características…………………………………………………………
6
 Historia…………………………………………………………………………..
7
 ¿Qué es R? ……………………………………………………………………..
 9
¿Qué es RStudio? …………………………………………………………………
 Instalación de R y RStudio…………………………………………………… 9
o Instalación de R……………………………………………………… 10
o Instalación de RStudio………………………………………………… 16
 Grafica de barras apiladas en Excel y RStudio …………………………… 21
o Graficas de barras apiladas en RStudio………………………………22
o Grafica de barras apiladas en Excel………………………………… 27
 Conclusión………………………………………………………………………
37
 Bibliografía………………………………………………………………………
38

3
INTRODUCCIÓN

El presente manual forma parte fundamental del desarrollo integrado en el lenguaje de


programación en este caso R & RStudio, los cuales son elementos esenciales para la
ejecución de estadísticas y gráficas.

El manual de instalación y configuración del programa R & RStudio que se verá a


continuación nos proporciona instrucciones claras que facilitan el proceso de instalación
con explicaciones que van de la mano con cada paso.

La primera parte, consiste en una breve definición y descripción de la historia de R &


RStudio. La segunda, presenta la instalación del programa R con las debidas
instrucciones en los cuales, cada paso está guiado con una breve explicación al igual
que la instalación del programa RStudio. Por último, una tercera parte nos muestra cómo
realizar y desarrollar gráficas apiladas tanto en Excel como en R & RStudio.

Es importante mencionar que el programa tiene varias versiones las cuales a través del
tiempo han presentado actualizaciones que facilitan el manejo de este, por lo que es
recomendable que el presente manual se perfeccione y actualice constantemente.

4
OBJETIVOS

OBJETIVO GENERAL

● Instalar y familiarizarse con el entorno y la historia de R & RStudio y realización


de gráficas apiladas en este.

OBJETIVOS ESPECÍFICOS

● Aprender la historia del transcurso del programa de R & RStudio para


familiarizarse con este.
● Instalar el programa R & RStudio.
● Realizar gráficas apiladas en el programa R & RStudio y en Excel.

5
HISTORIA DE R & RSTUDIO

 Concepto

RStudio es un entorno de desarrollo integrado (IDE) para el


lenguaje de programación R, dedicado a la computación
estadística y gráficos. Incluye una consola, editor de
sintaxis que apoya la ejecución de código, así como
herramientas para el trazado, la depuración y la gestión del
espacio de trabajo.

RStudio está disponible para Windows, Mac y Linux o para


navegadores conectados a RStudio Server o RStudio Server Pro.

RStudio tiene la misión de proporcionar el entorno informático estadístico R. Permite un


análisis y desarrollo para que cualquiera pueda analizar los datos con R.

 Características

IDE construido exclusivo para R

● El resaltado de sintaxis, auto completado de código y sangría inteligente.


● Ejecutar código R directamente desde el editor de código fuente.
● Salto rápido a las funciones definidas.

Colaboración

● Documentación y soporte integrado.


● Administración sencilla de múltiples directorios de trabajo mediante
proyectos.
● Navegación en espacios de trabajo y visor de datos.

6
Potente autoría y depuración.

● Depurador interactivo para diagnosticar y corregir los errores rápidamente.


● Herramientas de desarrollo extensas.
● Autoría con Sweave y R Markdown.

HISTORIA

R nació como una reimplementación de software


libre del lenguaje S, adicionado con soporte para
alcance estático, un lenguaje de programación
creado en los Laboratorios Bell de Estados Unidos,
los mismos laboratorios que inventaron el
transistor, el láser, el sistema operativo Unix y
algunas otras cosas más.

Dado que S y sus estándares son propiedad de los Laboratorios Bell, lo cual restringe su
uso, Ross Ihaka y Robert Gentleman, de la Universidad de Auckland en Nueva Zelanda,
decidieron crear una implementación abierta y gratuita de S. Este trabajo, que culminaría
en la creación de R inició en 1992, teniendo una versión inicial del lenguaje en 1995 y en
el 2000 una versión final estable.

R hereda muchas características de S, por lo que se puede correr el código de este


lenguaje usando R sin mayor problema. Para lograr esto, en R frecuentemente existe
más de una manera de realizar tareas comunes, una compatible con S y otra diseñada
específicamente para R. Lo anterior tiene como resultado inconsistencias, sintaxis poco
intuitiva y abundante frustración de cabeza para las personas que quieren aprender R.

Actualmente, el mantenimiento y desarrollo de R es realizado por el R Development Core


Team, un equipo de especialistas en ciencias computacionales y estadística
provenientes de diferentes instituciones y lugares alrededor del mundo. La versión de R
mantenida por este equipo es conocida como “base” y como su nombre indica, es sobre
aquella que se crean otras implementaciones de R así como los paquetes que expanden
su funcionalidad.

7
Para lograr que R sea usado sin restricciones es distribuido de manera gratuita, a través
de la Licencia Pública General de GNU, por lo que es software libre y de código abierto.
Si lo deseas, puedes examinar y estudiar el código que hace que R funcione o puedes
crear versiones propias de R que se ajusten a tus necesidades particulares. Esta licencia
también te permite usar R para los fines que desees, sin limitaciones, ya sean
personales, académicos o comerciales.

En la actualidad, el desarrollo de este lenguaje de programación se mantiene activa. La


versión más reciente de R al momento de escribir este documento es la 3.6.0 que fue
publicada en abril del 2019 y diariamente son publicados nuevos paquetes y sus
respectivas actualizaciones.

Aunque R está diseñado para análisis estadístico, con el paso del tiempo los usuarios de
este lenguaje han creado extensiones a R, llamadas paquetes, que han ampliado su
funcionalidad. En la actualidad es posible realizar en R minería de textos, procesamiento
de imagen, visualizaciones interactivas de datos y procesamiento de Big Data, entre
muchas otras cosas.

8
¿QUÉ ES R?

R es un proyecto de software libre de GNU y se


podría definir desde dos puntos de vista, por
una parte es un lenguaje de programación y por
otra un entorno de trabajo, estando ambos
orientados al cálculo estadístico y a la
generación de gráficas.

Como lenguaje de programación proporciona


una amplia variedad de técnicas y recursos
para el trabajo con gráficas y análisis estadístico y, a su vez, es altamente ampliable.
Cuenta con una comunidad extensa de desarrolladores, investigadores y usuarios. Se
distribuye con licencia GNU GPL v2 y está disponible para distintos sistemas operativos
de tipo Unix y similares (FreeBSD y Linux), Windows y Mac OS.

Como entorno de trabajo se entiende como un sistema totalmente planificado y


coherente y no una acumulación incremental de herramientas muy específicas y poco
flexibles, como es frecuentemente el caso con otro software de análisis de datos. En este
caso el entorno de trabajo R nos proporciona una serie de utilidades para manipulación
de datos, cálculo y representación gráfica.

¿QUÉ ES RSTUDIO?

RStudio es un entorno de
desarrollo integrado (IDE) para R.
Es software libre con licencia
GPLv3 y se puede ejecutar sobre
distintas plataformas (Windows,
Mac, or Linux) o incluso desde la
web usando RStudio Server.

9
INSTALACIÓN DE R Y RSTUDIO (EN WINDOWS).

Aunque Windows no es software libre, pero R y RStudio sí lo son. Se debe tener en


cuenta los siguientes pasos para instalar el programa:

A. INSTALACIÓN DE R:

Para instalar R descargamos del sitio oficial de R


la última revisión estable, la 3.6.0, pulsando en
Windows (en la mayoría de los casos).

PRIMER
PASO https://cran.r-
project.org/bin/windows/base/

SEGUNDO
PASO

Escoge la versión
3.6.1 que se acople
al sistema operativo
de tu computador.
10
Haciendo doble click sobre el fichero después de
terminar la descarga comenzamos la instalación. Saldrá
el típico aviso de Windows de que no se puede
TERCER comprobar el editor, no le hacemos caso y pulsamos en
PASO EJECUTAR. A veces también sale otra ventana
indicando que hay que permitir la ejecución del paquete
ya que requiere privilegios de administrador.

CUARTO
PASO

Seleccionamos el
idioma a convenir y le
damos en ACEPTAR 11
QUINTO
PASO

Después nos informa sobre el


tipo de licencia, le damos pulsar
en SIGUIENTE

SEXTO
PASO

A continuación nos indica la ruta


de instalación, le damos en
SIGUIENTE.

12
SÉPTIMO
PASO

Ahora seleccionamos los


paquetes a instalar, por lo
general ya vienen
seleccionados, le damos
en SIGUIENTE.

OCTAVO
PASO

Después nos pregunta si


queremos usar las opciones
de configuración, damos en
SIGUIENTE

13
NOVENO
PASO

Elegimos la carpeta
donde colocar los
accesos directos a los
elementos del paquete,
damos SIGUIENTE

DECIMO
PASO

Selección de tareas
adicionales: Crear icono
en el escritorio y le damos
en SIGUIENTE

14
UNCEAVO
PASO

Se procede a iniciar el
desempaquetado e instalar la
aplicación

DOCEAVO
Una vez finalizada el proceso PASO
de instalación sale una
ventana indicándolo. Pulsar
FINALIZAR.

Ya nos aparecerá el
correspondiente icono en el
escritorio.

15
B. INSTALACIÓN DE RSTUDIO

Ahora voy a instalar RStudio, para ello descargo la


última versión estable (1.2 en estos momentos) del
sitio oficial de RStudio.

PRIMER
PASO
https://www.rstudio.com/products/rstud
io/download/

Escogemos la opción
RStudio 1.2.1335 -
Windows 7+ (64 bits)

SEGUNDO
PASO

16
Haciendo doble click sobre el fichero
después de terminar la descarga
comenzamos la instalación. Saldrá el
típico aviso de Windows de que no se
puede comprobar el editor, no le
hacemos caso y pulsamos en
EJECUTAR. A veces también sale otra
ventana indicando que hay que permitir
la ejecución del paquete ya que requiere
privilegios de administrador.

TERCER
PASO

A continuación, nos
aparece el asistente de
instalación, pulsamos
“Siguiente”.

17
CUARTO
PASO

Luego nos pide la ruta


de instalación,
pulsamos “Siguiente”.

QUINTO
PASO

Elegir la carpeta del menú


inicio donde colocar los
accesos directos a los
elementos del paquete,
pulsar Instalar.
18
SEXTO
PASO

Comienza la instalación que dura


aproximadamente un minuto y
esperamos que culmine.

SÉPTIMO
PASO

Para finalizar aparece el


asistente indicando que ha
finalizado la instalación.
Pulsamos “Terminar”.

19
Así nos aparecerá el ícono en el
escritorio.

Y al ingresar al programa RStudio,


OCTAVO su inicio nos aparecerá de esta
PASO manera.

20
GRÁFICAS DE BARRAS APILADAS EN EXCEL Y R~STUDIO

 Descripción

En un gráfico de barras apiladas, las barras se dividen en segmentos de barra coloreados


que se colocan unos encima de otros. La altura total de una barra muestra el valor
numérico de una categoría determinada, mientras que la altura de los segmentos de
barra representa la contribución de los distintos componentes a ese valor.

A diferencia de un gráfico de barras de conjunto múltiple que muestra sus barras al lado,
los gráficos de barras apiladas segmentan sus barras de múltiples conjuntos de datos
una encima de la otra. Se utilizan para mostrar cómo una categoría más grande se divide
en categorías más pequeñas y cuál es la relación de cada parte sobre la cantidad total.
Hay dos tipos de gráficos de barras apiladas:

 Los gráficos de barras apiladas simples colocan cada valor de un segmento al


lado del anterior. El valor total de la barra es todo el segmento de valores
agregados. Es ideal para comparar las cantidades totales a través de cada
grupo/barra segmentada.

 Los gráficos de barras apiladas 100 % muestran el porcentaje de la totalidad de


cada grupo y se representan por el porcentaje de cada valor frente a la cantidad
total en cada grupo. Esto hace que sea más fácil ver las diferencias relativas entre
las cantidades en cada grupo.

Un fallo importante de los gráficos de barras apiladas es que se vuelven más difíciles de
leer cuantos más segmentos tiene cada barra. Además, comparar cada segmento entre
sí es difícil, ya que no están alineados en una línea de base común.

21
PASOS PARA REALIZAR GRÁFICAS APILADAS EN R Y RSTUDIO

A continuación le presentaremos una base de datos como ejemplo para realizar la


respectiva grafica apilada en el programa Rstudio.

PRIMER
PASO

Nos dirigimos a la
opción “Packages” y
después
seleccionamos la
opción “Install”
22
SEGUNDO
PASO

Digitamos el paquete de
“ggplot2” y procedemos a
Instalar

Después de haber instalado el paquete de


“ggplot2”, procedemos a activarlo,
seleccionamos el paquete de las opciones
de la librería y en la consola nos debe
TERCER aparece “library (ggplot2)”
PASO

23
1

CUARTO
PASO

En la imagen 3 se
2
puede observar como
el programa nos ha
Procedemos a digitar las
creado las variables variables de nuestra base de
en una tabla. datos como aparece en la
imagen 1, después
seleccionamos la opción “Run”
para que nos crea las variables
3 en el programa Rstudio como se
observa en la imagen 2.

QUINTO
PASO
Digitamos los siguientes comandos para pasar a
crear la gráfica apilada con sus unidades en
toneladas, sus coordenadas de X y Y con sus
respectivos colores. Después seleccionamos “Run”. 24
SEXTO
PASO

Para cambiarle el color a las


barras, digitamos los
comandos del paso anterior
solo que colocamos
diferentes colores en inglés,
los que usted prefiera.
Después seleccionamos
“Run”.

25
SEPTIMO
PASO

Otra manera de crear la gráfica de barras apiladas


es de forma porcentual, digitamos los siguientes
comandos para pasar a crear la gráfica con sus
unidades en Porcentaje, sus coordenadas de X y Y
con sus respectivos colores. Después
seleccionamos “Run”.

26
PASOS PARA REALIZAR GRÁFICAS APILADAS Y AGRUPADAS EN EXCEL

Tener presente los datos de partida que necesitamos


usar, los cuales están ubicados en una tabla como la
siguiente:

PRIMER
PASO

Queremos que los valores de los años desde el 2010 hasta el 2017 sean una misma columna apilada
y el valor Suma sea la columna agrupada paralela.

Seleccionamos los datos de la tabla y nos vamos a “insertar” e insertamos un gráfico tipo columna
apiladas como se muestra en la siguiente imagen:

SEGUNDO
PASO

27
Como necesitamos que la información presentada, esté explícita proseguimos de la
siguiente manera.

SEGUNDO
PASO

Organizamos la tabla de datos como puede verse en la


siguiente imagen:

(Cada una de las filas representa una de las barras apiladas


del gráfico que vamos a poner a continuación.)

28
Seleccionamos todos los valores numéricos incluidos las cabeceras e
insertamos un gráfico de barras apiladas. Como puedes ver en la
siguiente imagen la distribución es la misma que habíamos comentado
en el gráfico anterior.

TERCER
PASO

Como se logra observar, en las filas de la tabla donde


habíamos indicado «Nada» no se ha dibujado ninguna barra.
En las que habíamos indicado «Apilada» tenemos las barras
de diversos colores y en la que indicamos «Acumulada» tenemos la barra gris, la cual
hace referencia al total de los cultivos agropecuarios como indica nuestro ejemplo.

29
Para que el efecto de comparación de las dos barras quede
bien deberemos ampliar el grosor de las mismas. Para ello
seleccionamos una barra cualquiera y hacemos click con el
botón derecho. Seleccionamos la opción «Dar formato a
serie de datos…».

CUARTO
PASO

Automáticamente en el panel de la derecha de Excel nos aparecerá un cuadro con


opciones del gráfico. En este cuadro deberemos modificar el «Ancho del intervalo»
como puede verse en la siguiente imagen:
Y lo pondremos en el valor 0%. De esta manera las barras del gráfico se habrán
ampliado hasta estar tocándose.

30
QUINTO
PASO

Para poner en el eje horizontal las etiquetas que queramos deberemos


hacerlo añadiendo una nueva serie. Esta nueva serie está formada por los
nombres de las categorías y por los valores 0. Vayamos paso por paso
para entenderlo mejor.
Previamente añadiremos una columna auxiliar a nuestra tabla inicial como
puede verse en la siguiente tabla de Excel:

2
1

31
Después, como podemos observar en los pasos 1,2 y 3 anteriores; añadiremos esta
nueva serie auxiliar a nuestro gráfico.

Para añadir una nueva serie al gráfico hacemos click con el botón derecho sobre el
gráfico y elegimos la opción «Seleccionar datos». Después, en el recuadro de la derecha
seleccionamos la opción «Agregar». El nombre de la serie será «Auxiliar» y los valores
serán 0, 0, 0, 0, 0, 0, 0; para nuestro ejemplo.

Cambiar tipo de gráfico de la serie auxiliar.


Para ello seleccionamos una barra cualquier del gráfico de
columnas apiladas y agregadas que estamos creando. Hacemos
click sobre dicha barra con el botón derecho y seleccionamos la
opción «Cambiar tipo de gráfico de series…». Inmediatamente
aparecerá una ventana como la siguiente:

SEXTO
PASO

En la serie «Auxiliar» hemos


cambiado el tipo de gráfico a «Línea
con marcadores» y hemos
seleccionado la opción de «Eje
secundario».

32
Añadir etiquetas a la serie auxiliar.
Volvemos a hacer click sobre el gráfico y elegimos la opción de
«Seleccionar datos». En el recuadro de la izquierda seleccionamos
la serie «Auxiliar y en el recuadro de la derecha seleccionaremos la
opción Editar para poder editar las categorías y seleccionaremos el
rango de las categorías, es decir: 2011, 2012, 2013, etc.
En la siguiente imagen se puede ver la serie seleccionada y el
recuadro de categorías modificado.
SEPTIMO
PASO

Una vez cambiado esto haremos click en «Aceptar». Una


vez hecho esto aparecerá un gráfico como el de la
imagen en el que se ha añadido una línea de puntos en
la parte inferior izquierda del gráfico en Excel y ha
aparecido el Eje vertical secundario.

Añadir el eje horizontal secundario.


Nuevamente seleccionamos el gráfico y en la esquina superior
derecha, donde la cruceta verde que aparece seleccionamos la
opción de «Eje» y marcamos «Horizontal secundario».

OCTAVO
PASO

33
Inmediatamente nos aparecerá en
el gráfico el eje horizontal
secundario que se colocará en la
parte de arriba:

Cambiamos los ejes superior e inferior.


Como el eje superior es el que me indica las categorías del
gráfico, lo quiero bajar a la parte de abajo del gráfico, donde
está los números del 1 al 22. Para ello; damos click con el
botón derecho sobre el mismo y seleccionamos la opción “Dar
formato al eje”. Luego, en las opciones del eje, seleccionar el
desplegable de “Etiquetas” y ahí, en la opción de “Posición de
etiqueta” seleccionar la opción “Bajo” como veremos en las
siguientes imágenes:

NOVENO
PASO

34
Después seleccionar el eje con los números y repito la misma
operación pero en el último paso seleccionamos la «Posición
de etiqueta»: Alto.

Cuadrar el eje horizontal.


Como puedes ver en la siguiente imagen las bolitas no están
perfectamente alineadas con el centro de los gráficos de barras.
Para solucionar este pequeño problema selecciona el eje de
arriba (el que ahora tiene los números). En el desplegable de
«Opciones del eje» selecciona la opción «En marcas de
graduación» para mover los números y colocarlos sobre las
DÉCIMO
supuestas marcas de graduación.
PASO

35
Últimos detalles al gráfico.

 Ocultar el eje vertical secundario. Para ello selecciona el eje y


en el grupo de opciones «Etiqueta» selecciona la opción de
«Posición del eje» Ninguno.
 Ocultar el eje horizontal superior. Para ello haz lo mismo que
en el paso anterior. Y quita el color de la línea.
 Oculta el eje vertical principal (el de la izquierda).
 Quita las líneas del fondo (a no ser que sean imprescindibles).
 Quita el marco alrededor del gráfico (normalmente no queda
muy bien).
ONCEAVO
 Añade los valores de las barras.
PASO
 Selecciona la línea auxiliar y en las opciones de «Relleno y
línea» selecciona en «Línea» la opción «Sin línea» y después
en «Marcador» selecciona la opción «Ninguno».
 En la leyenda selecciona la palabra «Auxiliar» y bórrala.
 Modifica los colores de las barras a tu gusto.
 Añade un título interesante al gráfico.

36
CONCLUSIÓN

Se puede concluir, que el presente manual es de gran importancia para la vida


académica y laboral del estudiante y el profesional, ya que brinda herramientas de como
instalar el sistema de programación estadística R & RStudio paso a paso.

Por otro lado, el dominio del manejo del programa en este manual se logra apreciar a
través de la realización del grafico de barras apiladas no solo en el programa RStudio,
sino también en el programa Excel, con ayuda de una serie de pasos que facilitan realizar
su elaboración.

37
BIBLIOGRAFÍA

● Andina, M. (2018). Introducción a estadística con R. Recuperado de:


https://bookdown.org/matiasandina/R-intro/introduccion.html
● Arranz, Q. (S.F). Excel & VBA. Recuperado de: https://excelyvba.com/grafico-
columnas-apiladas-agrupadas/
● Mendoza, J. (S.F). R para principiantes. Recuperado de:
https://bookdown.org/jboscomendoza/r-principiantes4/graficas-de-barras.html
● R. (S.F). The comprehensive R Archive Network. Recuperado de: https://cran.r-
project.org/
● RStudio. (2018). 250 Northern Ave, Boston, MA 02210. Recuperado de:
https://www.rstudio.com/

38

También podría gustarte