domingo, 28 de septiembre de 2014

GRÁFICOS PARA VARIABLES CUALITATIVAS


Los gráficos más usuales para representar variables de tipo nominal son los siguientes:

Diagramas de barras:
Siguiendo la figura 1, representamos en el eje de ordenadas las modalidades y en abscisas las frecuencias absolutas o bien, las frecuencias relativas. Si, mediante el gráfico, se intenta comparar varias poblaciones entre sí, existen otras modalidades, como las mostradas en la figura 2 Cuando los tamaños de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podrían resultar engañosas.

Diagrama de barras para una variable cualitativa.
\includegraphics[angle=0, width=0.5\textwidth]{fig01-01.eps}


  
 Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al número de observaciones (frecuencias relativas).
\includegraphics[angle=-90, width=0.5\textwidth]{fig01-02.eps}



Diagramas de sectores
(también llamados pastel). Se divide un círculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de círculo proporcional a su frecuencia absoluta o relativa (figura 3).


 Diagrama de sectores.
\includegraphics[angle=-90, width=0.6\textwidth]{fig01-03.epsi}

El arco de cada porción se calcula usando la regla de tres:
\begin{eqnarray}\html{eqn1}n & \longrightarrow & 360^{\circ} \nonumber
\\
n_i & \longrightarrow &x_i = \frac{360 \cdot n_i}{n} \nonumber
\end{eqnarray}
Como en la situación anterior, puede interesar comparar dos poblaciones. En este caso también es aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gráficos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular, al igual que en la figura 4. Sean $n_1 \leq n_2$los tamaños respectivos de las 2 poblaciones. La población más pequeña se representa con un semicírculo de radio r1y la mayor con otro de radio r2. La relación existente entre los radios, es la que se obtiene de suponer que la relación entre las areas de las circunferencias es igual a la de los tamaños de las poblaciones respectivas, es decir:



 Diagrama de sectores para comparar dos poblaciones
\includegraphics[angle=-90, width=0.6\textwidth]{fig01-04.epsi}



Pictogramas
Expresan con dibujos alusivo al tema de estudio las frecuencias de las modalidades de la variable. Estos gráficos se hacen representado a diferentes escalas un mismo dibujo, como vemos en la figura 5

  
Pictograma. Las áreas son proporcionales a las frecuencias.
\includegraphics[angle=0, width=0.5\textwidth]{fig01-05.eps}

El escalamiento de los dibujos debe ser tal que el área  de cada uno de ellos sea proporcional a la frecuencia de la modalidad que representa. Este tipo de gráficos suele usarse en los medios de comunicación, para que sean comprendidos por el público no especializado, sin que sea necesaria una explicación compleja.


Gráficos de intervalos

Un tipo de gráfico de intervalos muestra un conjunto de puntos de datos en el que cada uno de ellos se define mediante varios valores para la misma categoría. Los valores se representan mediante el alto de los marcadores con relación al eje de valores. Las etiquetas de las categorías se muestran en el eje de categorías. El gráfico de intervalos sencillo rellena el área situada entre el valor superior y el valor inferior de cada punto de datos.
En la ilustración siguiente se muestra un gráfico de intervalos sencillo con tres series.
Gráfico de intervalos

  • Intervalo suavizado. Un gráfico de intervalos suavizado muestra las líneas curvas en lugar de rectas.
  • Intervalo de columnas. Un gráfico de intervalos de columnas usa columnas en lugar de áreas para mostrar los intervalos.
  • Intervalo de barras. Un gráfico de intervalos de barras usa barras en lugar de áreas para mostrar los intervalos.

Consideraciones sobre los datos para los gráficos de intervalos

  • Los tipos de gráficos de intervalos requieren dos valores para cada punto de datos. Estos valores se corresponden con un valor alto y un valor bajo que definen el intervalo para cada punto de datos.
  • Los gráficos de intervalos son útiles para realizar análisis solo si los valores superiores son siempre más altos que los inferiores. Si este no es el caso, considere la posibilidad de usar un gráfico de líneas. Si el valor alto es más bajo que el valor bajo, el gráfico de intervalos mostrará el valor absoluto de la diferencia entre estos valores.
  • Si se especifica solo un valor, el gráfico de intervalos se mostrará como si se tratara de un gráfico de áreas normal, con un valor por cada punto de datos.
  • Los gráficos de intervalos se suelen usar para representar gráficamente datos que contienen valores mínimos y máximos para cada grupo de categorías del conjunto de datos.
  • En un gráfico de intervalos no es posible mostrar marcadores en cada punto de datos.
  • Al igual que en un gráfico de áreas, si en un gráfico de intervalos sencillo los valores de varias series son similares, las series se superpondrán. En este escenario, es posible que prefiera usar un gráfico de intervalos de columnas o un gráfico de intervalos de barras en lugar de un gráfico de intervalos sencillo.
  • Se pueden crear diagramas de Gantt usando un gráfico de intervalos de barras.

TABLAS ESTADÍSTICAS 

Una tabla estadística sirve para presentar de forma ordenada las distribuciones de frecuencias. Su forma general es la siguiente:
ModalidadFrecuencia AbsolutaFrecuencia RelativaPorcentajeFrecuencia Absoluta AcumuladaFrecuencia Relativa Acumulada
ci, xinipi=100 fi


Tabla para variable cualitativa 

En el caso de variable cualitativa no se pueden calcular las frecuencias acumuladas pues no es posible establecer un orden en las clases dentro de la modalidad.Colocamos en la tabla aquellos valores que son independientes del lugar en que se pongan las modalidades.

Calculemos la tabla de frecuencias para una variable cualitativa.
Inactivos por tipos de inactividad declarada (miles de personas).
Modalidadnifipi
Estudiante522,60,138013,80%
Percibiendo una pensión de jubilación o unos ingresos de prejubilación712,30,188218,82%
Labores del hogar1.480,000,391039,10%
Incapacitado permanente265,90,07027,02%
Percibiendo una pensión distinta de la jubilación o prejubilación525,30,138813,88%
Otras situaciones279,50,07387,38%
3785,61100,00%



TABLA DE FRECUENCIA POR INTERVALOS
Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o clases para así realizar un mejor análisis e interpretación de ellos. 
• Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando la cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es pertinente.
• Si no se conocen los intervalos, se pueden determinar de la siguiente manera:
- Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se  determina el rango
 - Se divide el rango en la cantidad de intervalos que se desea tener, obteniéndose así la amplitud o tamaño  de cada intervalo. 
 - Comenzando por el mínimo valor de la variable, que será el extremo inferior del  primer intervalo, se suma a este valor la amplitud para obtener el extremo superior  y así sucesivamente.
Veamos como se resuelve el siguiente ejercicio del libro Santillana 8:
En un centro comercial, se consultó la edad a todas las personas que entraban entre las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:
tablas_de_frecuencias_datos_agrupados.jpg (416×149)
Construye una tabla de frecuencias cuyos datos estén agrupados en ocho intervalos.
1°Para poder construir la tabla de frecuencias lo primero que debemos hacer es calcular el rango.
El rango da la idea de proximidad de los datos a la media. Se calcula restando el dato menor al dato mayor.
El dato mayor y el menor lo hemos destacado con color rojo:
Dato mayor - dato menor =  73 - 1 =  72
Por lo tanto; Rango = 72

2° En el problema nos dicen que debemos agruparlo en 8 intervalos o clases, con este dato podemos calcular la amplitud o tamaño de cada intervalo, dividiendo el valor del rango por la cantidad de intervalos que se desean obtener (en este caso son 8).
tablas_de_frecuencias_datos_agrupados_amplitud.jpg (273×97)
72 / 8 = 9

Por lo tanto la amplitud de cada intervalo será de 9
3° Ahora podemos comenzar a construir la tabla de frecuencias:

tablas_de_frecuencias_datos_agrupados_2.jpg (624×288)