Dispersión se define como
el grado de distanciamiento de un conjunto de valores respecto a su valor
medio.
A partir de esta
definición, se derivan las medidas de dispersión que aprendimos en la clase de
estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente
de correlación, etc.
Ahora bien, el diagrama
de dispersión, también conocido como gráfico de dispersión o gráfico de
correlación consiste en la representación gráfica de dos variables para un
conjunto de datos.
El diagrama de dispersión
es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un conjunto de datos.
Los datos se muestran
como un conjunto de puntos, cada uno con el valor de una variable que determina
la posición en el eje horizontal (x) y el valor de la otra variable determinado
por la posición en el eje vertical (y).
En este sentido, ambas
variables se representan como un punto en el plano cartesiano y de acuerdo a la
relación que exista entre ellas, definimos su tipo de correlación.
El diagrama de dispersión
permite estudiar las relaciones entre dos conjuntos asociados de datos que
aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama
muestra estos pares como una nube de puntos.
Las relaciones entre los
conjuntos asociados de datos se infieren a partir de la forma de las nubes.
Tipos
de correlación en un gráfico de dispersión
Con base en el
comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de
correlación: Positiva, negativa y nula.
Correlación positiva
Una relación positiva
entre x y y significa que los valores crecientes de x están asociados con los
valores crecientes de y.
Se presenta cuando una
variable aumenta o disminuye y la otra también, respectivamente. Hay una
relación proporcional.
Ejemplo para un vendedor
de carros, si él vende más carros (variable 1), va a ganar más dinero (variable
2).
Correlación
negativa
Una relación negativa
significa que los valores crecientes de x están asociados con los valores
decrecientes de y.
Se presenta cuando una
variable se comporta de forma contraria o a la otra, es decir que, si una
variable aumenta, la otra disminuye. Hay una relación inversa proporcional.
Ejemplo para la
construcción de un edificio, entre más trabajadores estén construyendo un
edificio (variable 1), menos tiempo se necesitará para tenerlo listo (variable
2)
Correlación
nula
Si no encuentras un
comportamiento entre las variables, existe una correlación nula.
Estos son pues, los tipos
de correlación más visibles. Aunque si lo miramos desde una perspectiva que evalúa
qué tan fuerte o débil es la correlación, encontramos otra clasificación.
¿Para qué se usa un
diagrama de dispersión?
Entre sus usos está descubrir y mostrar las relaciones entre
dos conjuntos asociados de datos y confirmar relaciones anticipadas entre dos
conjuntos asociados de datos.
El diagrama de dispersión puede estudiar la relación entre:
-
Dos
factores o causas relacionadas con la calidad.
-
Dos
problemas de calidad.
-
Un
problema de calidad y su posible causa.
Procedimiento para
hacer un diagrama de dispersión
1.- Recolectar datos pareados (x,y) a partir de dos conjuntos
asociados de datos cuya relación va a ser objeto de estudio. 2.- Es conveniente
contar con 30 pares de datos aproximadamente.
3.- Rotular el eje x y el eje y.
4.- Encontrar los valores mínimo y máximo, tanto para x como
para y y utilizar estos valores para elaborar la escala de los ejes horizontal
(x) y vertical (y). Ambos deben tener aproximadamente la misma longitud.
5.- Plotear los datos pareados (x,y). Cuando haya dos pares
de datos que tengan los mismos valores, dibujar círculos concéntricos al punto
ploteado o plotear el segundo punto a una corta distancia.
6.- Examinar la forma de la nube de puntos para descubrir los
tipos y las fuerzas de las relaciones.
Cuando hablamos de la relación entre dos tipos de acciones
nos referimos a una relación de causa y efecto, a una relación entre una causa
y otra, o a una relación entre una causa y dos o más causas.
Un diagrama de dispersión relaciona las tres condicionantes
antes mencionadas.
Correlación
La correlación no es más que cómo se relacionan ambas
variables entre sí. En la tabla siguiente te muestro algunos tipos de
correlación:
¿Qué es un gráfico de dispersión?
Los gráficos de dispersión se usan para trazar puntos de
datos en un eje vertical y uno horizontal, mediante lo que se trata de mostrar
cuánto afecta una variable a otra.
Cada fila de la tabla de datos la representa un indicador
cuya posición depende de sus valores en las columnas que se establecen en los
ejes X e Y. Se pueden usar varias escalas en el eje Y cuando se desea comparar
varios indicadores con rangos de valor significativamente distintos. Se puede
establecer una tercera variable para que se corresponda con el color o el
tamaño (por ejemplo, un gráfico de burbujas) de los indicadores, lo que
agregaría otra dimensión más al gráfico.
La relación entre dos variables se llama correlación. Si los
indicadores forman una línea casi recta en el gráfico de dispersión, las dos
variables tendrán una correlación alta. Si los indicadores se distribuyen de
manera uniforme a lo largo del gráfico de dispersión, la correlación es baja o
nula. Sin embargo, aunque parezca que existe una correlación entre variables,
esto no siempre es así. La causa de una aparente correlación podría ser que dos
variables estén relacionadas con una tercera variable, lo que explicaría la
variación, o pura coincidencia.
Si se aplica al crear el análisis, el gráfico de dispersión
puede mostrar información adicional en líneas de referencia o varios tipos
distintos de curvas. Estas líneas o curvas podrían, por ejemplo, mostrar si los
puntos de los datos se adaptan bien a un ajuste de curva polinómica
determinado, o resumir un conjunto de puntos de datos de muestra ajustándolos a
un modelo que describirá los datos y mostrará una curva o una línea recta sobre
la visualización.
La curva normalmente cambia su aspecto en función de los
valores que se hayan filtrado del análisis. Al pasar por encima el ratón, una
sugerencia sobre herramienta mostrará la forma en que se calcula la curva.
Ejemplo:
En el siguiente gráfico
de dispersión, (Y) y (X), para mostrar una
correlación positiva.
No hay comentarios:
Publicar un comentario
TU COMENTARIO O SUGERENCIA NOS HARÁ CRECER