domingo, 25 de noviembre de 2018

DIAGRAMA DE DISPERSIÓN

Dispersión se define como el grado de distanciamiento de un conjunto de valores respecto a su valor medio.

A partir de esta definición, se derivan las medidas de dispersión que aprendimos en la clase de estadística del colegio: Rango, varianza, desviación, covarianza, coeficiente de correlación, etc.

Ahora bien, el diagrama de dispersión, también conocido como gráfico de dispersión o gráfico de correlación consiste en la representación gráfica de dos variables para un conjunto de datos.

El diagrama de dispersión es un tipo de diagrama matemático que utiliza las coordenadas cartesianas para mostrar los valores de dos variables para un conjunto de datos.

Los datos se muestran como un conjunto de puntos, cada uno con el valor de una variable que determina la posición en el eje horizontal (x) y el valor de la otra variable determinado por la posición en el eje vertical (y).

En este sentido, ambas variables se representan como un punto en el plano cartesiano y de acuerdo a la relación que exista entre ellas, definimos su tipo de correlación.

El diagrama de dispersión permite estudiar las relaciones entre dos conjuntos asociados de datos que aparecen en pares (por ejemplo, (x,y), uno de cada conjunto). El diagrama muestra estos pares como una nube de puntos.

Las relaciones entre los conjuntos asociados de datos se infieren a partir de la forma de las nubes.

Tipos de correlación en un gráfico de dispersión

Con base en el comportamiento que toman las variables de estudio, podemos encontrar 3 tipos de correlación: Positiva, negativa y nula.

Correlación positiva
Una relación positiva entre x y y significa que los valores crecientes de x están asociados con los valores crecientes de y.

Se presenta cuando una variable aumenta o disminuye y la otra también, respectivamente. Hay una relación proporcional.

Ejemplo para un vendedor de carros, si él vende más carros (variable 1), va a ganar más dinero (variable 2).

Correlación negativa
Una relación negativa significa que los valores crecientes de x están asociados con los valores decrecientes de y.

Se presenta cuando una variable se comporta de forma contraria o a la otra, es decir que, si una variable aumenta, la otra disminuye. Hay una relación inversa proporcional.

Ejemplo para la construcción de un edificio, entre más trabajadores estén construyendo un edificio (variable 1), menos tiempo se necesitará para tenerlo listo (variable 2)

Correlación nula
Si no encuentras un comportamiento entre las variables, existe una correlación nula.

Estos son pues, los tipos de correlación más visibles. Aunque si lo miramos desde una perspectiva que evalúa qué tan fuerte o débil es la correlación, encontramos otra clasificación.

¿Para qué se usa un diagrama de dispersión?
Entre sus usos está descubrir y mostrar las relaciones entre dos conjuntos asociados de datos y confirmar relaciones anticipadas entre dos conjuntos asociados de datos.

El diagrama de dispersión puede estudiar la relación entre:

-         Dos factores o causas relacionadas con la calidad.
-         Dos problemas de calidad.
-         Un problema de calidad y su posible causa.

Procedimiento para hacer un diagrama de dispersión

1.- Recolectar datos pareados (x,y) a partir de dos conjuntos asociados de datos cuya relación va a ser objeto de estudio. 2.- Es conveniente contar con 30 pares de datos aproximadamente.
3.- Rotular el eje x y el eje y.
4.- Encontrar los valores mínimo y máximo, tanto para x como para y y utilizar estos valores para elaborar la escala de los ejes horizontal (x) y vertical (y). Ambos deben tener aproximadamente la misma longitud.
5.- Plotear los datos pareados (x,y). Cuando haya dos pares de datos que tengan los mismos valores, dibujar círculos concéntricos al punto ploteado o plotear el segundo punto a una corta distancia.
6.- Examinar la forma de la nube de puntos para descubrir los tipos y las fuerzas de las relaciones.

Cuando hablamos de la relación entre dos tipos de acciones nos referimos a una relación de causa y efecto, a una relación entre una causa y otra, o a una relación entre una causa y dos o más causas.

Un diagrama de dispersión relaciona las tres condicionantes antes mencionadas.

Correlación
La correlación no es más que cómo se relacionan ambas variables entre sí. En la tabla siguiente te muestro algunos tipos de correlación:



¿Qué es un gráfico de dispersión?
Los gráficos de dispersión se usan para trazar puntos de datos en un eje vertical y uno horizontal, mediante lo que se trata de mostrar cuánto afecta una variable a otra.

Cada fila de la tabla de datos la representa un indicador cuya posición depende de sus valores en las columnas que se establecen en los ejes X e Y. Se pueden usar varias escalas en el eje Y cuando se desea comparar varios indicadores con rangos de valor significativamente distintos. Se puede establecer una tercera variable para que se corresponda con el color o el tamaño (por ejemplo, un gráfico de burbujas) de los indicadores, lo que agregaría otra dimensión más al gráfico.

La relación entre dos variables se llama correlación. Si los indicadores forman una línea casi recta en el gráfico de dispersión, las dos variables tendrán una correlación alta. Si los indicadores se distribuyen de manera uniforme a lo largo del gráfico de dispersión, la correlación es baja o nula. Sin embargo, aunque parezca que existe una correlación entre variables, esto no siempre es así. La causa de una aparente correlación podría ser que dos variables estén relacionadas con una tercera variable, lo que explicaría la variación, o pura coincidencia.

Si se aplica al crear el análisis, el gráfico de dispersión puede mostrar información adicional en líneas de referencia o varios tipos distintos de curvas. Estas líneas o curvas podrían, por ejemplo, mostrar si los puntos de los datos se adaptan bien a un ajuste de curva polinómica determinado, o resumir un conjunto de puntos de datos de muestra ajustándolos a un modelo que describirá los datos y mostrará una curva o una línea recta sobre la visualización. 

La curva normalmente cambia su aspecto en función de los valores que se hayan filtrado del análisis. Al pasar por encima el ratón, una sugerencia sobre herramienta mostrará la forma en que se calcula la curva.

Ejemplo:


En el siguiente gráfico de dispersión,  (Y) y (X), para mostrar una correlación positiva.







No hay comentarios:

Publicar un comentario

TU COMENTARIO O SUGERENCIA NOS HARÁ CRECER

Translate