P.
Juan Verdoy / M. J. Beltrán / M. J. Peris -
ÍNDICE
Prólogo
Introducción
Unidad 1.Estadística descriptiva univariante
Introducción teórica
Objetivos
Enunciados
Ayudas
Soluciones
Unidad 2. Estadística descriptiva bivariante
Introducción teórica
Objetivos
Enunciados
Ayudas
Soluciones
Unidad 3. Números índice
Introducción teórica
Objetivos
Enunciados
Ayudas.
Soluciones
Unidad 4. Series temporales
Introducción teórica
Objetivos
Enunciados
Ayudas
Soluciones
Bibliografía
Introducción
Unidad 1.Estadística descriptiva univariante
Introducción teórica
Objetivos
Enunciados
Ayudas
Soluciones
Unidad 2. Estadística descriptiva bivariante
Introducción teórica
Objetivos
Enunciados
Ayudas
Soluciones
Unidad 3. Números índice
Introducción teórica
Objetivos
Enunciados
Ayudas.
Soluciones
Unidad 4. Series temporales
Introducción teórica
Objetivos
Enunciados
Ayudas
Soluciones
Bibliografía
Prólogo
La estadística es una ciencia con base matemática
referente a la recogida, análisis e interpretación de datos que busca explicar
condiciones regulares en fenómenos de tipo aleatorio.
Es transversal a una amplia variedad de disciplinas, desde la
física hasta las ciencias sociales, desde las ciencias de la salud hasta el
control de calidad, y es usada para la toma de decisiones en áreas de negocios
e instituciones gubernamentales. Podemos considerar dos ramas en la
Estadística:
a) La estadística descriptiva, que se dedica a los métodos de
recogida, descripción, visualización y resumen de datos originados a partir de
los fenómenos en estudio. Los datos pueden ser resumidos numérica o
gráficamente. Ejemplos básicos de parámetros estadísticos son: la media y la
desviación estándar. Algunos ejemplos gráficos son: histograma, pirámide
poblacional, clústeres, etc.
b) La inferencia estadística se dedica a la generación de los
modelos, inferencias y predicciones asociadas a los fenómenos en cuestión
teniendo en cuenta la aleatoriedad de las observaciones. Se usa para modelar
patrones en los datos y extraer inferencias sobre la población de estudio.
Estas inferencias pueden tomar la forma de respuestas a
preguntas sí/no (prueba de hipótesis), estimaciones de características
numéricas (estimación), pronósticos de futuras observaciones, descripciones de
asociación (correlación) o modelización de relaciones entre variables (análisis
de regresión).
Otras técnicas de modelización incluyen anova , series de
tiempo y minería de datos. Ambas ramas (descriptiva e inferencial) comprenden
la estadística aplicada.
Hay también una disciplina llamada estadística matemática, la
cual hace referencia a las bases teóricas de la materia. La palabra
«estadística» también se refiere al resultado de aplicar un algoritmo
estadístico a un conjunto de datos, como en estadísticas económicas,
estadísticas criminales, etc.
En su origen, por lo tanto, la estadística estuvo asociada a
datos para ser utilizados por el gobierno y cuerpos administrativos (a menudo
centralizados). La colección de datos sobre estados y localidades continúa
ampliamente a través de los servicios de estadística nacionales e
internacionales.
En particular, los censos suministran información regular
sobre la población. Los métodos estadístico matemáticos emergieron desde la
teoría de probabilidad, que data desde la correspondencia ciertamente entre
Pierre de Fermat y Blaise Pascal (1654).
Christian Huygens (1657) da el primer tratamiento científico
que se conoce en la materia.
El Ars Conjectandi
(póstumo, 1713) de Jakob Bernoulli y la Doctrina de Posibilidades (1718) de Abraham de Moivre estudiaron la
materia como una rama de las matemáticas.
En la era moderna, el trabajo de Kolmogorov ha sido un pilar
en la formulación del modelo fundamental de la Teoría de Probabilidades, el
cual es usado a través de la estadística. La teoría de errores se puede remontar
a la Opera Miscellanea (póstuma,
1722) de Roger
Cotes y al
trabajo preparado por Thomas Simpson en 1755 (impreso en 1756) que
aplica por primera vez la teoría de la discusión de errores de observación.
La reimpresión (1757) de esta obra incluye el axioma de que
errores positivos y negativos son igualmente probables y que hay unos ciertos
límites asignables dentro de los cuales se encuentran todos los errores, se
describen errores continuos y una curva de probabilidad.
Pierre-Simon Laplace (1774) hace el primer intento de deducir
una regla para la combinación de observaciones desde los principios de la
teoría de probabilidades. Laplace representó la ley de probabilidades de
errores mediante una curva y dedujo una fórmula para la media de tres
observaciones.
También, en 1871, obtiene la fórmula para la ley de facilidad
del error (término introducido por Lagrange, 1744) pero
con ecuaciones inmanejables.
Daniel Bernoulli (1778)
introduce el principio del
máximo producto de
las probabilidades de
un sistema de
errores concurrentes.
El método de mínimos cuadrados, el cual fue usado para
minimizar los errores en
mediciones, fue publicado
independientemente por
Adrien-Marie Legendre (1805), Robert Adrain (1808) y Carl Friedrich Gauss
(1809). Gauss había usado el método en su famosa predicción de la localización
del planeta enano Ceres en 1801.
Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837) , Friedrich Bessel (1838), WF Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros, Col van Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). El siglo xix incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoran la presentación de la teoría. Adolphe Quetelet (1796-1874) fue otro importante fundador de la estadística y quien introdujo la noción del «hombre promedio» ( l’homme moyen ) como un medio de entender los fenómenos sociales complejos como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.
Durante el siglo xx , la creación de instrumentos necesarios para asuntos de salud pública (epidemiología, estadística, etc.) y propósitos económicos y sociales (tasa de desempleo, econometría, etc.) necesitó de avances sustanciales en las prácticas estadísticas.
Pruebas adicionales fueron escritas por Laplace (1810, 1812), Gauss (1823), James Ivory (1825, 1826), Hagen (1837) , Friedrich Bessel (1838), WF Donkin (1844, 1856), John Herschel (1850) y Morgan Crofton (1870). Otros, Col van Ellis (1844), Augustus De Morgan (1864), Glaisher (1872) y Giovanni Schiaparelli (1875). El siglo xix incluye autores como Laplace, Silvestre Lacroix (1816), Littrow (1833), Richard Dedekind (1860), Helmert (1872), Hermann Laurent (1873), Liagre, Didion y Karl Pearson. Augustus De Morgan y George Boole mejoran la presentación de la teoría. Adolphe Quetelet (1796-1874) fue otro importante fundador de la estadística y quien introdujo la noción del «hombre promedio» ( l’homme moyen ) como un medio de entender los fenómenos sociales complejos como tasas de criminalidad, tasas de matrimonio o tasas de suicidios.
Durante el siglo xx , la creación de instrumentos necesarios para asuntos de salud pública (epidemiología, estadística, etc.) y propósitos económicos y sociales (tasa de desempleo, econometría, etc.) necesitó de avances sustanciales en las prácticas estadísticas.
Hoy el uso de la estadística se ha extendido más allá de sus
orígenes como un servicio al Estado o al gobierno. Personas y organizaciones
usan la estadística para entender datos y tomar decisiones en ciencias
naturales y sociales, medicina, negocios y otras áreas.
La estadística es entendida generalmente no como un subárea
de las matemáticas sino como una ciencia diferente «aliada». Muchas
universidades tienen departamentos
académicos de matemáticas
y estadística separadamente.
La estadística se
enseña en departamentos tan diversos como psicología, educación y salud
pública.
Al aplicar la estadística a un problema científico,
industrial o social se comienza con un proceso o población a ser estudiado.
Esta puede ser la población de un país, la de grandes cristalizados en una roca
o la de bienes manufacturados por una fábrica en particular durante un período
dado. También podría ser un proceso observado en varios instantes y los datos
recogidos de esta manera constituyen una serie de tiempo.
Por razones prácticas, en lugar de compilar datos de una población entera, usualmente se estudia un subconjunto seleccionado de la población, llamado muestra. Datos sobre la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos: descripción e inferencia.
El concepto matemático fundamental utilizado para entender la aleatoriedad es el de probabilidad. La estadística matemática (también llamada teoría estadística) es la rama de las matemáticas aplicadas que usa la teoría de probabilidades y el análisis matemático para examinar las bases teóricas de la estadística.
El uso de cualquier método estadístico es válido solo cuando el sistema o población bajo consideración satisface los supuestos matemáticos del método. El mal uso de la estadística puede producir serios errores en la descripción e interpretación, afectando las políticas sociales, la práctica médica y la calidad de estructuras tales como puentes y plantas de reacción nuclear. Incluso cuando la estadística es correctamente aplicada, los resultados pueden ser difícilmente interpretados por un no experto.
Por ejemplo, el significado estadístico de una tendencia en los datos, que mide el grado en que la tendencia puede ser causada por una variación aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de habilidades estadísticas básicas (y el escepticismo) que una persona necesita para manejar información en el día a día se refiere como cultura estadística.
Este libro de problemas con ayudas es la primera parte de un conjunto de dos que comprenderá todas las fases del proceso estadístico. En este volumen se estudian mediante problemas los principales rasgos de la estadística descriptiva de una variable, de dos variables, los números índices y series temporales.
La novedad que presenta este manual es que todos los ejercicios tienen dos tipos de ayudas que aportan «pistas» de cómo resolver los ejercicios y los problemas. Así pues, el alumno puede consultarlas siempre que no sepa por dónde continuar mientras está resolviendo un ejercicio. De esta manera el estudiante evitará la desagradable sensación que una persona tiene cuando abandona la resolución de un ejercicio.
Además, también se incluyen las soluciones completas de los ejercicios, muchos de ellos comentados con profundidad. Es conveniente dejar claras dos cuestiones relevantes. La primera de ellas es que no hay que sacar la falsa idea de entender la estadística como una mera colección de métodos o técnicas útiles para el tratamiento de la información o, incluso lo que es más, concluir que la estadística es lo que hacen los estadísticos.
Aunque estas dos ideas no son desacertadas, tampoco permiten tener una visión completa de lo que es la estadística. La segunda es que nuestras decisiones se basan, cada vez más, en un flujo creciente de información que necesitamos sintetizar para evitar aquello de los árboles que impiden ver el bosque. Nuestras decisiones son de tipo condicionado, ya que las mismas se toman en función de algún tipo de información, tanto pasada como presente.
Este libro pretende ser un complemento didáctico de la teoría básica de estadística que se puede encontrar en otros numerosos libros que hoy en día se pueden encontrar en nuestras bibliotecas, así como sobre todo el manual Introducción a la estadística aplicada a las ciencias sociales de la Col·lecció Sapientia de Publicacions de la uji , que puede considerarse el manual teórico que complementa este libro. En definitiva, nuestra humilde pretensión es que este texto sirva de ayuda complementaria a todos aquellos estudiantes que se enfrentan (muchas veces con poco éxito) a la resolución de problemas de estadística descriptiva.
Por razones prácticas, en lugar de compilar datos de una población entera, usualmente se estudia un subconjunto seleccionado de la población, llamado muestra. Datos sobre la muestra son recogidos de manera observacional o experimental. Los datos son entonces analizados estadísticamente lo cual sigue dos propósitos: descripción e inferencia.
El concepto matemático fundamental utilizado para entender la aleatoriedad es el de probabilidad. La estadística matemática (también llamada teoría estadística) es la rama de las matemáticas aplicadas que usa la teoría de probabilidades y el análisis matemático para examinar las bases teóricas de la estadística.
El uso de cualquier método estadístico es válido solo cuando el sistema o población bajo consideración satisface los supuestos matemáticos del método. El mal uso de la estadística puede producir serios errores en la descripción e interpretación, afectando las políticas sociales, la práctica médica y la calidad de estructuras tales como puentes y plantas de reacción nuclear. Incluso cuando la estadística es correctamente aplicada, los resultados pueden ser difícilmente interpretados por un no experto.
Por ejemplo, el significado estadístico de una tendencia en los datos, que mide el grado en que la tendencia puede ser causada por una variación aleatoria en la muestra, puede no estar de acuerdo con el sentido intuitivo. El conjunto de habilidades estadísticas básicas (y el escepticismo) que una persona necesita para manejar información en el día a día se refiere como cultura estadística.
Este libro de problemas con ayudas es la primera parte de un conjunto de dos que comprenderá todas las fases del proceso estadístico. En este volumen se estudian mediante problemas los principales rasgos de la estadística descriptiva de una variable, de dos variables, los números índices y series temporales.
La novedad que presenta este manual es que todos los ejercicios tienen dos tipos de ayudas que aportan «pistas» de cómo resolver los ejercicios y los problemas. Así pues, el alumno puede consultarlas siempre que no sepa por dónde continuar mientras está resolviendo un ejercicio. De esta manera el estudiante evitará la desagradable sensación que una persona tiene cuando abandona la resolución de un ejercicio.
Además, también se incluyen las soluciones completas de los ejercicios, muchos de ellos comentados con profundidad. Es conveniente dejar claras dos cuestiones relevantes. La primera de ellas es que no hay que sacar la falsa idea de entender la estadística como una mera colección de métodos o técnicas útiles para el tratamiento de la información o, incluso lo que es más, concluir que la estadística es lo que hacen los estadísticos.
Aunque estas dos ideas no son desacertadas, tampoco permiten tener una visión completa de lo que es la estadística. La segunda es que nuestras decisiones se basan, cada vez más, en un flujo creciente de información que necesitamos sintetizar para evitar aquello de los árboles que impiden ver el bosque. Nuestras decisiones son de tipo condicionado, ya que las mismas se toman en función de algún tipo de información, tanto pasada como presente.
Este libro pretende ser un complemento didáctico de la teoría básica de estadística que se puede encontrar en otros numerosos libros que hoy en día se pueden encontrar en nuestras bibliotecas, así como sobre todo el manual Introducción a la estadística aplicada a las ciencias sociales de la Col·lecció Sapientia de Publicacions de la uji , que puede considerarse el manual teórico que complementa este libro. En definitiva, nuestra humilde pretensión es que este texto sirva de ayuda complementaria a todos aquellos estudiantes que se enfrentan (muchas veces con poco éxito) a la resolución de problemas de estadística descriptiva.
Los autores
Introducción
El presente libro de problemas se puede considerar como el
primero de los dos complementos del manual Introducción a la estadística
aplicada a las ciencias sociales de la
Colecció Sapientia de Publicacions de la Universitat Jaume I, el cual consta
fundamentalmente de contenidos teóricos, quedando el apartado de problemas en
un segundo plano.
Con este nuevo texto, basado casi exclusivamente en problemas resueltos, se completa parte del manual teórico y se facilita al estudiante una herramienta excelente para consolidar el aprendizaje de sus contenidos. Los problemas cuentan con ayudas, siendo la última su resolución completa. Es decir, cada uno de los problemas tiene dos tipos de ayudas, que no son más que una breve información que puede facilitar al estudiante el arduo trabajo de resolver el problema.
Las ayudas de tipo 1 son una mera orientación que tiene por objeto manifestar los contenidos que se deben consultar para poder resolver el problema. La ayuda de tipo 2 da bastante más información que la primera. Así, en muchas ayudas de este tipo se muestra parte de la resolución del ejercicio. Finalmente, en la resolución del problema se muestra con todo detalle los contenidos estadísticos que se utilizan y numerosos comentarios que permiten intuir la resolución del problemas similares.
Además, los problemas están clasificados por objetivos, ya que de esta manera el estudiante sabe en cada momento qué contenidos se están trabajando y, por tanto, puede consultar el manual teórico para revisar aquellas cuestiones en las que presente dificultades. Por otra parte, este manual está dividido en cuatro unidades que hacen referencia a la estadística descriptiva univariante, la estadística descriptiva bivariante, los números índices y, finalmente, las series temporales.
Cada unidad está dividida en cuatro bloques: en el primero se proponen los enunciados de los problemas clasificados por objetivos. La segunda parte proporciona únicamente las ayudas de tipo 1 En el tercer bloque las ayudas son del tipo 2.
El hecho de que para un mismo problema no se encuentren los dos tipos de ayudas conjuntamente tiene la pretensión de que el estudiante realice la consulta detallada de las ayudas, reforzando la idea de pensar antes de consultar. En la última parte se muestran las resoluciones completas de los problemas, las cuales están repletas de comentarios, gráficos y diagramas que facilitan su comprensión.
Con este nuevo texto, basado casi exclusivamente en problemas resueltos, se completa parte del manual teórico y se facilita al estudiante una herramienta excelente para consolidar el aprendizaje de sus contenidos. Los problemas cuentan con ayudas, siendo la última su resolución completa. Es decir, cada uno de los problemas tiene dos tipos de ayudas, que no son más que una breve información que puede facilitar al estudiante el arduo trabajo de resolver el problema.
Las ayudas de tipo 1 son una mera orientación que tiene por objeto manifestar los contenidos que se deben consultar para poder resolver el problema. La ayuda de tipo 2 da bastante más información que la primera. Así, en muchas ayudas de este tipo se muestra parte de la resolución del ejercicio. Finalmente, en la resolución del problema se muestra con todo detalle los contenidos estadísticos que se utilizan y numerosos comentarios que permiten intuir la resolución del problemas similares.
Además, los problemas están clasificados por objetivos, ya que de esta manera el estudiante sabe en cada momento qué contenidos se están trabajando y, por tanto, puede consultar el manual teórico para revisar aquellas cuestiones en las que presente dificultades. Por otra parte, este manual está dividido en cuatro unidades que hacen referencia a la estadística descriptiva univariante, la estadística descriptiva bivariante, los números índices y, finalmente, las series temporales.
Cada unidad está dividida en cuatro bloques: en el primero se proponen los enunciados de los problemas clasificados por objetivos. La segunda parte proporciona únicamente las ayudas de tipo 1 En el tercer bloque las ayudas son del tipo 2.
El hecho de que para un mismo problema no se encuentren los dos tipos de ayudas conjuntamente tiene la pretensión de que el estudiante realice la consulta detallada de las ayudas, reforzando la idea de pensar antes de consultar. En la última parte se muestran las resoluciones completas de los problemas, las cuales están repletas de comentarios, gráficos y diagramas que facilitan su comprensión.
UNI D A D 1
Estadística
descriptiva univariante
1 .- Introducción teórica
Como elementos introductorios de este
capítulo, es conveniente recordar definiciones de elementos importantes, ya
desarrolladas en diferentes materiales como los libros referenciados 1, 2 y 3,
tales como:
Población: Es el conjunto de elementos,
individuos o los sujetos a estudio y de los que se quiere obtener un resultado.
Parámetro: Es una medida descriptiva de la
población total, de todas las observaciones.
Muestra: Conjunto de elementos que forman
parte de la población total a la que representa.
Tamaño de la muestra: Es el número de elementos u
observaciones que forman la muestra.
Estadístico: Es una medida descriptiva de la
muestra y que estima el parámetro de la población.
Variables cualitativas y cuantitativas
Las variables en las que únicamente es posible un recuento
del número de elementos de la población o muestra que poseen una de sus
modalidades se llaman variables cualitativas o atributos (libros referenciados
4, 8, 14 y 19).
Las modalidades de estos tipos de variables ni siquiera admiten
una gradación y mucho menos una medida numérica. Son variables como el sexo de
una persona, la confesionalidad, etc. Las modalidades que pueden tomar se
denominan categorías. Así, las categorías de la variable sexo son masculino y
femenino.
El resto de variables
en las que,
además de admitir
el recuento del
número de elementos de la población
o muestra que poseen una de sus modalidades, también es posible asignarle una
medida a la propia modalidad, se denominan variables cuantitativas. Son por
ejemplo el peso, la altura, el sueldo mensual, el grado de dureza, etc.
Estas últimas variables, las cuantitativas, también pueden
clasificarse en discretas y continuas. Una variable continua es aquella que
puede tomar cualquier valor dentro de un rango dado. Independientemente de la
proximidad de dos observaciones, si el instrumento de medida es suficientemente
preciso, siempre se podrá encontrar una tercera observación entre las dos
primeras.
Una variable discreta está limitada para ciertos valores,
generalmente números enteros. Se diferencian de las continuas en que, dadas dos
observaciones suficientemente próximas, no se puede encontrar ninguna
observación de la variable entre ellas.
Son ejemplos el número de hijos de las
familias, el número de vehículos que tienen las empresas, el número de turistas
que visitan un país, etc.
La variable estadística se denota con mayúsculas.
Asimismo, cada una de estas variables puede tomar distintos valores siendo su
notación la siguiente: X = (x 1 , x 2 , x 3 ,..., x k-2 , x k-1 , x k )
Es importante remarcar que para calcular frecuencias
acumuladas es necesario que las variables por estudiar sean ordenables, es decir, debe ser posible establecer una relación de
orden entre las variables. En otros casos, no tiene ningún sentido realizar estos
cálculos.
Estas definiciones, permiten
resumir los datos.
Sin embargo, la manera más adecuada para sintetizar los datos es
mediante lo que se denomina tabla de frecuencias. En ella aparecen distribuidas
los datos según las frecuencias. Al
mismo tiempo refleja
todos los conceptos
mencionados con anterioridad.
En ocasiones el número
de datos diferentes que se está estudiando es muy numeroso. Entonces, si se
decidiera construir una tabla como la anterior, la columna relativa a las Xi sería
muy extensa, únicamente hay que pensar en doscientos datos diferentes dentro de
una recopilación de cuatrocientos.
La solución a esta cuestión consiste en agrupar los datos en
intervalos o clases, de modo que cada dato pertenezca a uno y solo un
intervalo. En consecuencia, los conceptos relativos a la frecuencia que hasta
ahora se referían a los valores diferentes de los datos, al realizar la
agrupación, deben hacer referencia a los intervalos.
Esta práctica, a pesar de que ayuda a resumir y clarificar la
información, tiene en cambio un inconveniente: se pierde información sobre la
propia distribución de datos. Al agruparlas en los intervalos los valores
reales se «difuminan».
Sin embargo, en la literatura matemática es posible encontrar
varias reglas para calcular el número adecuado de intervalos a partir del
número de datos, como que no puede superar el 10 % del número total de datos o
como el método de la raíz. Según este método el número de clases es igual a la
raíz cuadrada del número de datos:
Los gráficos también son muy útiles para describir los
conjuntos de datos (referencias 15, 20 y 23). De hecho, un gráfico estadístico
permite formarse una primera idea de la distribución de los datos tan solo con
una observación. No obstante, hay que tener cuidado pues en algunas ocasiones
los gráficos presentan «tendencias» no atribuibles al quehacer matemático.
Medidas de posición
Son coeficientes que tratan de representar una determinada
distribución; pueden ser de dos tipos, centrales y no centrales.
Medidas Centrales
Media aritmética
Es el valor que habitualmente se toma como representación de
los datos. Es la suma de todos los valores de la variable dividida entre el
número total de elementos. Si los datos están agrupados, se toma la marca de la
clase como representante del intervalo y se realizan todos los cálculos como si
los valores de la variable fueran las marcas de las clases.
Se utiliza para calcular el valor medio de magnitudes
expresadas en términos relativos como velocidades, tiempos, rendimiento, tipo
de cambio monetario, etc. Su principal contrariedad es que cuando algún valor
de la variable es 0 o próximo a cero no se puede calcular.
En muchas ocasiones,
no es necesario aplicar la fórmula anterior. Únicamente hay que tener presente
el concepto de media aritmética.
Mediana
Es evidente que lo que se pretende es calcular un
representante del intervalo con el objeto de fijar la mediana en un valor. Una
posibilidad hubiera sido considerar la marca de clase, sin embargo, el criterio
usualmente más seguido no es este sino el de la fórmula antes mencionada.
En esta fórmula en
primer lugar se considera el supuesto de que los datos están uniformemente
distribuidos dentro de cada intervalo. Teniendo este hecho en cuenta, se puede
observar que la fórmula es una relación de proporcionalidad entre las
posiciones que ocupan los valores de la variable y la amplitud de los
intervalos.
Moda
Es el valor de la variable que más veces se repite, es decir,
el valor que tiene mayor frecuencia absoluta. Pueden existir distribuciones con
más de una moda: bimodales, trimodal, etc.
Del mismo modo que la mediana, la fórmula tiene el supuesto
de que los datos están uniformemente repartidas dentro de cada intervalo.
Además, siguiendo este criterio se puede observar que la moda estará más cerca
de aquel intervalo adyacente con mayor frecuencia absoluta.
Medidas no
Centrales
Percentiles o cuantiles
Son medidas de localización similares a la mediana. Su
función es informar del valor de la variable que ocupará la posición (en tanto
por ciento) que nos interese respecto de todo el conjunto de observaciones.
Podemos
decir que los cuantiles son unas medidas de posición que dividen la
distribución en un cierto número de partes.
Medidas de dispersión
Son complementarias de las de posición, en el sentido que
señalan la dispersión del conjunto de todos los datos de la distribución,
respecto de la medida o medidas de localización adoptadas.
Recorrido
Se define como la diferencia entre el mayor y menor valor de
las variables de una distribución de datos, es decir:
Re = max (x i ) − min(
x i )
Recorrido
intercuartílico
Se define como la distancia que hay entre el tercer y el
primer cuartil, es decir:
Re = C 3 − C 1
Estos estadísticos tienen mucho interés en la Estadística
Inferencial como se verá en capítulos posteriores.
Las medidas de dispersión absolutas son unos indicadores que
presentan dificultades a la hora de comparar la representatividad de las
medidas de tendencia central entre dos distribuciones de datos diferentes. Por
ello, a veces se recurre a medidas de dispersión relativas.
Curtosis
Para estudiar el grado de curtosis de una distribución hay
que tomar un modelo teórico como referencia, la representación gráfica tenga
forma de campana simétrica. No es extraño pues, que se tome el modelo normal,
ya que, como ya se ha mencionado con anterioridad, se puede decir que es el
modelo campaniforme por antonomasia.
De esta manera, tomando este modelo como referencia, se dice
que una distribución es leptocúrtica si es más apuntada que la distribución
normal. Si es menos apuntada se le llama platicúrtica. Finalmente, si tiene el mismo apuntamiento que
una distribución normal se le llama mesocúrtica.
Del mismo modo que en el caso del estudio de la asimetría,
hay un coeficiente que permite clasificar los datos según la curtosis. En este
caso, el coeficiente no es tan intuitivo, por lo que únicamente se dará la
definición y su interpretación. Como en el caso de la otra medida de forma, este
indicador tampoco tiene dimensión.
La idea del apuntamiento de una distribución de datos sale de
la comparación de la frecuencia de los valores centrales de una distribución
con la frecuencia de los valores centrales en un modelo teórico normal que
tenga la misma media y la misma desviación típica que la distribución que se
está estudiando.
Por último, debemos remarcar que el estudio de la
curtosis no implica necesariamente que
las distribuciones sean simétricas. Así, por ejemplo, nos podríamos encontrar
distribuciones de observaciones que sean leptocúrticas y, al mismo tiempo,
asimétricas positivas.
Cajas y bigotes (Box-plot)
Un diagrama de
cajas y bigote
(conocido también como Box and whisker plot en inglés), es una
representación gráfica de los datos que permite determinar con mucha facilidad
y de una manera visual la tendencia central, la variabilidad, la asimetría y
la existencia de
valores anómalos de
un conjunto de
observaciones ( outliers ). De alguna manera, se puede decir que es uno
de los gráficos que más y mejor resumen los conjuntos de datos.
El diagrama de cajas emplea el resumen de los 5 números: la
menor observación, la mayor observación, el primer cuartil, la mediana y el
tercer cuartil.
Hay diferentes medidas de concentración, pero en el texto se
va a estudiar el índice de Gini; por ser un coeficiente, será un valor
numérico. Para obtenerlo es necesario realizar un conjunto de cálculos.
Por otra parte, si se representan gráficamente los q i en el eje vertical y los p i en la horizontal se obtendrá la curva de
concentración o curva de Lorenz. Se puede comprobar que esta curva resultante
siempre aparecerá «por debajo» de la diagonal del primer cuadrante, la cual
representa la concentración mínima. Además, cuando más se aproxime esta curva a
la diagonal, menor será la concentración.
A continuación, se desarrollará los objetivos y los
ejercicios correspondientes a este capítulo. Cabe recordar que el material
desarrollado y el resultado de algunos ejercicios son aplicaciones
desarrolladas con el software R (referencias bibliográficas 13, 18 y 22).
Objetivos
Los problemas deben permitir que los alumnos alcanzan los
objetivos didácticos:
1 a) Conocer los conceptos básicos de las variables estadísticas.
1 b) Saber clasificar las variables estadísticas.
1 c) Saber analizar y realizar tablas de frecuencias de un
conjunto de datos.
1 d) Conocer las diferencias entre las tablas de datos sin
agrupar y las tablas de datos agrupados.
1 e) Saber interpretar y construir los principales gráficos
estadísticos.
1 f) Conocer los conceptos y saber realizar los cálculos de
las medidas de tendencia central y de dispersión. Concretar con la aplicación
del coeficiente de variación de Pearson en aquellas situaciones que lo
requieran.
1 g) Conocer los principales estadísticos que miden la forma
de los datos a partir de los gráficos.
1 h) Saber calcular
e interpretar el
índice de Gini,
así como saber
realizar la curva de Lorenz para
medir la equidad de un reparto.
La tabla
siguiente nos muestra
cómo están distribuidos
los objetivos según
los ejercicios:
Ayudas
En este apartado se presentarán las ayudas a emplear en caso
de ser necesario a la hora de realizar los ejercicios y problemas. Es
conveniente no hacer un abuso excesivo de estas ayudas, es decir, antes de
emplear la ayuda hay que pensar el problema al menos durante unos 10-15
minutos. Después se consultará la ayuda de tipo 1 y se intentará resolver el
ejercicio con esta ayuda. Si no es posible resolverlo, entonces se consultará
la ayuda de tipo 2; y en último término la solución.
/////////////////////////////////////////////////////////////////////////////////////////////////
lllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
iiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
///////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////
ññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññ
////////////////////////////////////////////////////////////////////////////////////////
///////////////////////////////////////////////////////////////////////////////////////
Ayuda tipo 1
Ayuda tipo 2
MMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMM
SOLUCIÓN
lllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
/////////////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////////////
jjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj
////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////////7///
hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh
Ayudas
Tipo 1
ññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññññ
////////////////////////////////////////////////////////////////////////////////////////
///////////////////////////////////////////////////////////////////////////////////////
Ayuda tipo 1
Ayuda tipo 2
SOLUCIÓN
MMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMMM
SOLUCIÓN
lllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
AYUDA TIPO 2
kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
/////////////////////////////////////////////////////////////////////////////////////////
////////////////////////////////////////////////////////////////////////////////////////
jjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjjj
hhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhhh
////////////////////////////////////////////////////////////////////////////////////////
kkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkkk
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
llllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllllll
pppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppppp
Ayudas
Tipo 1
En este apartado se presentarán las ayudas para emplear en
caso de ser necesario a la hora de realizar los ejercicios y problemas, y tras
consultar la ayuda de tipo 1.
mmmmmmmmmmm
No hay comentarios:
Publicar un comentario
TU COMENTARIO O SUGERENCIA NOS HARÁ CRECER