SEMANA 7 MEDIDAS DE DISPERSION: RANGO O ALCANCE, DESVIACIÓN MEDIO, VARIANZA Y DESVIO ESTANDAR

REPASAMOS LO VISTO HASTA AQUÍ



MEDIDAS DE DISPERSION: 

RANGO O ALCANCE, DESVIACIÓN MEDIO, VARIANZA Y DESVIO ESTANDAR


Los valores de posición central nos muestran un cuadro, en cierta forma satisfactorio en cuanto a las características de la muestra; pero nada agrega con respecto a la dispersión que tienen los valores de la distribución con respecto a un valor fijo.
Dos distribuciones que tienen la misma cantidad de valores, y poseen una misma media , pueden tener características totalmente distintas en lo que se refiere a la distribución de sus valores.(DISPERSION)


Analicemos para cada muestra
n:
Media:
Mediana:


En el caso de C y D distribuciones de igual número de valores tienen la similares medias (3,25 y 3,625 respectivamente ),no obstante son distintas las distribuciones.
Por lo tanto, es conveniente efectuar (conjuntamente con el estudio de los valores de posición central) un análisis que permita establecer cuál es el grado de dispersión que presentan las observaciones de una distribución, con respecto a un valor fijo.

Los valores de dispersión a estudiar son:


a. Alcance o Rango

b. Desvío medio

c. Varianza

d. Desvío estándar

e. Coeficiente de variación



a. Alcance o Rango





Resolvemos dos TIPOS de problemas:

Para DATOS NO AGRUPADOS:

EJERCICIO 1(edades del grupo de 4to cuatrimestre de Informática del IES siglo 21)

DATOS
23 19
28 19
24 19
19 19
22 19
23 20
25 21
23 21
26 21
29 22
19 23
19 23
19 23
21 23
19 24
23 24
21 25
20 26
21 28
24 29
n=20 personas X=22,40 años  Me= 22,5 años Mo=19 años


Problema 2
De la localidad de Olivos de la Provincia de Córdoba, se han relevado 9 valores correspondientes a los rindes de maní en el última cosecha en qq/ha y los valores son los siguientes:

21    22    21    22    22    22    22    19    22

a. determine los valores de tendencia central

      19    21    21    22    22    22    22    22    22


X= 139/9= 21,44 qq/ha
Me= 22 qq/ha
Mo=22 qq/ha


b. calcule el rango
                        R= 22-19= 3 qq/ha

c. Calcule el desvío medio (DM) 








                    DM

Para DATOS AGRUPADOS:

Problema 3:

Una empresa dedicada a la construcción de embalses y represas es contratada por Usted para proveer de agua a un campo a través de una represa. La empresa decide medir el flujo de agua que pasa por el lugar, durante 246 días alternados, durante el último año. Los resultados son los siguientes:

 

FLUJO DE AGUA LITROS EN litros/min

Frecuencia absoluta

 

 

 

 

 

1001-1050

7

 

 

 

 

 

1051-1100

21

 

 

 

 

 

1101-1150

32

 

 

 

 

 

1151-1200

49

 

 

 

 

 

1201-1250

58

 

 

 

 

 

1251-1300

41

 

 

 

 

 

1301-1350

27

 

 

 

 

 

1351-1400

11

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 


Problema 4

La cadena de supermercados "La Paz", se encuentra realizando un estudio estadístico de los talles de sus empleados, debido a un reclamo que se ha producido en la Gerencia General, por el aspecto personal que presentan algunos de ellos, lo que incide negativamente en la imagen de la organización. Con la finalidad de revertir dicha situación, la división abastecimiento ha efectuado un muestreo de 49 empleados sobre un total de 500, que es el plantel permanente, registrando la altura de cada uno de ellos.


a. realice la tabla de datos de intervalos para datos agrupados, calcule la media.
b. calcule el rango
c. calcule el desvio medio (DM)











CONCLUSIÓN 

La desviación media es una medida que se utiliza para entender qué tanto se alejan los datos de un conjunto promedio. 


VARIANZA:
Se define como varianza de una distribución, al promedio de los desvíos cuadráticos medios. 

Es otra medida de dispersión que en lugar de tomar los valores absolutos de los desvíos medios, eleva al cuadrado cada uno de ellos, así nos queda positivo.

La varianza se enuncia como Var(x) o también como σ²



Es conveniente tener en consideración lo siguiente: la sumatoria de todas las frecuencias es igual al número total de observaciones, N para cuando nos referimos a una población.

En el caso de manejarnos con una muestra, la sumatoria de las fi conciernen al número de observaciones y se las denomina n.

Dos expresiones para la varianza, según se trate de una población o una muestra. Recuerde:



Calculemos para el problema en cuestión





IMPORTANTE 

Aunque la varianza nos da un grado de dispersión de los valores de una distribución, presenta la restricción de que sus unidades no coinciden con la de los valores, por estar elevadas al cuadrado, por ejemplo: pesos cuadrados. Este problema se soluciona con la aplicación del desvío estándar.


DESVIACIÓN ESTANDAR:

Se define como desvío estándar en una distribución, a la raíz cuadrada de la varianza.

La ventaja que presenta el desvío estándar respecto de la varianza, es que sus unidades coinciden con la de los valores de la distribución.



INTERPRETACIÓN

El desvío estándar se convierte en un valor de gran importancia para definir en una distribución el grado de dispersión de sus valores.

Un valor pequeño de sigma con respecto a sus observaciones, implica:
- que los valores se concentran próximos a su media, por el contrario, 
- un valor elevado de sigma mostraría que los valores se encuentran dispersos y alejados de su media.

Si graficamos el polígono de frecuencias relativas de una distribución y afinamos convenientemente sus lados, obtendremos una gráfica que tiende a ser acampanada, esto nos mostrará la dispersión de esa distribución.

Si tomamos tres distribuciones que posean la misma media, pero con valores de sigma distintos, tal como lo presenta el siguiente gráfico: 


Las tres curvas toman la misma superficie, 1, tienen la misma media, pero los valores que forman cada una de sus distribuciones están colocados de manera distinta.
Si la campana se cierra, nos muestra que los valores tienden a agruparse alrededor de la media y, por consiguiente, tendrán una menor dispersión, por el contrario, si la curva se achata, nos muestra claramente una mayor dispersión de los valores que forman
dicha distribución.


Calculamos el desvío estándar del problema 


OBSERVACIONES IMPORTANTES:


Debemos observar que el desvío medio que obtuvimos anteriormente fue de 6,53 cm, un valor no tan alejado del desvío estándar.

El desvío estándar puede adquirir el valor de 0, cuando todos los valores son iguales y por lo tanto, todas las diferencias serán nulas.

La varianza no puede adquirir un valor negativo, ya que la misma está dada por el promedio del cuadrado de las diferencias y, por lo tanto, no podrá tomar en ningún momento valores negativos.


Regla Empírica:

(La calculadora de la regla empírica, o calculadora de la regla 68-95-99, es una herramienta para encontrar los rangos que están a 1, 2 y 3 desviaciones estándar de la media, en los que encontrarás el 68, 95 y 99.7% de los datos, respectivamente (siempre y cuando se encuentren normalmente distribuidos- La distribución normal es simétrica, la media, moda y mediana coinciden, y es descrita completamente por sus dos parámetros mu (µ) y sigma (σ))

Aún lo visto anteriormente, dada una distribución, el valor de su desvío estándar nos muestra el grado de dispersión de sus valores con respecto a la media, pero es en verdad la regla empírica la que relaciona a los dos parámetros: x o μ, y σ con el siguiente enunciado.


En el intervalo centrado en la media y tal que su origen izquierdo esté dado por la media menos un desvío estándar, y el derecho por la media más un desvío estándar:
se agrupa el 68 % de los valores de la distribución.




En el intervalo comprendido por la media menos dos desvíos estándar y más dos desvíos se ubica el 95 % de los valores de
la distribución




En el intervalo comprendido por la media menos tres
desvíos estándar y la media más tres desvíos estándarse tendrá el 99,7 % de N (se considera en numerosas oportunidades en este intervalo el 100 % de N).




Debe considerar que, entre el inicio de la gráfica y su fin, se encuentran ubicados todos los valores de la distribución N.


Problemas de calculo de medidas de dispersión 

1.  Calcula la media, la varianza, la desviación media y la desviación estándar, tras  encuestar a 25 familias sobre el número de hijos que tenían, se obtuvieron los siguientes datos:



solución




2. Del siguiente ejercicio calcular la varianza y la desviación estándar.





  • Primero hay que entender qué son ambas cosas. En un conjunto, la varianza es un cálculo que te dice qué tan alejados están los datos con respecto a su media. También podría decirse que es el promedio de las diferencias (elevadas al cuadrado) entre cada dato y el promedio simple de todos los datos. Por ejemplo, tenemos los precios de 3 gomas de mascar diferentes: $5, $6 y $7. Su promedio simple sería: 5+6+7/3 = 18/3 = 6 Ahora tomamos las diferencias entre cada dato y el promedio simple, y luego las elevamos al cuadrado: (5–6)^2=1 (6–6)^2=0 (7–6)^2=1 Y sumamos los resultados: 1+0+1=2 Entonces dividimos este 2 entre el número de gomas de mascar que teníamos inicialmente (3): 2/3=0.66 Nuestra varianza es 0.66 dólares/pesos/euros al cuadrado (sí, suena raro, pero es al cuadrado). ¿Por qué elevamos las diferencias al cuadrado para tener unidades al cuadrado? Porque si no lo hiciéramos, el resultado sería 0 y ese valor no nos sirve para nada, pues sería como decir que todos los datos son iguales o que no se alejan de 6, lo cual es falso. Así es la estadística. Mientras tanto, la desviación estándar (o típica) simplemente es la raíz cuadrada de la varianza. Entonces, la desviación típica sería √0.66 = 0.81 dólares/pesos/euros aproximadamente. ¿Cuál es además la diferencia entre una y otra? Sirven para casi lo mismo, pero la desviación típica es útil para tener simples dólares/pesos/euros, nada de eso elevado al cuadrado. Depende de lo que estemos haciendo, será más rápido encontrar alguna u otra cosa con cada medida. ¿Y entonces qué cosas puedo encontrar con la varianza, si la desviación típica ya me indica algo más concreto en sí? Pues para encontrar medidas como la misma desviación típica, la covarianza, la correlación lineal y modelos como la recta de regresión y los de efectos fijos o aleatorios, los cuales forman parte de un panomara más amplio de la estadística.

Escribe una respuesta

0

FIN ESTADISTICA

Comentarios

Entradas populares de este blog

PREPARANDONOS PARA EL IEFI

SEMANA1- Probabilidad vs Estadística

SEMANA2- VALORES DE TENDENCIA CENTRAL