domingo, 16 de noviembre de 2014

Esperanza, varianza y desviación estándar.

Esperanza

En estadística la esperanza matemática, valor esperado o simplemente esperanza de una variable aleatoria X, es el número que formaliza la idea de valor medio de un fenómeno aleatorio.
Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado número de veces. Cabe decir que el valor que toma la esperanza matemática en algunos casos puede no ser "esperado" en el sentido más general de la palabra - el valor de la esperanza puede ser improbable o incluso imposible.

Propiedades del Valor Esperado

-          Constantes
La esperanza matemática de una constante es igual a esa misma constante, es decir, si c es una constante, entonces E[c] = c.
-          Linealidad
La esperanza es un operador lineal, ya que:

(*)

Por ende:
Donde X e Y son variables aleatorias y a y b son dos constantes cualesquiera.
Nótese que (*) es válido incluso si X no es independiente de Y.

Ejemplo:

El valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5. Podemos hacer el cálculo

y cabe destacar que 3,5 no es un valor posible al rodar el dado. En este caso, en el que todos los sucesos son de igual probabilidad, la esperanza es igual a la media aritmética.



Varianza 


Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería:




             Donde () representa la varianza, (Xi) representa cada uno de los valores, () representa la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el caso que estemos trabajando con una muestra la ecuación que se debe emplear es:



           
             Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, () representa la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra. Si nos fijamos en la ecuación, notaremos que se le resta uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una pequeña medida de corrección a la varianza, intentando hacerla más representativa para la población. Es necesario resaltar que la varianza nos da como resultado elpromedio de la desviación, pero este valor se encuentra elevado al cuadrado.

Propiedades de la varianza

·        σ2≥ La varianza es un valor positivo, como ya se ha comentado anteriormente, la igualdad sólo se da en el caso de que todas las muestras sean iguales.
·        Si a todos los datos se les suma una constante, la varianza sigue siendo la misma.
·        Si todos los datos se multiplican por una constante, la varianza queda multiplicada por el cuadrado de la constante.
·        Si se disponen de varias distribuciones con la misma media y se calculan las distintas varianzas, se puede hallar la varianza total aplicando la fórmula
σ2=σ21+σ22+…+σ2nn/(n-1)
En el caso de que las distribuciones tengan distinto tamaño, la fórmula se pondera y queda como

σ2=σ21k1+σ22k2+…+σ2nknk1+k2+…+kn

Ejemplos:
                  1)      En el Estado Barinas se realiza un chequeo a 12 adolescentes de 17 años para pertenecer a la selección regional de Tenis de Mesa en la categoría sub-17. Hallar la varianza la edad de los 12 participantes.
Al ser iguales las edades de los participantes, la media es la misma que la edad, por ende, la varianza es nula σˆ2=0.

                 2)      El día 13 de Nov del 2014 se realizó un examen parcial de Bioestadística correspondiente al último parcial del año. Tomando una muestra de los resultados de 10 exámenes siendo: 7, 15, 10, 11, 5.5, 10, 5, 10, 13 y 2. Hallar la varianza de las notas.

Procedemos a la realización del ejercicio. Primero debemos calcular la media:
 x¯: 7 + 15 + 10 + 11 + 5.5 + 10 + 5 + 10 + 13 + 2/10 = 8.85
Luego:
σˆ2: (7-8.85)ˆ2 + (15-8.85)ˆ2 + (10-8.85)ˆ2 + (11-8.85)ˆ2 + (5.5-8.85)ˆ2 + (10-8.85)ˆ2 + (5-8.85)ˆ2 + (10-8.85)ˆ2 + (13-8.85)ˆ2 + (2-8.85)ˆ2/(10-1)
σˆ2: 3.4225 + 37.8225 + 1.3225 + 4.6225 + 9 + 1.3225 + 14.8225 + 1.3225 + 17.2225 + 46.9225/(10-1)
σˆ2: 140.025/9
σˆ2: 15.5583

Desviación estándar

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:



Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.

Por lo que su media es:



La varianza sería:


Por lo tanto la desviación estándar sería:



 Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuánto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.


Propiedades de la Desviación Estándar

A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):
·        La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por definición. Cuando S = 0 e X = Xi (para todo i).
·        Es la medida de dispersión óptima por ser la más pequeña.
·        La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable
·        Si a todos los valores de la variable se le suma una misma constante la desviación estándar no varía.
·        Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar queda multiplicada por el valor absoluto de dicha constante.
Ejemplos:
A partir del  resultado del ejercicio de varianza, recordando que obtuvimos σˆ2: 15.5583, buscar la desviación estándar de las notas de segundo parcial. Entonces:
 δ = √15.5583 = 3.9444
Se concluye que la nota promedio del parcial es 8.85 con tendencia a variar por debajo o por encima en 3.9444 puntos.








Fuentes:
·         http://es.wikipedia.org/wiki/Esperanza_matem%C3%A1tica
·         http://www.spssfree.com/spss/analisis2.html
·         http://pendientedemigracion.ucm.es/info/genetica/Estadistica/estadistica_basica.htm
·         http://es.slideshare.net/ELISANTS/estadistica-inferencial-7946382
·         http://www.monografias.com/trabajos81/distribuciones-de-probabilidad-discreta/distribuciones-de-probabilidad-discreta2.shtml#ixzz3JHJfpjYd

No hay comentarios:

Publicar un comentario