domingo, 16 de noviembre de 2014

Distribución de probabilidad en la cotidianidad de la Ciencia Médica

DISTRIBUCIÓN DE PROBABILIDAD

                    Para comprender mejor el papel de la probabilidad en cualquier rama es bueno conocer un poco de su historia la cual comienza en el siglo XVII cuando Pierre Fermat y Blaise Pascal tratan de resolver algunos problemas relacionados con los juegos de azar. Aunque algunos marcan sus inicios cuando Cardano (jugador donde los haya) escribió sobre 1520 El Libro de los Juegos de Azar (aunque no fue publicado hasta más de un siglo después, sobre 1660) no es hasta dicha fecha que comienza a elaborarse una teoría aceptable sobre los juegos.
Christian Huygens conoció la correspondencia entre Blaise Pascal y Pierre Fermat suscitada por el caballero De Méré, se planteó el debate de determinar la probabilidad de ganar una partida, y publicó (en 1657) el primer libro sobre probabilidad: De Ratiociniis in Ludo Aleae, (Calculating in Games of Chance), un tratado sobre juegos de azar.

                    Durante el siglo XVIII, debido muy particularmente a la popularidad de los juegos de azar, el cálculo de probabilidades tuvo un notable desarrollo sobre la base de la anterior definición de probabilidad. Destacan en 1713 el teorema de Bernoulli y la distribución binomial, y en 1738 el primer caso particular estudiado por De Moivre, del teorema central del límite. En 1809 Gauss inició el estudio de la teoría de errores y en 1810 Laplace, que había considerado anteriormente el tema, completó el desarrollo de esta teoría. En 1812 Pierre Laplace publicó “Théorie analytique des probabilités” en el que expone un análisis matemático sobre los juegos de azar.

                    A mediados del siglo  XIX, un fraile agustino austríaco, Gregor Mendel, inició el estudio de la herencia, la genética, con sus interesantes experimentos sobre el cruce de plantas de diferentes características. Su obra, La matemática de la Herencia, fue una de las primeras aplicaciones importantes de la teoría de probabilidad a las ciencias naturales. Como podemos observar todo comenzó con unos sencillos juegos de azar, pasando por Mendel, creador de leyes que llevan su apellido, precursor de la genética, aún muy utilizados hoy día y hasta llegar a la Medicina actual donde antes de realizar cualquier tipo de investigaciones y experimentos, se realizan cálculos de probabilidad y de esta manera descartar la mayor cantidad de errores posibles.




                 Para continuar, una distribución de probabilidad indica toda la gama de valores que pueden representarse como resultado de un experimento si éste se llevase a cabo. Es decir, describe la probabilidad de que un evento se realice en el futuro, constituye una herramienta fundamental para la prospectiva, puesto que se puede diseñar un escenario de acontecimientos futuros considerando las tendencias actuales de diversos fenómenos naturales.

                  La medicina es una ciencia inexacta por lo que el médico raras veces puede predecir un resultado con absoluta certeza. Para formular el diagnóstico el médico debe contar con toda la información posible acerca del paciente, de ésta manera la probabilidad de un diagnóstico erróneo es menor. En general, el médico o el investigador, debe obtener la mayor cantidad de datos sobre lo que está analizando para así evitar errores y la probabilidad sea más exacta (sabiendo que ésta se mide en valores de 0 a 1, donde 0 es que no existe probabilidad de que algo así ocurra, y 1 representa un siempre).

 A través de distribución de probabilidad y con el paso del tiempo y las mejoras en el método científico, se ha logrado el cálculo más exacto de posibles hechos. Es necesario resaltar que TODA distribución de probabilidad es generada por una variable (porque puede tomar diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar).

Ejemplo: En Medicina  un ejemplo de distribución de probabilidad representa la frecuencia con que se presenta cierta enfermedad.
Una paciente de 22 años presenta mareos, cansancio. Su madre sufre de diabetes, mientras que su padre  no. La probabilidad de padecer esta enfermedad es del 50%, es decir dos resultados posibles, positivo o negativo. Al realizarse los estudios pertinentes el examen arroja niveles de insulina muy altos, lo que indica que es diabética, es decir positivo. La paciente debe estar en tratamiento de por vida y evitar el consumo excesivo de azucares.



Esperanza, varianza y desviación estándar.

Esperanza

En estadística la esperanza matemática, valor esperado o simplemente esperanza de una variable aleatoria X, es el número que formaliza la idea de valor medio de un fenómeno aleatorio.
Cuando la variable aleatoria es discreta, la esperanza es igual a la suma de la probabilidad de cada posible suceso aleatorio multiplicado por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se "espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene constante y el experimento se repite un elevado número de veces. Cabe decir que el valor que toma la esperanza matemática en algunos casos puede no ser "esperado" en el sentido más general de la palabra - el valor de la esperanza puede ser improbable o incluso imposible.

Propiedades del Valor Esperado

-          Constantes
La esperanza matemática de una constante es igual a esa misma constante, es decir, si c es una constante, entonces E[c] = c.
-          Linealidad
La esperanza es un operador lineal, ya que:

(*)

Por ende:
Donde X e Y son variables aleatorias y a y b son dos constantes cualesquiera.
Nótese que (*) es válido incluso si X no es independiente de Y.

Ejemplo:

El valor esperado cuando tiramos un dado equilibrado de 6 caras es 3,5. Podemos hacer el cálculo

y cabe destacar que 3,5 no es un valor posible al rodar el dado. En este caso, en el que todos los sucesos son de igual probabilidad, la esperanza es igual a la media aritmética.



Varianza 


Esta medida nos permite identificar la diferencia promedio que hay entre cada uno de los valores respecto a su punto central (Media). Este promedio es calculado, elevando cada una de las diferencias al cuadrado (Con el fin de eliminar los signos negativos), y calculando su promedio o media; es decir, sumado todos los cuadrados de las diferencias de cada valor respecto a la media y dividiendo este resultado por el número de observaciones que se tengan. Si la varianza es calculada a una población (Total de componentes de un conjunto), la ecuación sería:




             Donde () representa la varianza, (Xi) representa cada uno de los valores, () representa la media poblacional y (N) es el número de observaciones ó tamaño de la población. En el caso que estemos trabajando con una muestra la ecuación que se debe emplear es:



           
             Donde (S2) representa la varianza, (Xi) representa cada uno de los valores, () representa la media de la muestra y (n) es el número de observaciones ó tamaño de la muestra. Si nos fijamos en la ecuación, notaremos que se le resta uno al tamaño de la muestra; esto se hace con el objetivo de aplicar una pequeña medida de corrección a la varianza, intentando hacerla más representativa para la población. Es necesario resaltar que la varianza nos da como resultado elpromedio de la desviación, pero este valor se encuentra elevado al cuadrado.

Propiedades de la varianza

·        σ2≥ La varianza es un valor positivo, como ya se ha comentado anteriormente, la igualdad sólo se da en el caso de que todas las muestras sean iguales.
·        Si a todos los datos se les suma una constante, la varianza sigue siendo la misma.
·        Si todos los datos se multiplican por una constante, la varianza queda multiplicada por el cuadrado de la constante.
·        Si se disponen de varias distribuciones con la misma media y se calculan las distintas varianzas, se puede hallar la varianza total aplicando la fórmula
σ2=σ21+σ22+…+σ2nn/(n-1)
En el caso de que las distribuciones tengan distinto tamaño, la fórmula se pondera y queda como

σ2=σ21k1+σ22k2+…+σ2nknk1+k2+…+kn

Ejemplos:
                  1)      En el Estado Barinas se realiza un chequeo a 12 adolescentes de 17 años para pertenecer a la selección regional de Tenis de Mesa en la categoría sub-17. Hallar la varianza la edad de los 12 participantes.
Al ser iguales las edades de los participantes, la media es la misma que la edad, por ende, la varianza es nula σˆ2=0.

                 2)      El día 13 de Nov del 2014 se realizó un examen parcial de Bioestadística correspondiente al último parcial del año. Tomando una muestra de los resultados de 10 exámenes siendo: 7, 15, 10, 11, 5.5, 10, 5, 10, 13 y 2. Hallar la varianza de las notas.

Procedemos a la realización del ejercicio. Primero debemos calcular la media:
 x¯: 7 + 15 + 10 + 11 + 5.5 + 10 + 5 + 10 + 13 + 2/10 = 8.85
Luego:
σˆ2: (7-8.85)ˆ2 + (15-8.85)ˆ2 + (10-8.85)ˆ2 + (11-8.85)ˆ2 + (5.5-8.85)ˆ2 + (10-8.85)ˆ2 + (5-8.85)ˆ2 + (10-8.85)ˆ2 + (13-8.85)ˆ2 + (2-8.85)ˆ2/(10-1)
σˆ2: 3.4225 + 37.8225 + 1.3225 + 4.6225 + 9 + 1.3225 + 14.8225 + 1.3225 + 17.2225 + 46.9225/(10-1)
σˆ2: 140.025/9
σˆ2: 15.5583

Desviación estándar

Esta medida nos permite determinar el promedio aritmético de fluctuación de los datos respecto a su punto central o media. La desviación estándar nos da como resultado un valor numérico que representa el promedio de diferencia que hay entre los datos y la media. Para calcular la desviación estándar basta con hallar la raíz cuadrada de la varianza, por lo tanto su ecuación sería:



Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520) gramos respectivamente.

Por lo que su media es:



La varianza sería:


Por lo tanto la desviación estándar sería:



 Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta información le permite al gerente determinar cuánto es el promedio de perdidas causado por el exceso de peso en los empaques y le da las bases para tomar los correctivos necesarios en el proceso de empacado.


Propiedades de la Desviación Estándar

A su vez la desviación estándar, también tiene una serie de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la varianza):
·        La desviación estándar es siempre un valor no negativo S será siempre ³ 0 por definición. Cuando S = 0 e X = Xi (para todo i).
·        Es la medida de dispersión óptima por ser la más pequeña.
·        La desviación estándar toma en cuenta las desviaciones de todos los valores de la variable
·        Si a todos los valores de la variable se le suma una misma constante la desviación estándar no varía.
·        Si a todos los valores de la variable se multiplican por una misma constante, la desviación estándar queda multiplicada por el valor absoluto de dicha constante.
Ejemplos:
A partir del  resultado del ejercicio de varianza, recordando que obtuvimos σˆ2: 15.5583, buscar la desviación estándar de las notas de segundo parcial. Entonces:
 δ = √15.5583 = 3.9444
Se concluye que la nota promedio del parcial es 8.85 con tendencia a variar por debajo o por encima en 3.9444 puntos.








Fuentes:
·         http://es.wikipedia.org/wiki/Esperanza_matem%C3%A1tica
·         http://www.spssfree.com/spss/analisis2.html
·         http://pendientedemigracion.ucm.es/info/genetica/Estadistica/estadistica_basica.htm
·         http://es.slideshare.net/ELISANTS/estadistica-inferencial-7946382
·         http://www.monografias.com/trabajos81/distribuciones-de-probabilidad-discreta/distribuciones-de-probabilidad-discreta2.shtml#ixzz3JHJfpjYd

domingo, 12 de octubre de 2014

Cáncer gástrico en la población estadounidense para el 2013.

Es un tipo de crecimiento celular maligno producido, con capacidad de invasión y destrucción de otros tejidos y órganos. Siendo el más común de los tipos de cáncer gástrico, el Adenocarcinoma.
La mayoría de las veces el cáncer de estómago se origina en el revestimiento interno del estómago (la mucosa), y se desarrolla lentamente hacia las otras capas.
Este cáncer suele crecer lentamente en un periodo de muchos años. Antes de que se forme un verdadero cáncer, generalmente ocurren cambios en la mucosa. Estos cambios tempranos casi nunca causan síntomas y, por lo tanto, suceden sin que la persona lo sepa.



El cáncer de estómago se puede propagar de varias maneras. Puede crecer a través de la pared del estómago e invadir los órganos cercanos. También puede propagarse hacia los ganglios linfáticos cercanos, propagándose así a través del sistema linfático. Cuando el cáncer de estómago se torna más avanzado, puede viajar a través del torrente sanguíneo hasta otros órganos como el hígado, los pulmones y los huesos. Si el cáncer se ha propagado, el pronóstico del paciente no es tan favorable.
El cáncer de estómago afecta principalmente a las personas mayores, dos tercios de los pacientes con este tipo de cáncer es mayor de 65 años. El riesgo de padecer cáncer de estómago aumenta si:
  • Tiene una infección por Helicobacter pylori
  • Ha tenido inflamación del estómago
  • Es del sexo masculino
  • Come abundantes alimentos salados, ahumados o encurtidos
  • Fuma cigarrillos
  • Tiene antecedentes familiares de cáncer de estómago
  • Tipo de Sangre A.
Es difícil diagnosticar el cáncer de estómago en sus primeras etapas. La indigestión y la molestia estomacal pueden ser síntomas de una etapa temprana del cáncer, pero otros problemas también pueden causar los mismos síntomas. En los casos avanzados, puede haber sangre en las heces, vómitos, pérdida de peso inexplicable, ictericia o dificultades para tragar.
Por ese motivo, con frecuencia se diagnostica tarde y puede ser difícil de tratar. Las opciones de tratamiento incluyen cirugía, quimioterapia, radiación o una combinación de éstas.


Para el año 2013, los cálculos de la Sociedad Americana Contra El Cáncer para este cáncer en los Estados Unidos:
§  Se diagnosticaron aproximadamente 22.220 casos de cáncer de estómago (13.730 hombres y 8.490 mujeres).

Suponiendo que 100.000 personas mayores de 65 años es el total de nuestra población y 3000 son diagnosticadas con cáncer gástrico: 

Probabilidad:      número de veces que ocurra el hecho     
                     Número de veces que puede ocurrir el hecho
                 
Probabilidad:               3000 personas diagnosticadas             =  0.03
                     100000 personas mayores de 65 años de edad

Resultado: Es probable que el 3% de la población estadounidense mayor de 65 años padezca de cáncer de estómago.


Sin embargo, la probabilidad es otra si trabajamos a partir de datos reales.

·         Distribución por edad de la población estadounidense: 

Edad
Porcentaje
Hombres
Mujeres
0-14 años
20.1%
32.107.900
30.781.823
15-64 años
66.8%
104.411.352
104.808.064
65 años y más
13.1%
17.745.363
23.377.542

Total de la población

100%
154.264.615
158.967.429
313.232.044


Ø  Probabilidad para personas de 65 años y más:

o   2/3 de las personas diagnosticadas tienen o son mayores de 65 años: 
22.220/3 = 7.406,67
7.406,67 x 2 = 14.813,34

Entonces:   14.813,34 personas mayores de 65 años diagnosticadas   = 0.00036
41.122.905bitantes mayores de 65 años

Ø  Probabilidad para hombres de todas las edades con respecto a la población total:
Hombres diagnosticados: 13.730

Entonces:   13.730 hombres con cáncer de estómago     = 0.000044
                          313.232.044 estadounidénses

Ø  Probabilidad para mujeres de todas las edades:
Mujeres diagnosticadas: 8.490

Entonces:    8.490 mujeres con cáncer de estómago     = 0.000027
                          313.232.044 estadounidénses

Resultados:

·         Es probable que el 0.036% de la población mayor de 65 años en Estados Unidos padezca de cáncer gástrico.
·         La probabilidad de padecer cáncer de estómago es mayor en hombres que en mujeres:
44x10-4% de la población masculina tiene la probabilidad de padecer cáncer de estómago.
27x10-4% de la población femenina tiene la probabilidad de padecer cáncer de estómago.


Datos extraídos de la "American Cancer Society" y la "CIA World Factbook "