martes, 9 de julio de 2013

DISTRIBUCIONES DISCRETAS DE PROBABILIDAD

  • VARIABLE DISCRETA:
  • DISTRIBUCIÓN BINOMIAL
  • DISTRIBUCIÓN HIPERGEOMÉTRICA
  • DISTRIBUCIÓN DE POISSON

VARIABLE ALEATORIA=  Es una variable que toma un valor numérico para cada resultado del espacio muestral de un experimento probabilístico.
En otras palabras, es una variable cuyo valor se encuentra determinado por el azar para cada resultado de un experimento. Y pueden ser tanto cuantitativos como cualitativos.
Ejemplos: Número de muestras que serán recibidas en un laboratorio de análisis de suelo. Alumnos que aprobarán el cuatrimestre.

Las variables aleatorias se dividen en dos grupos:
1.       Discretas= Una variable que sólo puede tomar valores enteros de algún experimento de interés o claramente separados y definidos sus valores numéricos. Discretas: aquellas que resultan de contar el número de casos en los que el evento de interés ocurre, por ejemplo: numero de hijos de una familia, número de veces que llega una paciente al servicio de emergencia, etc.
2.       Continuas= Tienen un número infinito e valores y éstos pueden asociarse a mediciones en escala continua de tal manera que no hay huecos ni interrupciones. Aquellas que resultan producto de una medición, por ejemplo: el peso, el nivel de hemoglobina, etc.
Si conocemos todos los valores que puede tomar una variable aleatoria, junto con sus correspondientes probabilidades, tenemos una distribución de probabilidad:

Distribución de probabilidad: Una distribución de probabilidad indica todos los resultados probables de un experimento, así como la probabilidad de ocurrencia de estos resultados.

Ejemplo:
                                Número de muestras de suelo procesadas en un laboratorio:
No. muestras
No. De días con la cantidad
Probabilidad que la variable aleatoria tendrá para cada valor
100
2
0.01
101
4
0.02
102
6
0.03
103
10
0.05
104
12
0.06
105
14
0.07
106
18
0.09
107
20
0.10
108
24
0.12
109
22
0.11
110
18
0.09
111
16
0.08
112
12
0.06
113
10
0.05
114
8
0.04
115
4
0.02
TOTAL
200
1.00


0.14

































0.12

































0.10

































0.08

































0.06

































0.04

































0.02

































0
100

102

104

106

108

110

112

114



La descripción completa de una variable aleatoria discreta requiere que se especifiquen todos los valores posibles que la variable puede tomar, así como la probabilidad asociada con cada uno de esos valores. Identifiquemos a una variable aleatoria discreta como x y a xi1 i=1,2,…k; donde k representa todos los valores distintos que x puede tomar. Por ejemplo; los resultados de lanzar un dado, pueden ser solamente seis y si se considera a x el número observado, se tendría la siguiente distribución probabilística


X
P(x)
1
1/6
2
1/6
3
1/6
4
1/6
5
1/6
6
1/6

Cualquier distribución probabilística de una variable aleatoria discreta debe de cumplir con dos requisitos:
P(x) ≥ 0 para todos los valores de x
å P (x) = 1 donde å P (x) es para todos los posibles valores de x




DISTRIBUCIÓN BINOMIAL

El matemático suizo Jacobo Bernoulli (1654-1705) fue el impulsor de este conocimiento, conocido como binomial después de realizar un experimento conocido como el proceso Bernoulli. Esta teoría se basa en que una gran cantidad de experimentos resultan en únicamente dos posibles resultados, falso o verdadero, éxito o fracaso, afirmativas o negativas, defectuosos o satisfactorios, aprobados o no, la velocidad de un automóvil puede ser dentro del límite permitido o no.

En la distribución binomial, se deben de satisfacer los siguientes supuestos:
a)       Existen n observaciones o ensayos idénticos.
b)       Cada ensayo tiene dos posibles resultados, uno denominado “éxito” y el otro “fracaso”.
c)       Las probabilidades de éxito P y de fracaso (1 - P), se mantienen constantes para todos los ensayos.
d)       Los resultados de los ensayos son independientes entre si.

Para construir una distribución de probabilidad binomial específica, se debe conocer 1) el número de ensayos y 2) la probabilidad de éxito de cada ensayo.

La distribución binomial se calcula mediante la siguiente fórmula:

                                                                            P (x) = n C x P x (1 - P) n - x                 

Donde:                  *C = Denota una combinación
                               n = Es el número de ensayos
                               x = Es el número de éxitos
                               P = La probabilidad de éxito de cada ensayo.
*C= Combinaciones: se calcula utilizando la siguiente fórmula:
             n !
                                                        x!(n-x)!

Ejemplos:
Cada día Mexicana de Aviación, tiene cinco vuelos desde el D. F. a Monterrey. Suponga que la probabilidad de que alguno de los vuelos se retrase es de 0.200

a)       ¿Cuál es la probabilidad de que ninguno de los vuelos se retrase el día de hoy?
b)       ¿Cuál es la probabilidad de que exactamente uno de los vuelos se retrase este día?
c)       ¿Cuál es la probabilidad de que exactamente dos de los vuelos se retrasen este día?
d)       ¿Cuál es la probabilidad de que exactamente tres de los vuelos se retrasen este día?

P= 0.20
n= 5 (cinco vuelos)
x= número de éxitos (para este caso sería 0, 1, 2, 3)
a)       X=0
P (x) = n C x P x (1 - P) n – x             P(0)= 5 C 0 (0.20)0 (1 – 0.20)5 – 0
                                                       P(0)= (1) (1) (0.8) 5 – 0   = P(0)= (1) (1) (0.32768)  = 0.3277

b)       X= 1
P (x) = n C x P x (1 - P) n – x             P(1)= 5 C 1 (0.20)1 (1 – 0.20)5 – 1
                                                                                  P(1)= (5) (0.20) (0.8)4 = (5) (0.20) (0.4096) = 0.4096

c)       X=2
P (x) = n C x P x (1 - P) n – x             P(2)= 5 C 2 (0.20)2 (1 – 0.20)5 – 2
                                                       P(2)= (10) (0.04) (0.8)3 = (10) (0.04) (0.512)   = 0.2048

d)       X= 3
P (x) = n C x P x (1 - P) n – x             P(3)= 5 C 3 (0.20)3 (1 – 0.20)5 – 3
                                                       P(3)= (10) (0.008) (0.8)2  =  (15) (0.008) (0.64)  =0.0512


MEDIDAS DE DISPERSIÓN Y TENDENCIA CENTRAL DE UNA DISTRIBUCIÓN BINOMIAL

La media de una distribución binomial es el promedio a largo plazo, o el valor esperado de una variable aleatoria binomial. La desviación estándar de una distribución binomial indica el grado en que los valores muestrales tenderán a variar a partir de la media de la distribución.

La media de una distribución binomial  se calcula mediante la fórmula  X= n p

La desviación estándar se calcula mediante la fórmula  S=   n p (1 - p)

La varianza se calcula mediante la fórmula     S2 = n p (1 - p)




DISTRIBUCIÓN  HIPERGEOMÉTRICA

Se emplea para calcular la probabilidad de obtener determinado número de éxitos en un espacio muestral de n ensayos; pero a diferencia de la distribución binomial es que los datos de la muestra se extraen sin reemplazo en una población finita. Por esto es que el resultado de una observación depende o es afectado por el resultado de cualquier otra u otras observaciones anteriores.
Es decir la distribución hipergeométrica se emplea para muestreos sin reemplazo de una población finita cuya probabilidad de ocurrencia cambia a lo largo del ensayo.

Las condiciones que se deben de cumplir para aplicar una distribución hipergeométrica son:
1.       Que el tamaño de la población sea pequeño.
2.       Que la selección de la muestra de una población finita sea sin reemplazo.
3.       Que el tamaño de la muestra n sea mayor 5% de la población N.
La fórmula que se utiliza en la distribución hipergeométrica es:

P(x)= (SCX) (N –S C n-x )
       N C n
Donde:
N= El tamaño de la población.
S= El número de éxito en la población.
x= El número de éxitos que son de interés (en la muestra). Puede ser 0, 1, 2, 3, …..
n= El tamaño de la muestra o el número de ensayos.

Ejemplo:
Durante una semana se fabricaron 50 estaciones de videojuegos; 40 de ellas funcionaron perfectamente y 10 tuvieron al menos un desperfecto. Se seleccionó al azar una muestra de 5 sin reemplazo. ¿Cuál es la probabilidad de que 4 de los 5 videojuegos funcionará perfectamente?

N= 50, el número de estaciones de juego fabricadas.
n= 5, el tamaño de la muestra.
S= 40, el número de estaciones de juego en la población que funciona bien.
X= 4, el número de aparatos en la muestra que queremos que funcione bien.

P(x)= (SCX) (N –S C n-x )      P(4)= (40 C 4) (50 - 40 C 5 – 4)   =  P(4)= (40 C 4) (10 C 1)   = (91390) (10)  = 0.431
                         N C n                                        50 C 5                                                 50 C 5                         2118760

La probabilidad de seleccionar cinco estaciones de juego y encontrar que cuatro funcionan perfectamente es de  0.431.

La probabilidad hipergeométrica y binomial para este ejemplo es:

Estaciones que funcionan bien
Probabilidad hipergeométrica P(x)
Probabilidad binomial n=5, p=0.80
0
0.000
0.000
1
0.004
0.006
2
0.044
0.051
3
0.210
0.205
4
0.431
0.410
5
0.311
0.328

Una de las mejores aplicaciones de la distribución hipergeométrica es el control estadístico de calidad y la aceptación del muestreo. Por lo que si N es el número de unidades en un lote, de las cuales k se encuentran defectuosas. Si se selecciona una muestra aleatoria del lote formada por n<N unidades, la probabilidad de que la muestra contenga x unidades defectuosas se determina mediante el empleo de la función hipergeométrica de probabilidad. En aceptación del muestreo, la razón de que sólo se seleccione la muestra de un lote obedece más bien a restricciones de tiempo y dinero. La decisión de cuando aceptar o rechazar un lote se basa, de manera general, en el número de artículos defectuosos encontrados en él.


DISTRIBUCIÓN  HIPERGEOMÉTRICA GENERALIZADA


Características:

a)      Al realizar un experimento con este tipo de distribución, se esperan más de dos tipos de resultados.
b)      Las probabilidades asociadas a cada uno de estos resultados no son constantes.
c)      Los ensayos o repeticiones del experimento no son independientes entre sí.
d)     El número de repeticiones del experimento n, es constante.

Entonces en este caso se tienen más de dos tipos de objetos, por lo que la fórmula a utilizar sería:

P(x,y,n)=  aCx * bCy * N-a-bCn-x-y

                              NCn


donde:
N = x + y + z = total de objetos
a = total de objetos del primer tipo
b = total de objetos del segundo tipo
c = N-a-b = total de objetos del tercer tipo
n = objetos seleccionados en la muestra
x = objetos del primer tipo en la muestra
y = objetos del segundo tipo en la muestra
z = n-x-y = objetos del tercer tipo en la muestra

EJEMPLO:

En un lote de productos electrónicos, se tienen 20 televisiones sin defectos, 3 con defectos menores y 2 con defectos mayores, se seleccionan al azar 5 TV de este lote, determine la probabilidad de que a) 3 de las Tv seleccionados no tengan defectos y 1 tenga defectos menores, b) 4 de las Tv seleccionados no tengan defectos y 1 tenga defectos menores.
Solución:
a)
N= 20+3+2 =25 total de artículos
a=20 productos sin defectos
b= 3 productos con defectos menores
N-a-b= 2 productos con defectos mayores
n= 5 productos seleccionados en la muestra
x = 3 productos sin defectos en la muestra = variable que nos define el # de productos sin defectos en la muestra
y = 1 producto con defectos menores en la muestra = variable que nos define el # de productos con defectos menores en la muestra
z = n-x-y = 5-3-1 = 1 producto con defectos mayores en la muestra = variable que nos define el # de productos con defectos mayores en la muestra

P(x=3,y=1,n=5)=  20C3 * 3C1 * 2C1

                                                  25C5

P(x=3,y=1,n=5)=  (1140) (3) (2) = 6840    = 0.128741
                                     53130          53130


INDICACIONES: Para este ejercicio calcula el inciso b, y soluciona el siguiente problema.

Un club de estudiantes extranjeros tiene en sus listas a 2 canadienses, 3 japoneses, 5 italianos y 2 alemanes. Si se selecciona aleatoriamente un comité de 4 estudiantes, encuentre la probabilidad de que: a) estén representadas todas las nacionalidades, b) estén representadas todas las nacionalidades, excepto la italiana.
DISTRIBUCIÓN  DE  POISSON

Esta distribución probabilística es llamada así en honor al científico francés Simón Poisson (1781-1849), se aplica a muchos fenómenos discretos y también lo podemos considerar como una alternativa al uso de la distribución binomial, es decir en situaciones en donde n es muy grande y p es muy pequeño, frecuentemente también se le conoce como la ley de los eventos improbables, lo que significa que la probabilidad de que p ocurra es muy pequeña.

Este tipo de distribución, tiene un solo parámetro que la describe identificado por la letra griega lambda (l), por lo que la media y la varianza de un modelo de Poisson son iguales y se calculan mediante la siguiente  fórmula:

µ= E(x)= np

s=   Var (x)      =  np

La fórmula que se utiliza para el cálculo de probabilidades en distribución de poisson es:

P(x)= l x e -l
             x!
Donde:
l= Promedio de ocurrencias (éxitos) durante un intervalo específico de tiempo, también se puede calcular np
e= Es la constante 2.71828 (base del sistema de logaritmos naturales)
x= Es el número de ocurrencias

Las tres características más importantes de la distribución de Poisson  son:

1.       El experimento consiste en contar el número de ocasiones que un determinado evento sucede en un periodo dado de tiempo, en una determinada superficie o en un cierto volumen.
2.       La probabilidad de que ese evento ocurra en ese periodo de tiempo, superficie o volumen es la misma.
3.       El número de eventos que ocurran en una unidad son independientes del número de eventos de otras unidades.

Ejemplo:
En un crucero de la ciudad de Villahermosa, las autoridades de tránsito han reportado que suceden en promedio 4 accidentes al mes, y la distribución de este fenómeno está bajo un modelo de Poisson. Las autoridades han declarado que mejorarán los señalamientos en el crucero si se conociera que la probabilidad de que más de tres accidentes por mes, fuera mayor de 0.50 de acuerdo con esta información, ¿deberán las autoridades mejorar los señalamientos en dicho crucero?
Primero se requiere conocer la probabilidad de que sucedan 0, 1, 2,  y 3 accidentes por mes.

P(x)= l x e -l             P(0)= (4)0(2.71828)-4         =(1) (0.01832)     =0.01832
             x!                                0!                              1
P(1)= (4)1(2.71828)-4         =(4) (0.01832)                     =0.07328
                   1!                           1
P(2)= (4)2(2.71828)-4         =(16) (0.01832)                   =0.14656
                  2!                             2

P(3)= (4)3(2.71828)-4         =(64) (0.01832)                   =0.195413
                3!                                6
Para contestar la pregunta se requiere conocer la suma de todas las probabilidades de ocurrencia de P(x=0), P(x=1), P(x=2), P(x=3), la cual  es de 0.43357, éste valor lo restamos de uno, y dará como resultado la probabilidad que se está tratando contestar, que es de 0.56643, por lo que respondiendo a la interrogante de las autoridades, se debe  de mejorar los señalamientos ya que la probabilidad de que sucedan más de tres accidentes por mes es de 0.56

La distribución probabilística de Poisson para este ejemplo es como se muestra.

Número de accidentes (x)
Probabilidad exacta de x
0
0.01832
1
0.07328
2
0.14656
3
0.19541
4
0.19541
5
0.15630
6
0.10420
7
0.05955
8
0.02970
9
0.01323
Total de 0 a 9
0.99196
Probabilidad de más de 10
0.00804









Coeficiente Binomial: Representa el número de veces que un suceso x puede ocurrir en un grupo de experimentos.
Distribución Binomial: es una distribución aleatoria discreta que describe la distribución probabilística de un experimento conocido como proceso Bernoulli.
Distribución de Poisson: Es una distribución aleatoria discreta que describe la probabilidad de ocurrencia de un evento en un periodo de tiempo.
Función Probabilística: Fórmula que establece las reglas para expresar la probabilidad de un evento.
Valor esperado: Es la esperanza estadística, que representa la media de una variable aleatoria discreta.