Esta entrada está basada en los vídeos de Khan Academy referentes a la distribución de Poisson.
Vamos a modelar una distribución que nos de la probabilidad del número de coches que pasan en una hora (intervalo de tiempo). También podríamos intentar modelar el número de llamadas que llega a una centralita en el intervalo de media hora o el número de paquetes que llegan a un router en el intervalo de un segundo.
Entonces, sea la variable aleatoria X=número de coches que pasan en una hora
.
Antes de nada, tenemos que hacer dos presunciones:
- Ninguna hora es diferente de cualquier otra (p.e. no consideramos que las horas nocturnas sean diferentes de la diurnas o fines de semana).
- No hay manera de que el número de coches que pasen en una hora afecte al número de coches que pasa en otra hora (los intervalos son independientes).
Lo que vamos a hacer es intentar modelar esa probabilidad usando la distribución binomial, usando un pequeño truco y llevando al límite uno de sus parámetros.
Recordemos que la función de probabilidad de una distribución binomial es:
Donde
Ejemplo1: La probabilidad de que un alumno suspenda es del 30%. Escogemos 20 alumnos al azar, ¿Cuál es la probabilidad de que haya exactamente 4 alumnos suspendidos?.
Es una distribución binomial porque sólo tenemos dos estados posibles: suspendido o aprobado. Sus parámetros son: probablidad de acierto 0.3 y número de experimentos 20;
p=0.3,n=20 , o seaBin(n,p)→Bin(20,0.3)
P(X=4)=(204)(0.3)4(0.7)16=0.13
El mejor estimador es la esperanza
por ejemplo
En una distribución binomial, la esperanza es
Pensemos un poco en ello: Supongamos que lanzo 10 tiros de baloncesto siendo la probabilidad de encestar (acierto) de cada uno de ellos del 40%. ¿Cuál es el número de canastas esperado?. Pues
Ya con esto dicho, en nuestro ejemplo de los coches podríamos intentar modelar la función de probabilidad como una
Y entonces decimos: Si en el minuto actual pasa un coche, lo doy como acierto y si no pasa lo doy como fallo. Es decir:
- El número de aciertos sería las veces que ha pasado un coche en el minuto considerado, y
- el número de fallos las veces que en el minuto considerado
2.1 o bien no ha pasado ninguno
2.2 o bien han pasado más de uno
Así, en una primera aproximación, siendo
Donde vemos que que el número de experimentos
Para llegar a la expresión, primero recordamos:
La definición de
Y el desarrollo:
que tiene
Por ejemplo:
Entonces:
Ahora pasamos el
En cuanto a
En cuanto a
Nos queda
por la definición
O sea que la función de probabilidad de Poisson es un límite cuyo valor equivale a
Ejemplo2: De media, pasan 9 coches en una hora. Suponiendo ciertas las presunciones 1 y 2: ¿Cuál es la probabilidad de que en una hora cualquiera pasen exactamente 2 coches?.
P(x=2)=922!e−9=0.05=5%
Ejemplo3: En un restaurante entran de media 2 clientes cada 3 minutos. Suponiendo ciertas las presunciones 1 y 2: ¿Cuál es la probabilidad de que entren cuatro o menos clientes en un periodo de nueve minutos?.
λ=6clientes9minutos
P(X="igual−o−menor−que−4")=P(X=0)+P(X=1)+P(X=2)+P(X=3)+P(X=4)=600!e−6+611!e−6+...=e−6(1+6+18+...)=0.28=28%
Otra forma habitual de expresar la fórmula es en función de
Según la wikipedia
La distribución de Poisson se aplica a varios fenómenos discretos de la naturaleza (esto es, aquellos fenómenos que ocurren 0, 1, 2, 3,… veces durante un periodo definido de tiempo o en un área determinada) cuando la probabilidad de ocurrencia del fenómeno es constante en el tiempo o el espacio. Ejemplos de estos eventos que pueden ser modelados por la distribución de Poisson incluyen:
- El número de autos que pasan a través de un cierto punto en una ruta (suficientemente distantes de los semáforos) durante un periodo definido de tiempo.
- El número de errores de ortografía que uno comete al escribir una única página.
- El número de llamadas telefónicas en una central telefónica por minuto.
- El número de servidores web accedidos por minuto.
- El número de animales muertos encontrados por unidad de longitud de ruta.
- El número de mutaciones de determinada cadena de ADN después de cierta cantidad de radiación.
- El número de núcleos atómicos inestables que se han desintegrado en un determinado período.
- El número de estrellas en un determinado volumen de espacio.
- La distribución de receptores visuales en la retina del ojo humano.
- La inventiva de un inventor a lo largo de su carrera.
La media y la varianza de la distribución son
Notemos que el número de experimentos
Comprobemos que es realmente una función de probabilidad.
La suma de toda las probabilidades es 1.
En la gráfica se observa la forma de campana de la función dados diferentes valores de
En la gráfica aparecen curvas por claridad pero evidentemente deberían aparecer puntos debido a que se trata de una distribución continua.
Este es un pequeño homenaje a Salman Khan. Os recomiendo una de sus charlas: (TED) Usemos el vídeo para reinventar la educación.
Fuentes: Varios y Khan Academy
Written with StackEdit.