3.1. Un ejemplo muy práctico

No hace mucho, a las oficinas de TisBet Survey llegó la Concejalía de Urbanismo del Ayuntamiento de Sevilla para que les hiciera un estudio sobre la satisfacción de los ciudadanos con el servicio de transporte público. No sé si lo sabes, pero hace escasamente dos años (abril de 2009)

Vagón de metro llegando a la estación
Imagen de dezpiadoz bajo licencia Creative Commons

se inauguró la primera línea de Metro, y una de las peticiones a TisBet es que analicen el nivel de uso y satisfacción que tienen los ciudadanos y ciudadanas de este nuevo medio de transporte.

La primera pregunta del estudio es clara, ¿Ha utilizado usted el Metro alguna vez? Y la respuesta es evidente, sí o no. Sólo dos posibilidades.

¿Te suena esto de dos posibilidades? Dos posibilidades..., éxito-fracaso... Exacto: Bernoulli y la binomial.

Fíjate bien. Hacemos 100 encuestas y para cada una de ellas, definimos una variable Xi (i=1, 2,... 100) a la que le damos el valor 1 si la respuesta es afirmativa y 0 en caso contrario. Además, llegamos a la conclusión de que la probabilidad de que una persona haya utilizado el Metro es de 0,31, luego la probabilidad de éxito es 0,31.

La suma de todas las puntuaciones de las variables nos da el número de respuestas afirmativas, o lo que es lo mismo, el número de éxitos obtenidos en las 100 repeticiones. Y esto si lo recuerdas, nos daba pie a una distribución binomial, en concreto, a la distribución binomial B(100; 0,31). Por tanto, si definimos una variable aleatoria S que sea la suma de los puntos de las 100 encuestas, obtenemos que:

S=ΣXi ~ B(100; 0,31)

Todo esto de la binomial lo repasamos en el tema 3 de la unidad anterior, y como recordarás, calcular probabilidades era fácil pero un poco pesado. Imagínate que queremos calculara la probabilidad de que más de 60 personas hayan cogido el Metro. Tendríamos que calcular P(S=61), P(S=62), P(S=63),... y así hasta P(S=100). Una auténtica pesadez.

¡Vamos a utilizar el Teorema Central del Límite!

Como siempre, primero hemos de ver que se cumplen las condiciones:

  • Las variables Xi i=1,... 100 son independientes, pues la muestra la hacemos de forma que la respuesta de uno no influye en la de otro.
  • Las variables Xi i=1,... 100 están idénticamente distribuidas, pues todas son variables de Bernoulli con probabilidad de éxito 0,31.
  • El tamaño es suficiente, pues hay 100 variables y tiene que haber más de 30.

Luego las hipótesis se cumplen.

Por otro lado, cada variable Xi hemos dicho que es una Bernoulli de parámetro 0,31. Por tanto, la media es y la desviación típica

Por tanto aplicando el Teorema Central del Límite, obtenemos que:

 

 

Y aquí sí que es fácil calcular, por ejemplo, la probabilidad de que más de 60 personas usen el Metro. Bastaría con calcular P(S > 60).

Fíjate que entonces, siempre que el número de datos sea suficiente, una Binomial se puede aproximar por una Normal, cuyos parámetros serán los que se obtienen al aplicar el Teorema Central del Límite, esto es, n·p y .

Si todavía no te lo crees, observa la siguiente escena. Ve aumentando el número de pruebas y verás que la forma de la distribución cada vez se parece más a la gráfica de una Normal:

 

Applet descartes de Ricardo Gutiérrez Ibáñez bajo licencia Creative Commons.


Aunque si te fijas bien, hay una pequeña pega. Si el valor de la probabilidad de éxito (control "probabilidad") lo haces muy pequeño o muy grande, ya no se parece tanto a la gráfica de la normal cuando aumentamos n (tiene que ser n mucho más grande para que se parezca). Así que además tenemos que poner una restricción para la probabilidad. El que no sea ni muy grande ni muy chico el valor de "p" lo vemos comprobando que n·p y n·(1-p) es mayor o igual que 5.
Icono IDevice Importante

Si X es una variable aleatoria discreta que tiene una distribución de probabilidad Binomial de parámetros n y p (X~B(n,p)), podemos aproximarla a una distribución de probabilidad Normal siempre que:

  1. n≥30
  2. n·p≥5
  3. n·(1-p)≥5

Además la distribución normal a la que se aproxima es:

 


A este resultado se le conoce como Teorema de De-Moivre

 


Icono de iDevice Ejemplo o ejercicio resuelto
Varios dados en el aire 
Imagen de Charly Morlock bajo licencia Creative Commons.

Lanzamos un dado 50 veces. ¿Cuál es la probabilidad de que más de 10 veces salga un 1?

En este vídeo tienes la respuesta:

 

 

En el vídeo no se calcula directamente la probabilidad de X mayor que 10, sino que amplía un poquito el recinto para que el 10 quede dentro de él. Esto se hace para corregir el error que se produce al hacer la aproximación ya que en la normal, al ser variable continua la probabilidad del valor 10 sería cero, pero en la binomial no, al ser discreta. Así que, en las aproximaciones de binomial a normal, debes tener en cuenta esto, que hay que ampliar un poquito el recinto.


Icono IDevice Para saber más
Aquí tienes otro vídeo en el que se resuelve una cuestión mediante la aproximación de una binomial a una normal. Es un poco largo pero está explicado con todo lujo de detalles y seguro que si lo ves lo vas a entender todo a la perfección:

 

 


Icono de IDevice de pregunta AV - Pregunta de Elección Múltiple

En una comarca, el 25% de las viviendas tienen conexión a Internet de banda ancha. Elegimos al azar 80 viviendas y definimos la variable aleatoria X = Número de viviendas con conexión a Internet.

 

Conjunto de viviendas
 Imagen de infoventas.vistahermosa bajo licencia Creative Commons.

1) La variable aleatoria X es discreta y tiene una distribución de probabilidad.

  
B(80 ; 0,25)
B(80; 0,75)
No es una distribución binomial

2) Esa variable se puede aproximar a una normal.
  
No es posible.
Sí porque n ≥ 30.
Sí porque n ≥ 30, n·p≥ 5 y n·q≥ 5

3) La distribución Normal a la que se aproxima es:
  
N(20 ; 15)
N(80; 15)
N(20 ; 3,873)
N(15 ; 20)

4) La probabilidad de que al menos 12 casas tengan conexión a Internet es:
       
0,9857
0,0143
0,9808
0,0192