2.1 Hagamos predicciones.

Pues ya que tenemos todo lo  necesario. Vamos a aplicar todo lo que hemos aprendido en este tema a situaciones reales.

La utilidad de la recta de regresión es que nos permite predecir valores que se van a dar en una variable cuando le damos un valor que no conocemos a la otra. Además, con el coeficiente de correlación, podemos saber si la predicción que estamos haciendo es buena o no, si es fiable o no lo es.

Vamos  resolver un par de ejemplos concretos y seguro que lo vas a entender. En uno analizamos la evolución de la tasa de donación de sangre en Andalucía y en otro la interacción entre el número de zorros y conejos en un determinado ecosistema.

Icono de iDevice Ejemplo o ejercicio resuelto

 

Camiseta roja con el dibujo de dos chicos y el lema "dona sangre"
13. Imagen de Vicentico/Sento bajo licencia Creative Commons.

 

En uno de los informes sobre estadísticas hospitalarias, Mercedes observa la evolución de las donaciones de sangre en Andalucía. Parece evidente que la concienciación social y la solidaridad de la población sobre este asunto es cada vez mayor.

 

Con el objeto de analizar de manera rigurosa la evolución de las donaciones de sangre y de hacer una estimación de lo que ocurrirá en años venideros, se ha recogido en la siguiente tabla la Tasa de donaciones de sangre (n.º de donaciones por cada 1000 habitantes) en Andalucía desde el año 94 hasta 2008:

 

Año
1994
1995 1996
1997
1998 1999
2000 2001
2002 2003
2004
2005 2006
2007
2008

Tasa de donaciones

31,70 32,40 33,10 33,10 32,50 34,66 34,62 35,00 35,30 34,94 35,18
33,62 33,30 32,88

34,08

¿Qué tasa de donaciones se prevé que haya en el año 2009? ¿Y en 2010? ¿Cómo son de fiables estas predicciones?


Conejo en el campo
14. Imagen de rjime31 bajo licencia Creative Commons.

En este segundo ejemplo, se está haciendo un estudio de control de población de conejos y zorros en una zona de bosque. Se cree que el número de ambas especies está íntimamente relacionado.

Durante los últimos 8 años se ha hecho un censo de ambos animales, obteniéndose las cifras que se muestran a continuación:

 

N.º zorros
20 30 15 20 26 30 15 14
N.º conejos
320 500 270 310 400 450
200
250

 

¿Cuántos zorros deberá haber si en el último año se han contado 350 conejos? Y si un año llegaran a contarse 1000 conejos, cuántos zorros debería haber para que el ecosistema fuera sostenible? ¿Son fiables las predicciones?


Icono de iDevice AV - Actividad de Espacios en Blanco

Ahora te toca a ti. Vas a hacer un ejercicio en el que al final tienes que hace un pronóstico sobre aguas y cultivos.

Ve rellenando los distintos huecos. Si aparecen decimales, usa la coma para separar y redondea todos los resultados con 3 decimales, aunque si te equivocas en algún decimal tampoco ocurre nada.

El historial hidrológico de Olvera en los últimos 8 años y la producción de aceitunas que han dado los olivos del campo de Curro vienen dados por la siguiente tabla:
Año 2002
2003 2004 2005 2006 2007 2008 2009
L/m2 702 680 650 710 640 600 604 673
Producción ( miles kg) 215 220 184 221 168 136 162 197


Aunque en la cooperativa le informan a Curro de nuevos abonos que mejoran el rendimiento y de los distintos tipos de insecticidas que ha usado, Curro cree que el único factor determinante de la producción de sus olivos es el agua que cae en el año. ¿Tiene razón Curro y es verdad que la cantidad de agua es tan decisiva?
¿Qué cantidad de agua tendría que llover para que la producción fuera al menos de 250.000 kg de aceitunas?

Le llamamos X al agua caída e Y a la producción obtenida.

Media de X = Desviación típica de X =

Media de Y = Desviación típica de Y =

Covarianza = Coeficiente de correlación r =

Según ese valor de r, influye de manera decisiva la cantidad de agua caída, ¿sí o no?

Calculamos la recta de regresión X sobre y, pues me pide un valor de X, conocido uno de Y, y sustituimos la y por 250.

recta de regresión: X = y +

Estimación: Para obtener 250.000 kg de cosecha, deberán caer l/m2

 

 

  

Icono IDevice Curiosidad

En un vídeo anterior, vimos cómo se calculaba el coeficiente de correlación con la hoja de cálculo EXCEL.

En este vídeo, te presentamos cómo puede hacerse el cálculo de la recta de regresión, la estimación de un valor y el cálculo del coeficiente de correlación con la hoja de cálculo CALC de la suite de ofimática OpenOffice, suite de libre distribución y totalmente gratuita. Esta hoja de cálculo es muy similar a la EXCEL que vimos antes.

 

 

 


Icono IDevice Para saber más

Hemos estado hablando siempre de correlación lineal, de ajustar la nube de puntos a una recta. Pero como comprenderás, hay numerosas situaciones en las que las gráficas de otras funciones se ajustan mejor a la distribución de nuestros puntos.

Así, no sólo existe correlación lineal, sino que también existe correlación parabólica, correlación exponencial, correlación logarítmica, etc. En todos los casos la idea es la misma, buscar la función que mejor se ajusta a nuestra nube de puntos.

En el siguiente vídeo se analiza la influencia de los gastos en publicidad (X) y las ventas obtenidas (Y) en los distintos establecimientos de Telepizza. Además de repasar diversos conceptos importantes, al final vemos que para este caso, la correlación parabólica es mejor que la lineal.