Correlación y causalidad

5 febrero 2009

Mirad que gráfica más bonita

piratesvstemp

Como veis los datos están tomados a lo largo de varios años.

Dado que el eje X va decreciendo es evidente una correlación negativa entre las dos variables y, a los que tengan cálculos de regresión a sus espaldas, les parecerá intuir una relación funcional.

Uy, perdón… siempre me olvido de que no todos habláis ruso…

Bueno en el eje X tenemos el número aproximado de piratas (de los de pata de palo y parche, no de los informáticos), y en el eje Y tenemos la temperatura media global del planeta.

Pues nada, esa es la conclusión, el descenso del número de piratas produce el calentamiento global

Supongo que diréis que algo tiene que estar mal… claro, las cabezas, pero eso es otra cosa.

Matemáticamente las cuentas salen.

Pero el problema no son las matemáticas, el problema está en la “puerta de entrada” y la de “salida” a las matemáticas.

La puerta de entrada son los modelos que elegimos para representar la realidad, las variables que tomamos o descartamos, las que mezclamos con otras, etc.

La puerta de salida es la interpretación física que hacemos de los resultados obtenidos.

Por ejemplo, que dos variables estén correlacionadas puede deberse a que una sea la causa de la otra, efectivamente, pero también a que sea la otra la causa de la primera (o cada una causa de la otra, incluso), o bien a que haya terceros factores que generen las dos, o simplemente, a una coincidencia.

Para esta falacia lógica hay un término en latín específico “Cum hoc ergo propter hoc”. Se lee “jandemar enar enagüer” o algo así, perdón por mi latín (lo mío es el ruso). Pero quiere decir: “juntamente con esto, luego a consecuencia de esto”. Más traducido aún: Si aparecen juntos es que son causa y efecto.

Ya veis que es mentira cochina y podrida.

Una correlación estadística es un indicio de una posible relación causal, al que hay que investigar con cuidadín para confirmarla o rechazarla.

En este caso es evidente, pero otros pueden inducir a graves errores. Imagina por ejemplo que correlacionamos una buena capacidad auditiva con el uso de reproductores portátiles de mp3. Hay una causa común subyacente: los usuarios de esos dispositivos son mayoritariamente jóvenes y eso hace que su oído sea mejor que la media. De hecho la realidad va más bien en sentido contrario, el abuso de estos aparatejos (volumen alto, uso frecuente) precisamente lo que genera son problemas auditivos.

Resumiendo.

Los modelos que usamos para entender la realidad no son la realidad misma. Tienes que tener claras las circunstancias en que son aplicables, revisarlos y corregirlos si hace falta y tener cuidado con las conclusiones que de ellos derives.

Bueno, ahí os dejo, solicitando el préstamo para el barco y afilando vuestras espadas para luchar contra el cambio climático… ¡piratillas!

Fuente original del gráfico

Otro artículo de la misma gente con otra gráfica en la misma línea

Fuente del gráfico en ruso

“Cum hoc ergo propter hoc” en wikipedia


Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

Únete a otros 137 seguidores