¿Cómo mides cuando no te importa?

26 octubre 2020
Identificación antropométrica (Dibujo antiguo)

Fuente

Aunque yo soy Físico Fundamental (digamos tirando a teórico), mi carrera profesional como profesor ha sido enseñar Tecnología/Informática en Secundaria, así que he aprendido a amar a los ingenieros 😉

Serán imprecisos, usarán tablas y modelos que no saben ni de donde salen, de acuerdo, pero se suben encima y se ponen debajo de lo que construyen. Y eso es tener compromiso con lo que se hace. Respect.

Un día dije esto en Twitter y alguien me contestó: «Coeficiente de seguridad».

Ya, ya. I know. Calculan el grosor de una columna… y lo multiplican por dos, por ejemplo, pero fijaos que CONTROLAN su grado de aproximación, y esto es fundamental. Os lo contaba en Aproxímate.

La medida es una parte fundamental de la Ciencia, o de cualquier otra actividad que descanse en lo empírico como criterio de certeza.

Medir la realidad es la manera en la que tomamos los datos con los que modelamos el mundo y volver a medir es la manera para cotejar los resultados de nuestros modelos. Así comprobamos si son adecuados o no.

Pero, ¿qué pasa cuando quien mide no tiene que pasar por ese «examen final»? ¿Qué pasa cuando el valor medido no tiene que «demostrar» que es una buena medida? ¿Qué pasa cuando te da igual el resultado de tu medida?

Pues pasa lo que vemos en las noticias a diario: Muchos números pero muy poca vergüenza.

Imagina que soy un productor de alimentos enlatados. Para la pregunta «¿Cuándo caduca esta lata?» quiero una respuesta REALISTA. Quiero saber la verdad, porque me IMPORTA, porque va a afectar seriamente a la fuente de dinero con la que pago mis facturas. Más allá de las decisiones que tome con este valor, quiero saber cuál es. Por ejemplo, podría poner una fecha muy adelantada para asegurarme de que nunca jamás se le estropeara a nadie una lata, o podría querer apretarme mucho a esa cifra para liquidar un stock (avisando al comprador). Sea como fuere, NECESITO SABER ese valor para poder «trabajar» con él. Me la juego.

Pero, ¿qué pasa cuando no me la juego? ¿Qué pasa cuando las decisiones que se toman con tus medidas se aplican a otras personas? ¿Evalúas igual una inversión en la que pones tu dinero que otra en la que involucras a un cliente, o a un peatón sin relación contigo? ¿Qué pasa cuando se toma una «medida» sobre el nivel educativo de los estudiantes, el IPC, la tasa de pobreza, el impacto sobre la esperanza de vida de una buena sanidad pública?

Empezaré diciendo que esas medidas «sociales» o «humanas» son de gran dificultad, pero se incrementa hasta el extremo cuando no te importa, y añadiré que hay mucha gente muy preocupada por hacerlo de la mejor manera posible, pero en las cúpulas donde se manda están… quienes están, y no suelen ser aquellos con las mejores competencias técnicas.

Quitamos unos profesores de apoyo en las escuelas, aumentamos el nivel permitido de un contaminante… ¿a quién le interesa medir el impacto real sobre la vida de la gente?

¿Quién se ocupa de cuidar de que el IPC o la tasa de pobreza reflejen eso que predica sus nombres? ¿Qué actos políticos se verían forzados a tomar a partir de un valor realista?

Como ya no somos tan jóvenes hemos visto subir los precios con la llegada del euro y que ese año BAJARA el IPC. O que una descomunal burbuja inmobiliaria tampoco hiciera que se dispararan los «precios», aunque el gasto en vivienda se coma un porcentaje muy amplio de los ingresos de las familias. Raro, ¿verdad?

Claro, es que el IPC, es un valor que sirve de «semilla» para calcular otras cosas. «Es que si sube mucho, tengo que subir las pensiones.» Ya, ya. Pero los pensionistas están pagando los precios REALES, por más que tú digas que no han subido y que ellos vean mermado su poder adquisitivo.

Pero vaya, te digo el IPC como te podría hablar del aislamiento térmico de un edificio, del aprobado en una asignatura, de la tasa de pobreza… de cualquier indicador que me obligue a tomar decisiones que no quiero.

Si estos valores no van a sufrir el contraste directo con la realidad y no inciden sobre quien me importe, puedo medir «mal» para que salga el valor que me permita decidir en la dirección que había elegido previamente. Han dejado de ser una medida para ser una herramienta de control, una mentira más.

Esto incrementa la desafección de la sociedad por la Estadística y las Ciencias Sociales, porque les han hecho creer que esos valores falsos, en evidente contraste con «lo real» a ojos del peatón, son la conclusión que arrojan esas disciplinas. «No hay peor mentira que la Estadística», JA.

Claro que puede uno medir seriamente, tratar los datos con respeto y extraer lo mejor de ellos, pero para eso hace falta dominio técnico y honestidad, y no andamos muy sobrados de ninguna de las dos en las altas esferas.

Decía un conocido economista, el mejor consejo sobre inversión es que tu gestor invierta SU dinero donde te aconseje invertir el tuyo. Quizá esa sea la manera, vincular el destino de los que deciden con el nuestro, sus intereses con los nuestros. No podemos dejar que la gestión de Lo Común siga siendo llevada a cabo por los que sólo buscan destruirlo, hacerlo trocitos y repartirlo entre sus amigos. Dañar el Bien común, no puede salir tan barato, y menos aún reportar beneficios.

Al igual que no culpamos a la lengua o al idioma de las mentiras que tejen con ellos, no culpemos a la Estadística o a las Ciencias Sociales de las mentiras que envuelven con ellas.

Anuncio publicitario

Manual de prácticas de Hojas de Cálculo y datos estadísticos

23 enero 2020

Aquí os dejo un manual de prácticas de hojas de cálculo (usaremos Google Sheets por la facilidad de trabajar online) pero aplicado a la obtención y tratamiento de «microdatos» tomados de fuentes públicas, de forma que quien lo use se sienta con el «poder» de comprobar por sí mismo esas afirmaciones en los medios, por ejemplo.

Gracias en gran parte a las aportaciones de Guillermo Peris y a la ayuda técnica de Gaby Jorquera.


De una estadística mal hecha puede deducirse… ¡NADA!

10 junio 2014

Es lamentable cómo nos tiran estadísticas a la cara en el mundo de la educación y es más lamentable ver cómo las han hecho con los gluteus máximus.

Errores más comunes.

1. Dar porcentajes del estilo 88,33% sobre una población que tiene 20 alumnos.

En una población de 20 alumnos, cada uno de ellos representa un 5%, por lo tanto, 88,33% no significa nada.

En todo caso habría que reducir ese número a un 88% o mejor, a un 90%.

Ahora imagina que un alumno se pone enfermo, o que a otro le ponen un profesor particular… pues verás como el porcentaje de aprobados o suspensos aumenta en un 5% sin que en realidad haya pasado nada relevante en el proceso educativo.

2. Decir que tu porcentaje de aprobados está «lejos» de la media

Mirad esta gráfica de la Wikipedia

Normal Distribution PDF

Representa distintas distribuciones de datos.

En la azul la media es cero y los datos están muy agrupados.

En la roja la media también es cero pero los datos ya no están tan agrupados.

En la marrón los datos están muy dispersos.

¿Cómo saber si x= -1 está muy «lejos» de la media?

Sólo con el valor de la media es imposible.

En la población marrón, el valor -1 es bastante próximo a la media, en cambio en la azul es estar bastante alejado de la media, en comparación con el resto de la población.

Así que tener una distancia de 10% en un valor de aprobados o suspensos puede significar mucho o poco dependiendo de cómo es la distribución de la población de estudiantes.

Eso si la distribución tiene esta forma, que llamamos «normal«, por ser bastante común en multitud de grupos de datos.

Pero, y si es una distribución multimodal, si en realidad hay varios grupos bastante diferentes formando nuestra población, de forma que en realidad la curva tiene varios máximos (editada de aquí sólo para ilustrar este asunto).

Si alguien en esta población tiene un -1, te puede parecer que está muy lejos de la media que andará por 1, pero en realidad se trata de un representante típico del primer «bulto», uno de los dos grupos claros y diferentes que integran la población global. Así que no es un tipo raro como podría parecer.

Pero claro, no creo que la población española (o mundial) sea muy desigual. No, qué va… No… Definitivamente, no. Bueno en fin… se me va a saltar la vena del cuello de tanta ironía.

3. Decir que compares con los resultados de años anteriores.

¿Con los resultados de años anteriores? Esto no es hacer sillas siempre con la misma madera y los mismos tornillos.

Cada año tenemos alumnos diferentes, DIFERENTES. Personas con sus peculiaridades.

También tenemos profesores diferentes…

Incluso podemos tener temarios diferentes…

Así que es chupi comparar dos resultados que dependen de multitud de causas, y achacar sus diferencias a lo que te dé a ti la gana.

Muy científico y muy útil para tomar medidas correctoras.

4. Decir que debes mejorar tus resultados un 5 o un 10%.

También genial.

Bueno en realidad esto es fácil.

Se toman las notas, se multiplican por 1,05 e inmediatamente mejorarán un 5%.

Supongo que si habéis leído el punto 3 no hace falta comentar más.

Son PERSONAS DIFERENTES, no se trata de que yo suba un botón de volumen o haga un proyecto diferente para que cambien sus resultados, todos hemos visto cómo hemos obtenidos resultados mejores en años en los que nuestra práctica era peor y viceversa.

5. Decir que de una estadística mal hecha pueden tomarse ideas aproximadas

Y como esto es de lo que más me mosquea, da título al post.

Así que, si salgo a la calle y pregunto a tres, cuál es su sexo, y tres me dicen que son mujeres… pues eso, tendré que tener en cuenta el resultado y tomar alguna conclusión… ¿Que toda la población es mujer?… no, que la muestra es pequeña… ¿que la mayoría de la población son mujeres?

No, nada, niente, nothing… No puedes concluir una mierda. Coges tu estadística, bueno, tus números, porque eso no es una estadística, y la tiras a la basura.

El problema es que con esas BARBARIDADES MATEMÁTICAS sacan conclusiones, toman actuaciones a favor o en contra de profesores y otras cosas así… ASQUEROSO.

Y ahora, qué tal si te sientas conmigo y me preguntas qué le pasa a Juan o a María, o por qué somos un tercio menos de profesores que hace dos años, o por qué tenemos más horas de clase y más alumnos por clase…

Ya, quizá así parecería que realmente os importa el proceso educativo… y claro, eso no puede ser.

Bueno, por lo menos no nos insultéis, como profesionales de la ciencia, como trabajadores y como docentes.


Sorteos por letra: Injusticia y anumerismo

1 julio 2013

Aunque ya se ha escrito sobre ello… como nos lo seguimos encontrando, habrá que seguir insistiendo.

Vamos a poner ejemplos con dinero, que parece que es lo único que entiende todo el mundo.

Imagina que compras un décimo para el sorteo de Navidad. Para simplificar, imagina que sólo hay cien números.

Imagina también que del número 52 se echan tres bolas y de tu número, el 5, sólo se echa una bola.

Imagina ahora que la bola del número siete SE SACA DEL BOMBO.

¿Vais a pagar el boleto todos al mismo precio?

¿Vas a pagar lo mismo que el que se lleva el número 52, que tiene tres veces más probabilidades de salir que tú?

¿Va a pagar algo el gilipollas, perdón, que lleva un boleto que es IMPOSIBLE que salga? Repito IMPOSIBLE…

Ahora que lo tenemos claro, vamos al asunto de las letras.

Muchas cosas se sortean usando la primera o las dos primeras letras del apellido. Tribunales de oposición, acceso a centros de formación, etc.

¿Cuál es el problema? Pues que cada uno se llama como puede… y hay apellidos más frecuentes que otros. Debido a esta distribución no uniforme, esto resulta profundamente injusto.

Para ilustrarlo, vamos a poner unos datos de este post que lo cuenta muy bien del blog UN DATO VALE MÁS QUE MIL PALABRAS

Estas son las distribuciones de datos por apellidos.

Eduardo Martín Blasco nos advierte de que sólo contabilizan apellidos con más de 20 repeticiones, por eso «falta gente» y sólo salen 43 millones.

DISTRIBUCIÓN DE LOS APELLIDOS SEGÚN LETRA. ESPAÑA 2011
frecuencia
% sobre el total
A
2.884.390
6,7%
B
2.263.664
5,2%
C
3.969.992
9,2%
D
1.747.696
4,0%
E
781.910
1,8%
F
1.877.528
4,3%
G
4.857.351
11,2%
H
992.297
2,3%
I
424.730
1,0%
J
722.854
1,7%
K
55.885
0,1%
L
2.250.441
5,2%
M
5.291.515
12,2%
N
699.534
1,6%
O
803.973
1,9%
P
3.042.595
7,0%
Q
185.195
0,4%
R
3.565.620
8,2%
S
3.201.882
7,4%
T
1.425.424
3,3%
U
171.705
0,4%
V
1.631.083
3,8%
W
48.578
0,1%
X
14.690
0,0%
Y
92.553
0,2%
Z
269.539
0,6%
TOTAL
43.272.624
100,0%

Están marcados en rojo los valores más altos, pero fíjate que algunos de ellos coinciden con letras al lado que también tienen valores bastante altos. De manera que se forman unos «tapones» importantes. Por ejemplo, alguien que esté al final de la N con el mogollón de gente con la M y otro poquito bien gordo con la L, que se despida de salir para lo que sea, para bien o para mal.

Por otra parte salga X,Y o Z es en la práctica muy parecido a que salga A. Por lo tanto los de la A tienen cuatro veces más probabilidades de salir de lo que debería.

Supongo que es bastante fácil de ver la injusticia del proceso (o debería, ahora os cuento por qué digo esto).

Pero vayamos a un caso más extremo, que te «saquen la bola del bombo». ¿Qué ocurre si en tu letra hay 10 personas por delante de ti, y las plazas que se sortean son 8? Efectivamente, tu posibilidad de salir es CERO, incluso si sale tu letra.

Y, ¿por qué salgo ahora con esto? ¿Es que no me han admitido en alguna cosa?

Ha sido a partir de una conversación con altísimo grado de anumerismo (gente que ni sabe de números y ni le interesa saber, añado) en la que me he enfadado y todo, ante los argumentos que recibía después de explicar esto. Cosas como:  protesta tú en lo tuyo, esa es tu opinión pero hay otras opiniones, cuando la gente sale no protesta, otros años salen otras letras, hay más o menos plazas, hay más o menos gente en distintas letras… Ni siquiera ha reaccionado al argumento de que alguien OBLIGADAMENTE NO VA A SALIR en el momento en que se presenta. Al final me he ido al grito de las matemáticas no son opinables y que cada uno luche por lo suyo. Particularmente me jode que cuando argumentas piensen que lo haces por defender intereses particulares, no todo el mundo es tan mezquino, por ejemplo, yo no.

Os diría que pusierais reclamaciones, pero si os encontráis con gente en la administración igual de cerrada no sé si valdrán para mucho.

Ya escribí hace tiempo sobre las vergonzosas notas con las que nos califican en las oposiciones, con cuatro y cinco cifras significativas… y, por cierto, yo he aprobado con este sistema injusto, y mira, lo critico… ¿curioso, eh?

Ah, también mola la argumentación… «la administración lo decide así».El problema de esto es que la administración no puede elegir las leyes de la Naturaleza, aunque quiera.

Se me olvidaba decir que esto se arregla tan fácil como dando un número a cada uno y sacando numeritos…

Por cierto me informa @tocamates de que @ClaraGrima tiene un post hablando de lo mismo 


Exámenes tipo test y estadística

18 noviembre 2009

Quizá a algunos os parezca evidente esto que os voy a contar, pero con frecuencia caemos en el error de pensar que evidente es eso que nosotros sabemos bien… Como a mí me toca contar esto muchas veces a mis alumnos, compañeros o amigos, pues ahí va de una vez por todas.

Antes que nada la eterna cuestión…

¿Por qué hay que restar por las preguntas incorrectas?

Aunque fastidie, es lo justo.

Imagina que respondes a un examen tipo test en sanscrito castizo.

La nota que te mereces es un cero

Pero si hubiera cuatro opciones, acertarías por azar una de cada cuatro (en promedio)

Así que tu nota esperada es de un 2,5  (un 25%)… inaceptable.

Por lo tanto, las tres preguntas que fallas de cada cuatro deben restarte el punto que te han dado por la que has acertado. Así que cada pregunta incorrecta debe restar 1/3

En general se debe restar 1/(n-1) siendo n el número de opciones de las preguntas.

Los que restan menos están puntuando por encima de lo justo a sus alumnos. Los que restan más están penalizando en exceso. Cada quien que haga lo que quiera… pero que no diga que es justo.

Vamos a por el examen!

¿Qué es lo primero que hay que hacer?

Poner el nombre…

Parece una tontería, pero puedes suspender un examen por no poner el nombre, así que aprovecho para decir que eso es lo primero… ni leer las preguntas con atención ni leches… poner el nombre!!

¿Cómo se contesta un tipo test?

Está claro que lo que hay que hacer es estudiar y todo eso… pero una vez que ya estás sentado, eso ya no tiene remedio. Así que hay que extraer la máxima puntuación posible de tus conocimientos.

1.a Contestar preguntas de las que estés seguro

Vas leyendo y contestando las preguntas de las que estés seguro.

Seguro significa seguro…

Si contestas 20 preguntas de las que estás seguro y luego tienes mal 7… tienes que revisar tu concepto de «seguro». Si estás seguro, no deberías fallar más de una o dos de todas esas.

1.b Marcar preguntas dudosas (de 2)

Según vas contestando a las preguntas «seguras» debes ir marcando aquellas en las que dudes sólo entre dos opciones.

2. Calcular nota sólo con las seguras

Ahora calculas la nota que obtendrías sólo con las seguras.

3. Añadir preguntas dudosas

Si contestamos preguntas dudosas (de 2) será estadísticamente favorable, porque acertarás una y fallarás otra por lo que de cada dos respuestas sacas 2/3 de punto.

El problema puede ser que tengamos mala suerte y palmemos muchas. Por eso no vamos a contestar todas las dudosas.

Un ejemplo muy sencillo.

Diez preguntas

Seis seguras

Cuatro dudosas (de 2)

Si contesto las diez y fallo todas las dudosas, me sale un 4,7 de nota.

Así que contestaré sólo 3 de esas dudosas y mi nota oscilará entre un 9 y un 5.

Lo más probable es que saque más de un 6 que era lo que tendría sólo con las seguras.

Así que me interesa… estadísticamente.

Esto quiere decir que si el examen tiene muchas preguntas esta estrategia funcionará mejor y que si repites esta estrategia en muchos exámenes, en la mayoría de ellos obtendrás más nota que la obtendrías sólo con las seguras.

Resumiendo.

Primero contesto las seguras y marco las dudosas.

Segundo, añado preguntas dudosas, pero sólo tantas como me pueda permitir sin que la nota mínima caiga debajo de la que me interese (aprobado, notable, según las aspiraciones de cada cuál).

Esto es una sencilla aplicación de la estadística y el sentido común (el pensamiento científico!!) a la vida cotidiana… Sacad provecho de ello!

Foto: Wikipedia


Pena de muerte y falsos positivos

7 septiembre 2009

Cuando se habla en contra de la pena de muerte a veces resulta difícil argumentar, porque no se trata de una conclusión de un razonamiento, sino que se habla directamente desde el sentimiento.

¿Cómo puedes convencer a alguien de que no está bien que se ejecute a un asesino?

Esa persona a menudo conoce tus argumentos (sobre el valor de la vida humana, lo dañino de la venganza, la reinserción, etc.), simplemente no le «gustan» un pelo.

Hoy usaremos la ciencia para tomar un atajo.

Utilizaremos el concepto de «Falso positivo» o error de Tipo I.

Imagina que vamos a hacer una prueba para detectar una enfermedad cualquiera.

Las situaciones posibles son.

  • El test dice que el tipo está enfermo y es verdad: Verdadero Positivo
  • El test dice que el tipo está enfermo, pero está como una rosa:  Falso Positivo
  • El test dce que el tipo está estupendo, pero le quedan dos telediarios: Falso Negativo
  • El test dice que el tipo está mal y así es: Verdadero Negativo.

A los falsos positivos se les conoce también como error Tipo I y a los falsos negativos como error Tipo II.

Según de para lo que se trate te puede preocupar más o menos un tipo de error u otro.

Por ejemplo, en una alarma anti-íncendios, prefiero que me salgan unos cuantos falsos positivos («falsa alarma») a que se me pase por alto un único incendio.

En wikipedia encontramos un ejemplo que nos puede ilustrar el asunto.

Os traduzco la tabla

Pacientes con cáncer

Enfermos

Sanos

?

Resultados

del

test

Positivo

2

Verdadero Positivo

18

Falso Positivo

= VP / (VP + FP)
= 2 / (2 + 18)
= 2 / 20 ≡ 10%

Negativo

1

Falso Negativo

182

Verdadero Negativo

= VN / (VN + FN)
182 / (1 + 182)
= 182 / 183 ≡ 99.5%


= VP / (VP + FN)
= 2 / (2 + 1)
= 2 / 3 ≡ 66.67%


= VN / (FP + VN)
= 182 / (18 + 182)
= 182 / 200 ≡ 91%

Os cuento los porcentajes de los márgenes.

Primero las filas:

El test sale positivo para 20 personas, de las cuales verdaderamente enfermas están 2 y los restantes 18 son falsos positivos. Así que predice positivos con una eficacia del 10%, puf.

El test sale negativo para 183 personas, de las cuales sólo una de ellas estaba enferma. Así que predice a los «sanos» con una eficacia del 99,5%, bastante bien.

Ahora por columnas:

De los tres enfermos, el test ha detectado a 2. Decimos que tiene una sensibilidad del 66,67%.

De los doscientos sanos, el test ha detectado a 182. A esta cualidad se le llama especificidad, en este caso 91%.

Alguien podía pensar que es una porquería de test, que sólo detecta al 10% de los enfermos (extrapolando los resultados). Bueno… tiene razón, es un mal test para detectar enfermos. En cambio es un excelente test para descartar la enfermedad. Si nos fijamos de nuevo, en caso de que el test haya salido negativo, la posibilidad de que estés enfermo es tan sólo de un 0,5%.

Como se dice en los entornos tecnológicos, hay que sustituir los conceptos de «bueno y malo» por «adecuado o inadecuado». Lo que uno tira a la basura puede ser extremadamente útil en otro escenario.

Para más información sobre esto

Wikipedia, error de Tipo I y de Tipo II. (Pitinglis, sorry)

Y ahora, la semilla que me lleva a largaros todo este asunto.

El sistema judicial comete errores, como cualquier sistema humano. Quizá sea lo mejor que hemos sabido hacer, pero sabemos que no es perfecto.

Comete errores de tipo I y de tipo II. Deja fuera a criminales y encarcela a inocentes.

En los paises que nos parecen más civilizados se opta por lo que se denomina un «sistema garantista». Aquello de: «mejor que estén muchos criminales en la calle que un sólo inocente en prisión». En nuestra terminología científica, queremos minimizar los falsos positivos.

El problema es que los seguimos teniendo y, de cuando en cuando, oímos que hay que liberar a algún preso que había sido condenado por algún delito terrible, durante un montón de años. Son historias terribles y trágicas, se les libera, se trata de indemnizarles… para disminuir algo el daño, que es irreparable.

Pero, ¿qué pasa si los hemos matado? Me niego a usar el término «ejecutado» y menos aún «ajusticiado». ¿En qué nos convierte eso como sociedad? ¿En qué al «verdugo»? ¿En qué al juez o al jurado?

Así que, si queréis economizar fuerzas y luchar contra la pena de muerte, este es un buen argumento.

Todo esto se me ha disparado en la cabeza a raíz de esta noticia… y pensando en las muchas que nunca aparecerán en los periódicos.

http://es.noticias.yahoo.com/12/20090905/ten-polemica-en-eeuu-por-la-ejecucion-de-c3b52a1.html

Aquí tenéis un enlace a la página de Amnistía Internacional. Hay una animación en la que van saliendo los ejecutados en los distintos países en 2008. Como seguro que muchos lleváis todo el post pensando en Estados Unidos, mirad que quién encabeza la lista es China con 1718 frente a los 37 de Estados Unidos (que ya sé que debían de ser cero).


A %d blogueros les gusta esto: