Cómo evitar que El País sepa tu voto y dónde veraneas

Una pieza informativa aspira a describir unos hechos, que tienen unas implicaciones. Un titular, por su parte, apenas da para una pincelada: es una elección muy particular que resalta una parte muy concreta de los hechos. Es por ello que no hay titular inocente. El titular no es un mero fragmento de información: es un enfoque.

Hoy en día, las noticias digitales se leen poco y se comparten rápido. En el mejor de los casos, el titular condiciona completamente la interpretación de una lectura en diagonal. En el peor de los casos, es lo único que se lee. Y suma y sigue. Like. Retweet. Compartir en Facebook. Por lo tanto, el enfoque es fundamental.

Pero hay un problema: un titular condiciona también cuánta gente hace click y llega a tu medio. La mayoría de las noticias no son realmente tan interesantes y la competencia por la atención es alta. Los medios lo saben, y su incentivo está en retorcer ese enfoque, lo que a veces puede tener consecuencias desastrosas.

Un caso paradigmático de esto se está dando esta semana. El pasado miércoles, en una noticia que no voy a enlazar directamente, El País Economía titulaba así:

El INE seguirá la pista de los móviles de toda España durante ocho días

La polémica estaba servida. Expertos opinadores de toda índole se lanzaban a afirmar desde que era ilegal hasta que no servía para nada. Ardían las redes. El Estado nos vigila. ¿Y adivinan qué? Exacto: el INE no seguirá la pista de los móviles de toda España. No obstante, toda la información que explica qué es exactamente lo que va a hacer el INE —que es algo completamente legal, ético y razonable, con datos anónimos— estaba en el cuerpo de la noticia, pero nadie lo leyó o quiso leerlo. De hecho, puse un hilo en Twitter explicando la noticia apoyado en capturas de la misma:

Ofrezco un par de titulares alternativos a partir de información incluida en el propio artículo:

Un estudio pionero tratará de mejorar cómo se hace la estadística pública

El INE buscará abaratar costes y mejorar la precisión de cara al Censo 2021

Desafortunadamente, ni el redactor ni el editor apostaron por este enfoque. En su lugar, escogieron uno que, como mínimo, resulta engañoso, y literalmente, es mentira.

Otros fueron más lejos todavía, como Público:

El INE quiere rastrear la posición de nuestros móviles pese a que lo impide la ley

Que ya no es que el titular se pase de rosca, es que el cuerpo de la noticia es pura bazofia digna de The Sun.

Unas horas más tarde, Verne, de El País, insistía en el enfoque:

Cómo evitar que los datos de tu teléfono móvil formen parte del estudio del INE

Tristemente, otros medios, como Maldita (periodismo para que no te la cuelen), se apuntaban al mismo carro. Eso sí: ni rastro de explicar que el resultado de un estudio así es un bien público y por qué nos interesa a todos que salga bien. Y ayer, El País Economía volvía a la carga:

No solo el INE rastrea los móviles: Fomento ya pagó a Orange por los datos de 16 millones de teléfonos

¿Adivinan qué, otra vez? Efectivamente: Fomento no pagó por datos privados, sino por un estudio de esos datos para obtener información agregada y anónima de movilidad que, de otra manera, se habría obtenido por un procedimiento de un orden de magnitud más caro. Detalles, detalles…

Lo paradójico de todo esto es que El País es un abanderado del llamado periodismo de datos (lo que me parece muy bien; ¡a favor!). Fueron los primeros en hacer el mapa interactivo del voto en las últimas elecciones, que luego otros medios copiaron. Y en verano, leíamos un reportaje interesantísimo donde utilizaban datos de telefonía de Orange (¿suena familiar?) titulado De dónde son los españoles que veranean en Benidorm (y en otros 55 destinos).

Por aquel entonces ya hubo quien se quejó —porque es cierto que hay un debate abierto en torno a la privacidad, un asunto delicado—, y el tema acabó en el Defensor del Lector, que no dudó en defender la labor de sus periodistas de datos en A más datos, más periodismo. Sí, señor. Solo me pregunto qué les parecería si otro medio decidiera hoy titular:

No solo el INE y Fomento rastrean los móviles: El País ya siguió los datos de millones de teléfonos

Cómo evitar que El País sepa tu voto y dónde veraneas

Sobrentendidos. 11 de febrero, Día de la Mujer y la Niña en la Ciencia

Hace algunos años, yo no creía que días como hoy fuesen necesarios: días en los que se reivindica a tantas figuras históricas no solo como científicas, sino también en tanto que mujeres. Solía defender, con el ceño fruncido y la voz herida de orgullo que «yo» no necesitaba discriminación positiva, que los méritos debían brillar por sí mismos, que los genitales de cada cual son cosa suya, que el tiempo pone las cosas en su sitio…

Es lo que tienen los instintos morales: que hunden sus raíces hasta el estómago y, solo con tiempo, información y suficiente esfuerzo, somos capaces de cambiarlos. ¿Os habéis preguntado alguna vez por qué cada vez que sale la palabra «feminismo» se monta un flame en Internet? Bien, este es el motivo. Todo el mundo conoce mujeres y todo el mundo «siente» (muy fuerte, a la altura del ombligo) cuál debe ser la actitud correcta hacia ellas; a saber, la suya propia. Rara vez 140 caracteres son suficientes para darse cuenta de que, además de sentimientos y un conocimiento parcial de ciertas mujeres, conviene tener a mano estudios e información objetiva que aclare las bases del problema. Muchos ni siquiera piensan que los datos deban ocupar un lugar en el debate.

Sin embargo, no hay nada como pillarte infraganti, víctima de tus propios sesgos, para empezar a dudar de esas intuiciones y girar la cabeza hacia los datos. En mi caso, la anécdota reveladora (o así la recuerdo yo: una especie de bisagra) vino de la mano de mi nueva carrera.

Cuando empecé el grado en Física, dio la casualidad de que tres de mis compañeros de trabajo habían empezado a estudiar por la UNED también. Ellos eran ingenieros y se habían matriculado en matemáticas. La rutina de estudios y exámenes daba para bastantes anécdotas y fomentaba el sentimiento de compañerismo, pero también… cierto grado de competición: llegaron los primeros exámenes y se descubrió que mis resultados en física eran muy buenos. Más concretamente, mis resultados en física eran mejores que los suyos en matemáticas. No en vano, soy una gran empollona, tan empollona que en 2° de carrera me dieron el premio a empollona del año de la Facultad de Ciencias de la UNED. Pero claro, ellos eran ingenieros, eran tres y, sí, eran hombres, así que algo debía de estar fallando.

La broma cuajó pronto. «Es que física es una carrera muy fácil», mucho más fácil que matemáticas, esto es. Pero lo malo no fue la broma. A fin de cuentas, era solo un comentario que nacía del juego, de la competencia sana entre pares, era eso, solo una broma. Lo malo fue el sobrentendido. Pronto, todos pensábamos que matemáticas debía de ser mucho más difícil que mis estudios. Pronto, yo misma pensaba que física no podía ser una carrera tan complicada.

Tardé todavía un año en darme cuenta de mi propio sobrentendido y algo más en asociarlo a cuestiones de género, a la imagen que yo misma tenía de «ellos» (ingenieros varones, luego más brillantes que yo) y de mi capacidad para las materias técnicas, esa capacidad que nunca hubiese puesto en duda de manera consciente. Descubrir ese sesgo misógino en mis propios ojos, como un filtro inconsciente y dirigido hacia mi propio desempeño, me hizo darme cuenta de cómo se lo aplicaba, sin quererlo, a otras mujeres. Me obligó a revisarme y a darme cuenta de que, sin datos, sin esfuerzo, sin activismo y sin días como hoy, el tiempo por sí solo nunca pondrá las cosas en su sitio.

Encuestas vs. la jodida realidad

muerteydestruccion

Hoy he leído que la gráfica que encabeza esta entrada muestra un «exitazo del modelo de escrutinio». Para mí, lo que esa rampa pronunciadísima grita simple y llanamente es «hola, no teníamos ni puta idea, y conforme hemos ido contando los votos, la realidad nos ha dado un gran hostión en toda la cara».

No me puedo creer que analistas que daban un 30 % de probabilidad de victoria a Trump hasta el último momento se muestren ahora como «no sorprendidos». No me lo creo. Se decían cosas como «la probabilidad de que gane Trump es la misma que la de que Ronaldo falle un penalti». Y daba la impresión de que votar era como tirar una moneda trucada al aire justo el día de las elecciones.

Y aquí estábamos, riéndonos, pensando que bueno, al final no ganará… es imposible… mira las encuestas… Lo que necesitamos es menos estudios de intención de voto y más estudios de los efectos de los estudios de intención de voto en la intención de voto.

Perdonad la pataleta, pero no es para menos: un paleto, racista, machista, agresor sexual, negacionista del cambio climático es el nuevo presidente de los Estados Unidos. Bienvenidos al sueño americano.

No, la CUP no amañó la votación

La CUP votó ayer si investían a Mas como presidente o no. Votaron 3030 personas, de las cuales, 1515 votaron a favor y 1515 en contra. Vaya, hay que repetir la votación tendrá que decidir el Consejo Político de la formación… Fin de la historia. ¿O no? Pues resultó que no. Alguien (un matemático, para más señas), publicó lo siguiente en Twitter:

Y la gente comenzó a hacer cábalas y a hablar de conspiraciones judeomasónicas. También hubo quien intentó, con más acierto*, poner orden y decir que no, que la probabilidad no es esa, que debe calcularse como resultado de una distribución binomial y, por tanto, la probabilidad 50/50 es la más alta de todos los resultados posibles. Y esta misma mañana, ya estaba la prensa a la carga con su equidistancia de los cojones. «Pero tampoco en matemáticas hay nada exacto […] Sea cuál sea la solución correcta […]» (sic), decían. A la mierda, La Vanguardia, a la mierda.

Pero en último término, a la mierda todos. Esto no es cuestión de probabilidad: la gente no vota a lo loco (aunque en ocasiones lo parezca), no vota lanzando una moneda al aire. Por tanto, recurrir a la probabilidad del hecho es una gilipollez per se. Punto. Igual que utilizar la probabilidad como prueba en un juicio (que se ha hecho): falaz e inútil. «Me ha caído una teja en la cabeza: ¡qué probabilidad había? Eso es que me la han tirado». Eso es mierda, argumentación estúpida: ya ha sucedido; me es indiferente cuál fuese la probabilidad.

Por no hablar de que estaríamos hablando del amaño más absurdo de la historia: amañar una votación para empatar y posponer la decisión. Con dos cojones.

*De nuevo, con más acierto si tomamos la premisa implícita en el tweet original de que la probabilidad de votar a favor o en contra es 50/50 para cada votante, una premisa que no se sostiene por ningún lado. Si hubiese salido 3020 a favor y 10 en contra, ¿lo consideraríamos un resultado improbable? Es absurdo. Es absurdo todo.

El agujero de la construcción (2)

He ampliado el dataset de la entrada anterior para identificar personas físicas y jurídicas y recoger códigos de actividad (CNAE) y objeto social de las empresas. El análisis se puede seguir aquí. El principal resultado es el histograma por código CNAE o, dicho de otra forma, cómo se distribuyen las empresas deudoras por actividad económica:

hist

¿Qué representa ese pico entre 4000 y 4500? Bien, no hay sorpresas aquí: resulta que ese rango de códigos está destinado al sectorde la construcción. A partir de ahí, he refinado el primer análisis con 144 empresas más reconocidas gracias a dicho código. Como resultado, ahora el número de empresas de la construcción supera el 50 % y la deuda que acumulan prácticamente llega al 60 %.

bars

boxplot