Sobre cómo se construye la realidad con las medias, modas, medianas, varianzas, covarianzas, desviaciones y demás parámetros de la Estadística.
Algoritmo y prejuicio

Un prejuicio se construye a partir de dos o tres experiencias similares, por lo general desagradables. Son muy habituales en los cerebros perezosos, es decir, la mayoría. Y se refuerzan cuando son similares a los que tienen otros. Llevados a otro nivel, son el sustento de la estadística. Miles de datos repetidos, que parece que guardan relación entre sí, llegan a convertirse en ley.

Los jóvenes tienen más accidentes, los inmigrantes pagan menos la hipoteca o el alquiler, las mujeres casadas faltan más al trabajo, los pensionistas votan más a los que prometen subir las pensiones… y así sucesivamente. Y sobre aquello que es más frecuente, o más probable, se fijan las cuantías de las pólizas de seguros, los criterios para conceder un préstamo, los requisitos para acceder a un empleo, los salarios y una larga lista de decisiones que nos afectan.

Se trata de recolectar datos, cuantos más mejor, agruparlos según distintos criterios y detectar tendencias. Y se puede dar un paso más, que consiste en encontrar correspondencias entre hechos que a primera vista no son evidentes, como la posible relación entre las multas de aparcamiento que se ponen en Cuenca y el número de turistas que visitan Filipinas. Este es el cometido de la llamada ciencia de los datos masivos o Big Data.

Con las tecnologías actuales y nuestra colaboración, pueden llegar a saber mucho sobre nosotros. Los datos que suministran los teléfonos móviles, debidamente procesados, proporcionan una imagen bastante precisa de las identidades y los itinerarios de sus usuarios. Si a esto le añadimos el contenido de los mensajes, twits, mails y llamadas, además de los datos que envían nuestros televisores inteligentes y el historial de nuestras búsquedas en Internet, tendremos un conocimiento considerable de quiénes son, qué hacen, qué piensan y qué quieren los dueños de estos aparatos. Este conocimiento pseudodivino, que todo lo ve y en todas partes está presente, es el que manejan las empresas de marketing y publicidad, pero también las compañías de seguros, los bancos y la policía.

Aunque, cuando una muestra es lo suficientemente grande, siempre se acaban encontrando correlaciones estadísticas entre las variables más dispares: la confesión religiosa y la talla de zapatos, las preferencias sexuales y el nivel de estudios, el consumo anual de aguacates y la tendencia política, etcétera. Y resulta que hay colecciones de datos que, a veces, correlacionan espontáneamente, aunque no exista entre ellas ninguna relación. Por ejemplo, la correlación entre el número de nacimientos y la población de cigüeñas de una localidad. Porque es bien sabido que en los lugares donde hay más cigüeñas es donde más niños nacen.

Pero las correlaciones, cuando se hacen públicas, ya crean una tendencia, sean ciertas o no. Si todo el mundo cree que sube la Bolsa cada vez que gana el Atleti, al final será esto lo que acabará pasando. Así es como las casualidades se convierten en causalidades, y también es así como se construyen las ideologías y los paradigmas. Porque, en nuestro afán por predecir el futuro, aplicamos el patrón causa-efecto cada vez que parece que existe una relación entre dos hechos.

En nuestro afán por predecir el futuro, aplicamos el patrón causa-efecto cada vez que parece que existe una relación entre dos hechos.

Los modelos y algoritmos estadísticos se basan en hechos del pasado y en la suposición de que los patrones se repetirán. Pero, si solo usamos datos del pasado estamos condenados a repetirlo. Cuando Amazon o la Casa del Libro predicen nuestras lecturas futuras nunca nos sorprenden, porque los patrones pasados son los que se utilizan para predecir comportamientos futuros, y suelen ofrecernos más de lo mismo; no nos invitan a mirar el mundo de una forma distinta.

Se piensa que las matemáticas son objetivas. Sin embargo, el programador que diseña un algoritmo para procesar datos puede cargarlo con sus intenciones y prejuicios, para que encuentre lo que de antemano se quería encontrar y filtre lo que no interesa.

El que nos bombardeen con publicidad personalizada es una de las aplicaciones más inocentes, aunque molesta, del análisis de datos masivos. Pero hay otras. Los algoritmos del Big Data pueden hacer que no nos seleccionen en un trabajo, que nunca nos concedan una hipoteca, que nos detengan las autoridades en un aeropuerto o que la cuota de nuestro seguro médico sea mucho más elevada.

Pueden llegar a convertirse en Armas de Destrucción Matemática, tal y como las denomina la matemática y analista Cathy O´Neil, en un libro con este título, en el que describe cómo los modelos y algoritmos pueden empeorar la vida de las personas.

Mediante los Big data el modelo se refuerza, se reafirma, impone su realidad, detectando los comportamientos indeseados, infrecuentes, excepcionales. Excluyéndolos para normalizar o potenciándolos para generar una moda conveniente.

También es cierto que el análisis de macrodatos resulta útil en el estudio de sistemas complejos y permite planificar, por ejemplo, la distribución de medicamentos, los horarios de las líneas de autobuses, la concesión de becas y tantas otras cosas que aumentan la eficacia. Pero la planificación extrema, el exceso de normas, ahoga otras realidades alternativas; apaga esa pequeña dosis de imprevisibilidad o de anarquía de la que podrían surgir soluciones diferentes.

Un comentario

Una respuesta para “Algoritmo y prejuicio”

  1. Manu Oquendo dice:

    Muy cierto el contenido del artículo.

    Por añadir algo diría que peor que el supuesto “big data” es el “small data”. Es decir, el DNI del cual carecen los países anglosajones porque, originariamente, suponía una intromisión del Estado en la sacrosanta soberanía ciudadana.

    Este pequeño detalle es importante porque es precisamente la ausencia de un DNI lo que hace necesaria la costosa analítica de los Grandes Números para encontrar patrones de comportamiento que permitan establecer correlaciones y, de vez en cuando, causalidades reales o imaginadas.

    El hecho es que el DNI permite la acumulación de toda nuestra vida “digital” y atribuirla a un individuo concreto cuyos hábitos dejan de ser hipotéticos y probables para convertirse en reales y perfectamente predecibles.

    Hoy está legislado que debe conservarse toda nuestra actividad de mensajería digital. Ciertamente lo está en la UE –tres años– y en España –cinco años.

    ¿Cómo de libre se siente una población que consciente o inconscientemente ha de saberse vigilada y supervisada cada instante de su vida digital incluyendo ya el Internet de “nuestras cosas”?

    ¿Tendrá esto algún efecto en nuestras vidas? ¿Podremos siquiera pensar que somos “soberanos” y que el sistema político nos representa? ¿Comenzaremos a dudar de ello? ¿Continuaremos confiando en nuestra “libertad vigilada”?

    Estas y otras preguntas comienzan a pedir, más que respuestas, reflexiones reposadas.

    Un saludo cordial y gracias por el artículo.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Este sitio web utiliza Cookies propias para recopilar información con la finalidad de mejorar nuestros servicios. Si continua navegando, supone la aceptación de la instalación de las mismas. El usuario tiene la posibilidad de configurar su navegador pudiendo, si así lo desea, impedir que sean instaladas en su disco duro, aunque deberá tener en cuenta que dicha acción podrá ocasionar dificultades de navegación de la página web. política de cookies

ACEPTAR
Aviso de cookies