Vuelta a empezar

Marta Fuentes

Me enorgullece relanzar mi página web en una fecha tan especial: el tercer aniversario en mi actual puesto de trabajo. Comencé a trabajar en Fidesol el 17 de febrero de 2020, una fecha muy especial por dos motivos muy distintos: justo había pasado un mes de la defensa de mi tesis y aún no sabía que apenas un mes después nos confinarían. Para mí es todo un honor poder trabajar haciendo lo que me gusta, investigar y divulgar.

Con motivo de este aniversario he decidido renovar mi página y darle un toque más dinámico, acorde a esa afición de escribir y divulgar que siempre he tenido. Comienza una nueva etapa donde cada semana publicaré contenido de actualidad que espero sea de vuestro interés.

Marta

Entrevista de radio en Onda Sur de Motril

Hoy he tenido el placer de hablar en directo con Sandra Fernández, de Onda Sur de Motril sobre la charla «Inteligencia Artificial: ¿enemiga o aliada?», que tendrá lugar mañana a las 20h en el Patio de los Ingenios (Motril).

Por aquí dejo la entrevista como aperitivo de una tarde que no dejará a nadie indiferente. ¡Apta y recomendable para todos los públicos y edades!

¿Cómo garantizar la privacidad de los usuarios?

La privacidad se refiere a lo personal, a aquello que consideramos que es nuestro y nadie debería conocer si nosotros no queremos. En concreto la RAE (Real Academia de la Lengua Española) define privacidad en su segunda acepción como «Ámbito de la vida privada que se tiene derecho a proteger de cualquier intromisión».

En la era de la tecnología y las comunicaciones, esta definición cobra aún más importancia, dado que es más fácil que nunca estar conectados y comunicados, pero también que se vulnere nuestro derecho a la privacidad.

Por eso, para garantizar la privacidad de los usuarios (de todos nosotros), existen distintos mecanismos. Lo más sencillo y efectivo, diría que lo principal, es la CONCIENCIACIÓN. En materia de privacidad (al igual que en ciberseguridad), es esencial ser conscientes de las herramientas que tenemos en las manos y de las implicaciones de su uso. Como siempre digo, no se trata de tener miedo, sino conocimiento y responsabilidad.

Privacidad a nivel de usuario

Lo primero que debemos hacer como usuarios es plantearnos hasta dónde queremos mostrarnos, no sólo en las redes, sino en cualquier formulario o encuesta que completemos. Muchas veces, se nos olvida esta última parte cuando, por ejemplo, nos hacemos socios de un determinado comercio o plataforma para obtener ventajas. En estos casos, lo que realmente estamos haciendo es vender nuestros datos a cambio de unos euros de descuento. No tiene nada de malo, pero debemos ser conscientes de lo que estamos haciendo y si realmente nos compensa.

En cuanto a las redes, ni que decir tiene que debemos pararnos a pensar no sólo lo que compartimos, sino con quién. Por una parte, si en circunstancias normales no vamos diciendo a todo el mundo que estamos de vacaciones en Canarias o si estamos felices o tristes, igual no tiene mucho sentido hacerlo en internet. Ni mucho menos, vamos con una foto de nuestra mascota o de nuestro hijo pegada en la frente para que todo el mundo la vea. Quizá lo comentamos a personas cercanas, como familiares o amigos, pero no a los vecinos, compañeros de trabajo (antiguos y pasados) y hasta al conductor del autobús. Eso sin contar que, normalmente, no vamos haciéndonos amigos de cualquiera que nos salude por la calle o que nos presenten. Para evitar sustos, debemos ser conscientes de qué, dónde y con quién compartimos contenido. Igualmente, debemos elegir a quién aceptamos y a quién no en nuestra red. Finalmente, es necesario saber que todas las redes sociales o plataformas disponen de opciones de configuración que permiten controlar estos aspectos y restringir su uso.

Privacidad a nivel tecnológico

Quizá lo que más acude a nuestra mente cuando hablamos de privacidad es la seguridad en las comunicaciones (básicamente, que no sepan de lo que estamos hablando). Este es sólo uno de los aspectos tecnológicos de la privacidad. Efectivamente, existen mecanismos para garantizar que las comunicaciones sean seguras frente a «ojos» u «oídos» indiscretos. Lo normal es que casi todas las páginas web dispongan de mecanismos de cifrado (típico https), que hace que si alguien está observando el tráfico de la red, no pueda conocer su contenido. Sin embargo, este no es el único problema (ni la única solución) que puede surgir relacionado con la privacidad.

¿Qué ocurre si finalmente nos registramos en una página web para hacer una compra o para obtener descuentos? Aquí es donde entra la Ley de Protección de Datos. Esta ley es de obligado cumplimiento y los desarrolladores de cualquier página web, aplicación o plataforma digital que solicite datos de carácter personal debería cumplirlos.

Sin embargo, aunque a la hora de recopilar y almacenar los datos se cumpla con esta ley, esto no significa que no se pueda vulnerar el derecho a la privacidad de los usuarios. ¿Por qué? Cada vez más se utilizan algoritmos de inteligencia artificial y aprendizaje automático para mejorar el rendimiento de los negocios o mejorar la experiencia de usuario.

Los algoritmos son como «recetas» o pasos que le dicen al ordenador lo que tiene que hacer. En el caso de la inteligencia artificial y el aprendizaje automático, estos algoritmos necesitan grandes cantidades de datos (cuantos más mejor) que utilizan a modo de «ejemplo» o muestra para aprender sobre ellos. Por ejemplo, un algoritmo puede recibir muchos ejemplos de tipos de animales, indicando qué características tienen y a qué clase pertenecen. Cuando queramos saber qué tipo de animal es una vaca, le indicaremos al algoritmo qué características tiene y podrá decirnos qué tipo de animal «cree» que es o con cuál de los que tiene como ejemplo encaja mejor.

Como estos algoritmos tratan con datos que, en ocasiones, pueden ser sensibles, deben ser diseñados para cumplir con la legalidad. Pero, ¿qué ocurriría si fuéramos capaces de deducir información privada sobre individuos aún sin que hubiera sido proporcionada? Quizá pueda parecer una locura, pero es posible. De hecho, existen ciberataques contra la privacidad que consisten en extraer información privada a partir de datos aparentemente inofensivos. La responsabilidad de garantizar el correcto funcionamiento y prevenir (en la medida de lo posible) estos ataques es en este caso de los investigadores, diseñadores y desarrolladores de algoritmos y modelos.

Privacidad a nivel de algoritmo

Esto nos lleva a la última parte del artículo. Existen múltiples formas de diseñar algoritmos que preserven la privacidad de los datos. Por eso, también existen múltiples líneas de investigación que trabajan para mejorar en este aspecto tan importante.

Algunas de estas técnicas consisten en obtener modelos a partir de datos cifrados, otras consisten en equilibrar los conjuntos de datos, de forma que no se produzcan sesgos hacia ciertas características (esto haría identificables a esos individuos). Cuando se trata de algoritmos de clasificación, también se puede garantizar que haya un mínimo de muestras con ciertas características en cada clase. En otras ocasiones, se añade ruido de forma controlada para distorsionar los datos originales, pero no el resultado final del modelo. Además, existen mecanismos como el aprendizaje federado (ver la entrada Compartiendo conocimiento) que permiten obtener modelos globales sin conocer los datos de los usuarios, sino ciertos parámetros obtenidos de forma local. Estos parámetros siguen permitiendo obtener modelos válidos a la par que preservan la privacidad de los usuarios.

Para saber si un algoritmo está cumpliendo con las expectativas de privacidad, es necesario disponer de métricas. Las métricas permiten evaluar el rendimiento de los algoritmos en un determinado factor (en este caso, la privacidad) y, por tanto, comparar los algoritmos estudiados. Existen numerosas métricas de privacidad, tal y como se muestra en el artículo Technical Privacy Metrics: A Systematic Survey. Es importante aplicar estas métricas en distintas categorías para poder obtener una visión más completa y una evaluación más acertada.

Entonces… ¿cuál es la conclusión?

Todos debemos ser conscientes de la necesidad e importancia de la privacidad: desarrolladores e investigadores, pero también usuarios y responsables de negocio y empresas. El desconocimiento no exime de responsabilidad y todos podemos contribuir a preservar este derecho tan importante.

Compartiendo conocimiento

Esta semana he tenido el placer de hablar sobre «Federated Learning» en el Máster Universitario en Ciencia de Datos e Ingeniería de Computadores (DATCOM).

Por aquí comparto la presentación, que pretende ser una introducción al «Federated Learning», uno de los paradigmas actuales que permiten mejorar la privacidad de los datos en las comunicaciones del día a día.

Gracias por haber confiado en mí para compartir mi conocimiento y ayudar a otros a seguir formándose.