Por: Juan Ignacio Zamora Montes de Oca.   20 febrero, 2018

Tomando en cuenta que el 28 de enero de cada año se celebra en gran parte de países del mundo el Día de la Protección de Datos Personales y que nuestro país cuenta con una normativa específica que regula la materia desde el 2011, es necesario que organizaciones, instituciones, empresas y personas que tienen relación con el tratamiento a los datos personales cuenten con un conocimiento amplio del manejo de esta información a fin de evitar incumplir las regulaciones que protegen este tipo de data.

Es así como protegiendo la esfera íntima de las personas, uno de los componentes más importantes a la hora de hacer un correcto tratamiento de los datos personales es la anonimización de datos.

Esta es una herramienta de gran utilidad que busca evitar un manejo no autorizado a los datos personales, y la cual ha ido modernizándose por esa relación estrecha que existe hoy entre Derecho y Tecnología.

La anonimización de datos personales busca que se dé un tratamiento de la información acorde a las normas y en beneficio de las empresas y el comercio, sin vulnerar el ámbito privado de los sujetos titulares de la información personal.

El fin de la anonimización debe ser claro, pues esta debe hacerse específicamente para el propósito en cuestión. El proceso, independientemente de las técnicas utilizadas, reduce en cierta medida la información original en el conjunto de datos, y por lo tanto, generalmente, a medida que aumenta el grado de anonimización, se reduce la utilidad (claridad y / o precisión) del conjunto de datos. Por lo tanto, la organización o empresa que requiere esa data necesita decidir el grado de equilibrio entre la utilidad aceptable y tratar de reducir el riesgo para identificar a un sujeto.

Una de las consideraciones importantes en términos de utilidad para realizar la anonimización es si esta presenta un riesgo adicional al saber el receptor qué técnica de anonimización y qué grado se ha aplicado; esto por un lado podría ayudar al analista a comprender mejor los resultados o interpretarlos mejor. Por otro lado podría contener sugerencias que podrían conducir a un mayor riesgo de reidentificación de los datos.

Las diferentes características de las múltiples técnicas de anonimización que existen significan que ciertas técnicas pueden ser más adecuadas para una situación que otras. Por ejemplo, la autoridad de Protección de Datos Personales de Singapur establece que ciertas técnicas como el “enmascaramiento de caracteres” se usan generalmente en identificadores directos y otros como la “agregación” para identificadores indirectos. Otro ejemplo que dicha autoridad ha aprobado es considerar si el valor del atributo es un valor continuo o discreto (por ejemplo, “sí” o “no”), porque las técnicas como la perturbación de datos funcionan mucho mejor para los valores continuos.

Las diversas técnicas de anonimización también modifican los datos de maneras significativamente diferentes. Algunos modifican solo partes de un atributo como la “máscara de caracteres”; otros reemplazan el valor de un atributo en múltiples registros, como lo hace la “agregación”; y otros reemplazan el atributo completo con información no relacionada pero consistente, como por ejemplo la pseudónimización. Otros eliminan por completo el atributo reduciendo el riesgo en un porcentaje muy alto.

Protección

Las técnicas de anonimización básicamente reducen la identificabilidad de uno o más individuos titulares de datos personales dentro del conjunto de datos originales a un nivel aceptable por la cartera de riesgos de la organización.

Es importante siempre realizar una evaluación de “identificabilidad” antes y después de aplicar las técnicas de anonimización, y esto requiere una buena comprensión de la materia a la que pertenecen los datos.

La evaluación previa al proceso de anonimización asegura que la estructura y la información dentro de un atributo estén claramente identificadas y entendidas, y se evalúa el riesgo de inferencia explícita e implícita de dichos datos; por ejemplo un atributo que contiene el año de nacimiento proporciona implícitamente la edad. La evaluación después del proceso de anonimización determinará el riesgo residual de reidentificación. Por lo tanto, si el conjunto de datos son datos de atención médica, probablemente se requiera que alguien con suficiente conocimiento de salud evalúe qué tan único (es decir, qué tan identificable) es un registro.

Otro ejemplo es cuando se crea un conjunto de datos sintético o se intercambian atributos de datos entre registros y se necesita un experto en la materia para reconocer si los registros anonimizados tienen sentido.

Por lo tanto, la elección correcta de las técnicas de anonimización depende del conocimiento de la información explícita e implícita contenida en el conjunto de datos y de la cantidad o el tipo de información que se pretende anonimizar.

Es claro entonces que la anonimización es compleja, pues además de tener experiencia en la materia (como se explicó anteriormente), los responsables y encargados que deseen compartir conjuntos de datos anonimizados también deben garantizar que el proceso de anonimización lo realicen personas bien versadas en técnicas y principios de anonimización, y si no se encuentran los conocimientos necesarios dentro de la organización, se debe contratar ayuda externa.

De esta forma la posibilidad de darle un tratamiento a los datos personales de acuerdo a la normativa es posible, sin caer en incumplimientos que no solo le generan responsabilidad penal y administrativa al responsable de los datos personales sino también un daño irreparable al ámbito de la intimidad y privacidad del titular de los datos personales.

Es importante siempre realizar una evaluación de “identificabilidad” antes y después de aplicar las técnicas de anonimización, y esto requiere una buena comprensión de la materia a la que pertenecen los datos.


El autor es Máster en Derecho Informático.