Un nou "software" per ocultar la informació confidencial en documents de text

El sistema no es limita a eliminar termes perillosos, sinó que també intenta reemplaçar-los per conceptes més generals que resultin més ambigus

Redacció

26/04/2017 - 17.54 Actualitzat 09/09/2020 - 12.00

Investigadors de la Universitat Oberta de Catalunya (UOC) i de la Universitat Rovira i Virgili (URV) han dissenyat un sistema que detecta i oculta automàticament la informació confidencial de documents de text a internet amb una precisió comparable, i fins i tot més exhaustiva, al procés manual que han de fer actualment els experts en privacitat.

Montserrat Batet, del grup d'investigació KISON de la UOC, i David Sánchez, de CRISES-Càtedra UNESCO de Privacitat de Dades de l'URV, han dissenyat aquest sistema que permet que els documents es puguin enviar a tercers sense comprometre'n la privacitat i mantenint l'anonimat de les entitats (persones, organitzacions, etc.) a les quals fan referència.

La legislació de la Unió Europea és molt estricta pel que fa a la cessió de dades personals sense consentiment dels implicats i, per tant, cal garantir que els documents facilitats no revelen cap informació confidencial que es pugui fer servir amb finalitats discriminatòries, per exemple. Actualment, les dades personals són de gran utilitat en molts àmbits, tant de recerca com de negocis o de planificació, i utilitzar mecanismes de protecció adequats és essencial per garantir la privadesa i l'anonimat dels individus.

Com funciona aquest sistema?

Fins ara, la protecció de documents confidencials requeria un o diversos experts que, manualment, identificaven i eliminaven paraules, sintagmes o frases que podien revelar informació sensible o potencialment discriminatòria. El mètode que s'ha desenvolupat automatitza tot aquest procés, i això permet utilitzar i protegir eficientment el gran volum de dades que es fa servir actualment en recerca.

El sistema analitza la informació disponible a internet que és la que un tercer podria fer servir com a base de coneixement per deduir informació confidencial d'un document protegit i, a continuació, protegeix els termes que podrien facilitar aquestes deduccions.

♦ És possible controlar els joves a internet sense vulnerar la seva intimitat?

Les proves han demostrat que aquest mètode és més exhaustiu i ofereix una precisió equiparable a la d'un expert humà. A més, a diferència dels experts, el sistema no es limita a eliminar termes perillosos, sinó que també intenta reemplaçar-los per conceptes més generals que resultin més ambigus. Per exemple, en lloc d'especificar que un pacient té una pneumònia, s'indicaria que té una malaltia del sistema respiratori. Amb això s'aconsegueix que el document protegit sigui més entenedor i resulti més útil per a les anàlisis posteriors.

El mètode, de moment, s'ha aplicat en un prototip de programari que s'ha provat sobre documents clínics en anglès, tot i que es preveu que en un futur pròxim es pugui aplicar en altres àmbits de coneixement i pugui establir-se com una eina d'ús professional d'especial utilitat per a la investigació.

Un nou "software" per ocultar la informació confidencial en documents de text

El sistema no es limita a eliminar termes perillosos, sinó que també intenta reemplaçar-los per conceptes més generals que resultin més ambigus

Avui és notícia

Illa diu que el govern es deixarà la pell per tancar pressupostos: "El gener passaran coses"

Epidèmia de grip: baixen els casos, però el nombre de contagis es manté alt

Tensió a Badalona entre manifestants a favor i en contra dels desallotjats de l'Institut B9

Els drons, l'arma més letal de la guerra d'Ucraïna: provoquen el 90% dels morts

Graven d'amagat soldats israelians matant a boca de canó un palestí de 16 anys a Cisjordània