O tema da proteção e privacidade de informação tem sido cada vez mais discutido com seriedade no sentido de garantir que dados pessoais de qualquer indivíduo sejam utilizados de forma responsável e ética, sem comprometer questões de segurança e confidencialidade.
Progressivamente, as organizações e instituições têm adotado mecanismos de proteção de informação rigorosos, com regras muito bem estabelecidas, e que pretendem impedir (ou minimizar) o uso indevido de informações pessoais em contextos generalizados. Por outro lado, nos mais diversos ambientes, os crescentes avanços tecnológicos impulsionam, igualmente, um aumento vincado da competitividade, motivando as organizações a apostar fortemente no desenvolvimento de sistemas inteligentes de suporte à tomada de decisão que lhes permitam obter vantagens competitivas à custa de análises descritivas, preditivas e prescritivas orientadas por um grande volume de dados. Se, por um lado, a adoção de políticas bem definidas de proteção de dados permite um conjunto bastante alargado de vantagens para os indivíduos, por outro lado acarreta também algumas limitações no desenvolvimento de sistemas capazes de generalizar, com eficácia, a partir de dados históricos. Tipicamente, os sistemas de extração de conhecimento de dados requerem a recolha e tratamento de variáveis importantes no contexto de aplicação em questão. Neste contexto, é bastante frequente que a correta modelação de um determinado fenómeno de interesse necessite da utilização de informação sensível para o utilizador mas de suma importância para um modelo de aprendizagem estatística ou automática.
À luz desta realidade, surge um dos desafios basilares na área de ciência de dados: o de promover a utilização/gestão de informação que, por um lado, não comprometa qualquer indivíduo e o proteja de violações à sua privacidade, garantido, por outro, a recolha, armazenamento e processamento de dados necessários ao desenvolvimento de modelos precisos que promovam melhorias significativas em processos de tomada de decisão. Não obstante parecer natural que a proteção dos interesses individuais deva prevalecer nesta equação, surgem cada vez mais eventos de incumprimento de questões legais e éticas motivadas pelo desenvolvimento tecnológico em detrimento da proteção e segurança de informação. No contexto da Saúde, por exemplo, a utilização e manipulação de variáveis que caracterizam diferentes indivíduos pode facilitar o desenvolvimento de modelos de extração de conhecimento de dados capazes de capturar padrões existentes numa determinada população. Porém, as implicações éticas e sociais decorrentes desse desenvolvimento devem prevalecer sobre os interesses da utilização de informação sensível mas benéfica sob o ponto de vista estatístico e de inovação.
Na prática, torna-se cada vez mais relevante fomentar um espírito crítico e eticamente responsável que permita que o avanço tecnológico e científico em prol do bem comum possa coexistir com os domínios fundamentais da transparência, proteção dos direitos individuais e da privacidade dos indivíduos inseridos em qualquer sociedade.
* Os jesuítas em Portugal assumem a gestão editorial do Ponto SJ, mas os textos de opinião vinculam apenas os seus autores.