Big Data e a democracia, segundo a Newsweek

agosto 1, 2017

A revista Newsweek, de 16 de junho de 2017, trouxe uma reportagem inquietante sobre Big Data, manifestada na sua capa. “Como Big Data está corrompendo a democracia, via a lavagem cerebral”. Estava aqui nos EUA, saindo do DGIQ-Data Governance & Information Quality, onde os assuntos “dados” e privacidade foram amplamente discutidos. “Big Data”, foi um tema muito tratado nas sessões mais tecnológicas, das quais participei, e “Privacidade”, de forma colateral, foi destaque nas sessões mais focadas em GDPR-A Regulação da União Europeia sobre proteção aos dados. Claro que resolvi mergulhar na reportagem da revista, escrita em 12 páginas, pela importância do tema.

Abaixo a síntese do que observei:

Eleições EUA

As coisas começaram pela suspeita de que a eleição de Trump tenha sido ganha, em parte, devido à ação da sua equipe digital, comandada por seu genro, Jared Kushner, hoje chefe do Escritório de Tecnologia e Inovação do Governo Americano. Ele, depois de um curso no FB(FaceBook), montou um forte time de especialistas para trabalhar o perfil dos quase 220 milhões de eleitores, que segundo dizem, está disponível nos Data Lakes de Zuckerberg. Nessa mina de ouro, há informações sobre o eleitorado americano, com detalhes maiores do que seríamos capazes de imaginar. Os dados dariam uma formidável possibilidade de estudos analíticos, passíveis de produzirem detalhes sobre comportamento, pensamento e emoções de todos os americanos e dos “facebuqueiros” do planeta. Já existiria uma ferramenta para tal, capaz de analisar os milhares de “data points” que cada um de nós teríamos nos Data Lakes gigantescos do FB.

Analytics

A primeira suspeita surgiu numa apresentação, antes da eleição, feita por uma empresa, acerca de um produto chamado “Cambridge Analítica”, originado de estudos/pesquisas de AI(Inteligência Artificial) e desenvolvido na famosa Universidade que lhe dá parte do nome . O produto da classe dos “Analytics” seria capaz de produzir o que chamam de “perfil psicográfico”, onde certas dimensões da nossa “forma de ser e pensar” seriam detectadas pela análise do “Likes” que damos, ou pelos livros que lemos, ou dos dados que mostramos, por espontaneidade ou por indução. Na demonstração, foi feita uma análise com drill-down, a partir de um conjunto de dados de pessoas selecionadas e gradativamente sendo segmentado em conjuntos menores e mais focados, que por sua vez dariam origem a outros sempre com um foco refinado, até chegar num certo indivíduo específico. Isso se chama microtargeting e já é usado em outros campos, inferindo consumos e hábitos de internautas no mundo do marketing digital. No caso da aplicação política, o objetivo (foi) é criar um mecanismo de identificação de grupos de pessoas que possam ser persuadidas por mensagens que lhes falem de forma mais significativa. Se não para comprarem seus produtos, mas para “comprarem” ideias e aderirem aos candidatos “digitais” em eleições.

Segmentação

Segundo a reportagem, teoricamente as pessoas podem ser subdivididas em 2 grandes grupos gerais: As emotivas e as cognitivas. As emotivas são as mais susceptíveis a argumentos que lhes tocam em pontos vitais da camada emocional e são deixadas levar mais facilmente por ações de convencimentos (por exemplo, alguém que se vê “incomodado” com o excesso de estrangeiros no pais e tem uma tênue prevenção contra imigrantes, recebe um posicionamento de um candidato com forte propensão à criação de barreiras à migração. Bingo!). Os outros seriam os cognitivos, aquelas pessoas que, julgam ou decidem por aspectos de cognição(conhecimentos) e são mais resistentes à e-mails/propagandas de sedução fácil. Aplicam sempre um filtro mais racional antes de darem um passo. Essa é a base da segmentação desejada por partidos políticos para poderem criar as táticas de persuasão digital, com a lupa do microtrageting apontada para as devidas camadas, sobre as quais desejam interferir.

Cambridge Analytica

A aplicação do sistema Cambridge Analytica foi baseada em algoritmos de “Cluster Analysis” já usados há anos pela IA(Inteligência artificial), principalmente no foco de segmentação de clientes por hábitos de compras e preferências. A Universidade de Cambridge não confirma a derivação do produto aplicado nas análises do Partido Republicano(vencedor), mas oferece , no seu site, um link para que você a experimente no seu perfil. O repórter do Newsweek autorizou a análise do seu perfil de FB e eu também fui experimentar. A ideia é entender as pessoas, baseadas nos seus dados no FB, procurando as tendências psicológicas descritas no acrônimo OCEAN: Openness(abertura), Conscientiousness (consciência), Extraversion(extroversão), Agreableness(concordância) e Neuroticism(instabilidade emocional ). Antes de analisar o “OCEAN” do eleitorado, a equipe de Trump teria enriquecido o Banco de dados de 220 milhões de americanos com informações de registros de votação, registro de propriedade de armas, histórias de compras por cartões de créditos, além de outros trazidos de fontes monolíticas de dados como Experian(no Brasil, Serasa-Experian),Data Logix(grande rastreadora de hábitos de consumo, hoje pertencente à Oracle),Epsilon(outra gigante que fornece dados para aplicações de marketing direcionado)e Axciom, talvez a maior empresa americana em coleta e tratamento de dados.Com esse poder de fogo, foi montado o Projeto Alamo, que pode ter direcionado a virada de jogo na campanha de 2016, com a vitória de Trump. Os Republicanos não foram os primeiros(os democratas já haviam tentado algo, via Catalist), mas foram aqueles que cruzaram o poder de fogo do Lookalike do FB(busca por pessoas com hábitos e jeitos semelhantes aos seus amigos/clientes, mas que ainda não são) com o microtargeting. Assim, a campanha de Trump pôde estender seus tentáculos para assuntos considerados normalmente fora da “Overton Windows”, protocolo político contendo uma lista de assuntos considerados “politicamente incorretos” e que não devem ser tratados diretamente em discursos e políticas governamentais (sic).

Inteligência artificial com Big Data

Em resumo, segundo a Newsweek, na eleição de 2016, a Inteligência artificial com Big Data permitiu que conceitos cinzentos como (sentimentos de racismo, supremacia branca, restrições a refugiados, antissemitismo e misoginia violenta) alcançassem targets simpáticos de forma direta, porém silenciosa. Tudo pelos efeitos dos algoritmos de mineração e dos exabytes armazenados sobre nós. Para 2020 prevê-se que esses algoritmos estarão mais refinados e a produção destas mensagens focadas alcançará um nível de automação infinitamente maior, quando centenas e milhares delas serão produzidas e distribuídas. Essa é a teoria desenvolvida no artigo da Newsweek, e que coloca o conceito de Big Data com analytics, cada vez mais na alça de mira da proteção dos dados, com segurança e respeito à privacidade. No futuro, a ética dos dados também deverá ser foco da Gestão e Governança de dados. Nunca governar os seus dados se tornou tão crítico.

Inteligência Artificial 

Os resultados apresentados pelo algoritmo supostamente “base” do produto Cambridge Analytica, quando entrei com meu ID do FB e o autorizei foi:

Gênero psicológico:

A IA sugere que meu perfil digital é bastante andrógino. Sugere que eu seja do sexo Feminino(sic!!), mas que não reprimo meu lado masculino(sic!!!). Abaixo ele dá uma dica do porquê: Os livros nos quais dei “Like”. Interessante que ele me transforma em (mais feminino) por causa de um Like dado no filme “The boy in the striped pyjama”. Um drama da guerra que fala sobre a amizade de dois meninos num campo de concentração!. Acho que o algoritmo se “embolou” quando analisou as palavras “boy” and “pyjamas”…..

Resumo da ópera

Alguns pontos de acerto e muitos erros foram cometidos pelos “engines” de inferências oferecidos para teste, no meu caso. Nada que um horóscopo não faça, com a mesma precisão, nos jornais diários. Você pode experimentar o seu perfil psicográfico, acessando ApplyMagicSauce.com e autorizando o acesso ao seu perfil do FB. Mas, não se assuste. Uma coisa é existirem zetabytes de informações sobre nós. Outra coisa é a ferramenta ter a capacidade inferencial refinada para interpretá-los, levando a estatística à uma quase adivinhação digital. Talvez numa assinatura “premium” do produto, os algoritmos aplicados sejam bem mais precisos.

Leia o artigo com a análise do meu perfil aqui.

Carlos Barbieri

Autor

Carlos Barbieri

Trabalhei na TI da Cemig por quase 30 anos, responsável por diversas áreas da Tecnologia de Informação. Trabalho como consultor em Engenharia de Sw (MPS.BR), BI e Governança de dados. Atuo como Implementador, avaliador e instrutor oficial MPS.BR. Tenho 3 livros: Modelagem de Dados, BI-Modelagem e Tecnologia e, BI2-Modelagem e Qualidade. Com mais de 200 artigos publicados no ComputerWorld e revistas diversas, sou também Coordenador do núcleo de Qualidade da FUMSOFT - Sociedade Mineira de Software.

Deixa uma resposta