Fazer uma fisionomia séria parecer estar sorrindo, criar fotos artificiais e editar falas são algumas das coisas impressionantes e terríveis que a IA (Inteligência Artificial} está fazendo. O jornalista James Vincent escreve sobre como a Inteligência Artificial pode alterar nosso sentido de verdade.  No The Verge você pode ler o artigo original e seguir os inúmeros links do artigo.

Smile Vector é um bot do Twitter que pode fazer qualquer celebridade sorrir. Ele extrai da web imagens de rostos e, então, transforma suas expressões usando uma rede neural movida a aprendizagem profunda. Seus resultados não são perfeitos, mas são criados de forma completamente automática, e é apenas uma pequena amostra do que está por vir com inteligência artificial abrindo um novo mundo de falsificação de imagem, áudio e vídeo. Imagine uma versão do Photoshop que pode editar uma imagem tão facilmente quanto você pode editar um documento do Word – será que alguma vez poderemos confiar em nossos próprios olhos novamente?
“Eu, definitivamente, acho que este será um passo quântico em frente”, Tom White, o criador de Smile Vector, diz ao The Verge. “Não só em nossa capacidade de manipular imagens, mas realmente na  sua prevalência em nossa sociedade.” White diz que ele criou seu bot para ser “provocativo”, e para mostrar às pessoas o que está acontecendo com a Inteligência Artificial neste espaço. “Eu não acho que muitas pessoas fora da comunidade de aprendizado de máquinas sabiam que isso era mesmo possível”, diz White, conferencista de codificação criativa na Escola de Design da Universidade de Victoria. “Você pode imaginar um filtro do tipo Instagram que simplesmente diz “mais sorriso” ou “menos sorriso” e, de repente, isso está no bolso de todos e todos podem usá-lo.”
 
Smile Vector é apenas a ponta do iceberg. É difícil dar uma visão abrangente de todo o trabalho que está sendo feito em manipulação de multimídia em IA precisamente agora, mas aqui estão alguns exemplos: a criação de modelos de face 3D a partir de uma única imagem 2D; mudar as expressões faciais de um alvo em vídeo em tempo real usando um “fantoche” humano; alterar a fonte de luz e sombras em qualquer imagem; gerar efeitos sonoros com base em vídeo mudo; live-streaming os debates presidenciais, mas tornando Trump calvo; “ressuscitando” Joey de Friends usando clipes antigos; e assim por diante. Individualmente, cada um desses exemplos é uma curiosidade; coletivamente,  somam muito mais.
 
“O campo está progredindo de forma extremamente rápida,” diz Jeff Clune, professor assistente de informática na universidade de Wyoming. “Exemplos de cair o queixo chegam em minha caixa de entrada todo mês.” O próprio trabalho de Clune não trata de manipulação de imagens, mas de gerá-las, inventar. Sua equipe começou a trabalhar nisto em 2015, adaptando redes neurais treinadas no reconhecimento de objetos. Inspirados pela pesquisa feita no cérebro humano em 2005, eles identificaram os neurônios que se iluminaram quando confrontados com certas imagens, e ensinaram a rede a produzir as imagens que maximizavam essa estimulação.
 
Em 2015, suas redes criavam fotos como estas:
Em 2016, eles estão criando fotos como estas:
Para criar essas imagens, a rede neural é treinada em um banco de dados de imagens semelhantes. Então, uma vez que tenha absorvido imagens o suficiente de formigas, tubarões vermelhos, e vulcões, pode produzir suas próprias versões ao seu comando – não é necessário nenhuma instrução além de “mostre-me um vulcão”. Os dois pontos de estrangulamento no momento são resolução de imagem (nenhuma dessas imagens são maiores do que 256 x 256) e encontrar as imagens marcadas para treinar as redes com elas. “Nossa limitação atual não é a capacidade dos modelos, mas a existência de conjuntos de dados em maior resolução”, diz Clune. “Quanto tempo até que possamos produzir imagens full HD que sejam fotorrealistas? É uma incógnita, mas provavelmente é da ordem de anos, não décadas. “
 
Uma vez que estas técnicas são aperfeiçoadas, espalham-se rapidamente. Um bom exemplo é um método conhecido como “transferência de estilo” que usa redes neurais para aplicar as características de uma imagem a outra. Um artigo-chave sobre este assunto foi publicado em setembro de 2015, com pesquisadores transformando este trabalho em um aplicativo de código aberto em janeiro de 2016. Em junho, uma empresa russa refinou este código em um aplicativo móvel chamado Prisma, que permitia a qualquer pessoa aplicar vários estilos de arte em fotos em seus celulares e compartilhá-los em várias redes sociais. O aplicativo explodiu em popularidade, e neste novembro, o Facebook divulgou sua própria versão, adicionando alguns novos recursos ao longo do caminho. De pesquisa de ponta a produto comercial em menos de um ano; é com essa rapidez essas ferramentas podem ser adotadas.
 
Clune diz que, no futuro, a geração de imagens alimentadas por IA será útil nas indústrias criativas. Um designer de móveis poderia usá-la como uma “bomba de intuição”, ele diz, alimentando uma rede gerativa com um banco de dados de cadeiras e, então, pedindo para gerar suas próprias variantes que o designer poderia aperfeiçoar. Outro uso poderia ser a criação de conteúdo para jogos de vídeo e realidade virtual, que os usuários poderiam, literalmente, ditar em tempo real. Quer dragões? Basta pedir por eles. Quer dragões maiores, com armas para braços e cristas roxas brilhantes? Tudo bem também. Pesquisadores já estão trabalhando em precursores para este tipo de interface. Na imagem abaixo, as imagens à direita foram criadas com base nas legendas à esquerda, nada mais.
Outro beneficiário óbvio seriam as fraudes. Considere o vídeo abaixo – uma demonstração de um programa chamado Face2Face (Cara a Cara), que transforma as pessoas, basicamente, em fantoches, permitindo que você adapte sua expressão facial à sua própria. Os pesquisadores demonstram isso usando imagens de Trump e Obama. Agora combine isso com o protótipo de software recentemente lançado pela Adobe, que permite editar o discurso humano (a empresa diz que poderia ser usado para corrigir narrações e diálogo em filmes). Daí, você pode, também, criar imagens de vídeo de políticos, celebridades, dizendo, bem, o que você quiser que eles digam.  Publique seu clipe em qualquer página do Facebook moderadamente popular e veja-a espalhar-se pela internet.
vídeo
Isso não quer dizer que essas ferramentas irão conduzir a sociedade a um modo livre-para-todos sem fatos. Afinal, a prática de retocar fotos remonta ao quarto escuro, e os meios de comunicação muitas vezes são enganado ao relatar imagens falsificadas como sendo reais. Desde “lançamentos falsos de mísseis” norte-coreanos até fotos do “cadáver” de Osama bin Laden esparramaram-se pelas páginas de tablóides britânicos. O mesmo pode ser feito com o vídeo – veja, por exemplo, o escândalo do Planned Parenthood (Planejamento Familiar) de 2015 que se baseou em imagens disfarçadas que haviam sido editadas para sustentar alegações sensacionais e falsas.
 
No entanto, não podemos negar que as ferramentas digitais permitirão que mais pessoas criem esses tipos de falsificações. Não há nada que a IA possa fazer com uma imagem ou um vídeo que um especialista humano não poderia (dado o tempo necessário), mas quando todos puderem tratar uma foto tão facilmente quanto criar um documento do Word, seria excessivamente otimista alegar que não haverá efeitos colaterais. As falsificações e manipulações feitas com IA não são difíceis de detectar agora (desfocadas são as mais comuns, assim como a baixa resolução e simplesmente a aparência “falsa”), mas os pesquisadores dizem que elas vão ficar cada vez melhor.
A proliferação de falsificações realistas seria uma bênção para os teóricos da conspiração e contribuiria para o atual clima de deterioração da confiança no jornalismo. Uma vez que as pessoas sabem que existem imagens falsas circulando, isso dá a elas razão para duvidar de imagens reais nas quais elas podem não querer acreditar, por qualquer motivo. {Veja, por exemplo, estas fotos do blog de 2012, do Furacão Sandy, que verifica não só falsificações, mas também imagens genuínas).  E se um novo software nos permite manipular o conteúdo de áudio e vídeo com tanta facilidade quanto de imagens, isso prejudicaria outro pilar da evidência “confiável.”
 
Pesquisadores da IA envolvidos nestes campos já estão tendo uma experiência de primeira mão do ambiente midiático. “Eu, atualmente, existo em um mundo de vertigem de realidade”, diz Clune. “As pessoas me enviam imagens reais e eu começo a me perguntar se elas parecem falsas. E quando me enviam imagens falsas, presumo que sejam reais porque a qualidade é tão boa. Cada vez mais, penso eu, não saberemos a diferença entre o real e o falso. Cabe às pessoas tentarem educar-se. “