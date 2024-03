Tecnologia Reproduzir o corpo humano ainda é uma barreira para ferramentas de inteligência artificial

Por Redação O Sul | 5 de março de 2024

Ferramentas de IA apresentam erros bizarros ao reproduzir imagens do corpo humano. (Foto: Reprodução)

A imagem do Papa Francisco usando um casaco puffer branco, criada por inteligência artificial (IA), fez muita gente acreditar que o líder do Vaticano havia saído às ruas com um vestuário nada comum para um Pontífice. Em outro exemplo conhecido, o ex-presidente americano Donald Trump aparece preso. Mas passado o choque inicial, um olhar mais atento evidencia falhas que em alguns casos significam erros grotescos.

As mesmas ferramentas capazes de reproduzir com doses de hiper-realismo cenas do cotidiano ou de transformar em imagens visões de futuro deixam a desejar na reprodução do corpo humano. As mãos nos dois exemplos citados aparecem distorcidas. No caso do Papa, os dedos da mão direita se fundem a um objeto. Na imagem de Trump, um dos policiais que o prendia só tinha quatro dedos.

Não são apenas as mãos. Apesar de todo o avanço da IA generativa, pés, dentes e outras partes da anatomia parecem ser a barreira mais visível destas ferramentas, em um sinal de que capturar nuances ainda pode ser um desafio para os algoritmos. Em alguns casos, essas falhas são o único ponto que permite distinguir um conteúdo falso do verdadeiro.

Mas por que a inteligência artificial ainda tem dificuldade em reproduzir partes do corpo humano? A explicação vai além das telas e da capacidade computacional destas ferramentas digitais. Os próprios artistas sempre tiveram dificuldade em desenhar partes do corpo humano.

Algo que é comum entre estudantes de Artes Visuais, explica Lícius Bossolan, artista visual e professor do curso de Pintura da Escola de Belas Artes da UFRJ. Para lidar com esse desafio, os alunos partem do método de observação, como na disciplina Desenho Anatômico, em que analisam como tal músculo ou articulação funciona antes do início de um desenho.

Em seguida, lançam mão da capacidade de abstração frente ao objeto e da técnica de simplificação das formas, puxando para elementos geométricos:

“A complexidade maior é o entendimento dos movimentos. Os movimentos da mão, por exemplo, são bastante ricos. São várias articulações”, diz Bossolan.

Além da sua anatomia mais complexa, há muitos ângulos possíveis de representação que precisam ser compreendidos: elas podem aparecer abertas, fechadas, segurando objetos, acenando ou apontando para alguém, por exemplo. Em alguns casos, a mão pode também estar escondida ou só aparecer alguns dedos.

Quando esse desafio de representação migra para os sistemas digitais, há uma dificuldade ainda maior uma vez que o aprendizado da inteligência artificial depende das informações que foram inseridas em seus bancos de dados, lembra Diogo Cortiz, professor da Pontifícia Universidade Católica de São Paulo (PUC-SP):

“O principal calcanhar de aquiles é a variedade que a IA tem que pensar na hora de criar a imagem. A inteligência artificial não conhece a realidade como conhecemos. Ela vai tentar recriar uma mão com base no que ela tem de informação em seu banco de dados, que muitas vezes está desfocado, embaçado ou em várias posições diferentes. Isso pode fazer a IA se perder.”

Imagine um sistema de IA treinado com milhões de imagens, nas quais todas as pessoas usavam sapatos fechados, e o usuário pede a imagem de um indivíduo com chinelos?

Esse é o exemplo que ilustra bem as chances de um resultado não ser satisfatório via IA, resume Arthur Igreja, especialista em inovação e tecnologia:

“Outro fator é que os modelos aprendem por reforço positivo ou negativo dos usuários. Ou seja, se a imagem solicitada for em uma situação não usual, até que não seja pedido para refazê-la, a IA não terá entendimento. Isso aumenta por consequência a chance de entregar algo estranho.”

A multiplicação de falhas na representação de partes do corpo, em especial de mãos, pés e dentes, é um desafio para as empresas de inteligência artificial (IA). Mas será que, em um futuro breve, os sistemas já estarão treinados para superar esse entrave? Especialistas avaliam que isso já está muito perto de acontecer e é questão de poucos meses.

Um porta-voz da Stability AI, empresa de IA generativa de código aberto, afirmou ao BuzzFeed no ano passado que, dentro dos conjuntos de dados de IA, as imagens humanas exibem as mãos de forma menos visível que os rostos.

As mãos tendem a ser menores nas imagens que alimentam as ferramentas, pois são raramente expostas em formatos grandes, o que ajudaria a explicar a dificuldade dos sistemas.

Representar corretamente a anatomia humana é uma curva de aprendizado para a calibragem de conteúdos gerados por IA, diz o especialista em inovação e tecnologia Arthur Igreja. A tendência é que haja um “refino”, pois é do interesse das empresas que desenvolvem a tecnologia. Quando a fase for superada, será ainda mais premente a discussão sobre identificação de imagens geradas por IA para evitar desinformação.

“Vamos avançar em como identificar e ‘taguear’ imagens geradas por IA. A partir do momento que a semelhança se torne tal que fique muito difícil para um grande número de pessoas distinguir, e falta pouco para isso, será importante saber o que é uma foto, um acontecimento e o que é gerado por IA. Caso contrário, as pessoas vão formar opiniões a partir disso”, destaca Igreja. As informações são do jornal O Globo.

