Transforme textos em imagens com a nova IA do Google

Já pensou descrever um cenário e o computar desenhar para você?

Por Redação Casa.com.br 2 jun 2022, 19h00
Série de 8 imagens criadas a partir de textos que constam nas legendas delas.
(Imagen/Google Research/Google)

O Google Research revelou o Imagen, uma nova inteligência artificial (IA) que traduz texto em imagem. Basicamente, o sistema pode criar imagens fotorrealistas a partir de entradas de texto.

“Apresentamos o Imagen, um modelo de difusão de texto para imagem com um grau de fotorrealismo sem precedentes e um profundo nível de compreensão da linguagem”, diz o artigo oficial. “Imagen baseia-se no poder de grandes modelos de transformação de linguagem na compreensão de textos e depende da força dos modelos de difusão na geração de imagens de alta fidelidade.’

[abril-veja-tambem]W3siaWQiOjM5OTk3NCwidGl0bGUiOiJFeHBvc2kmI3hFNzsmI3hFMztvIGRvIEdvb2dsZSByZWNyaWEgb2JyYXMgZGUgS2xpbXQgcGVyZGlkYXMgbmEgMiYjeEFBOyBHdWVycmEgTXVuZGlhbCJ9LHsiaWQiOjM1Nzk5OCwidGl0bGUiOiJHb29nbGUgaW5hdWd1cmEgcHJpbWVpcmEgbG9qYSBmJiN4RUQ7c2ljYSBlbSBOb3ZhIFlvcmsifSx7ImlkIjozNTUxMTgsInRpdGxlIjoiQSBIZWxsbyBLaXR0eSBwb2RlIHZpc2l0YXIgc3VhIGNhc2EgZ3JhJiN4RTc7YXMgJiN4RTA7IG5vdmEgdGVjbm9sb2dpYSBkbyBHb29nbGUhIn1d[/abril-veja-tambem]

“Um grau de realismo sem precedentes”

Imagem de um guaxinim de chapéu andando de skate. Ao lado o texto a partir do qual a imagem foi criada, com frases descritivas em destaque.
(Imagen/Google Research/Google)
Continua após a publicidade

O Google afirma que o Imagen apresenta um grau de fotorrealismo sem precedentes e um profundo nível de compreensão da linguagem que supera concorrentes. Para funcionar, o programa recebe textos, digamos: “Três esferas de vidro caindo no oceano. A água está espirrando. Sol está se pondo.” e a transforma em uma imagem que retrata exatamente isso. As imagens resultantes podem ser fotorrealistas ou mais uma interpretação artística.

Série de 4 imagens criadas a partir de textos que constam nas legendas delas.
(Imagen/Google Research/Google)

O Imagen não está disponível ao público, mas o Google compartilhou vários exemplos de como a IA funciona. Para o projeto, o Google criou um benchmark abrangente e desafiador para o modelo chamado DrawBench. Com ele, a empresa pode comparar o Imagen com outros métodos de IA, como o VQ-GAN+CLIP, Modelos de difusão latente e DALL-E 2. O DrawBench descobriu que os humanos preferem o Imagen aos concorrentes.

Continua após a publicidade
Imagem de um pequeno cacto de chapéu de palha, usando óculos de sol neon no deserto do Sahara. Abaixo consta o texto a partir do qual a imagem foi gerada. A imagem bate certinho com o texto.
(Imagen/Google Research/Google)

Para saber mais sobre o Imagen, acesse aqui onde o Google explica o projeto em profundidade.

*Via Designboom

[abril-veja-tambem]W3siaWQiOjQxNzk3OCwidGl0bGUiOiJFc3NlIGVzY3VkbyBjb25zZWd1ZSB0ZSBkZWl4YXIgaW52aXMmI3hFRDt2ZWwhIn0seyJpZCI6NDE3NTEwLCJ0aXRsZSI6IlJldmlldzogbW9uaXRvciBTYW1zdW5nIHRlIGxldmEgZG8gTmV0ZmxpeCBhbyBXb3JkIHNlbSBsaWdhciBjb21wdXRhZG9yIn0seyJpZCI6NDE2MzM3LCJ0aXRsZSI6IkVzdGEgJiN4MjAxQztiaWNpY2xldGEmI3gyMDFEOyBkZSBlc2NhbGFyICYjeEUxO3J2b3JlcyBhanVkYSBhIGNvbWJhdGVyIG8gZGVzbWF0YW1lbnRvIn0seyJpZCI6NDA2MjQ2LCJ0aXRsZSI6IkZyZWVzdHlsZTogcHJvamV0b3Igc21hcnQgZGEgU2Ftc3VuZyAmI3hFOTsgbyBzb25obyBkZSBxdWVtIGFtYSBzJiN4RTk7cmllcyBlIGZpbG1lcyJ9XQ==[/abril-veja-tambem]

Publicidade