Google представила нейросеть Imagen, которая создаёт изображения по небольшому описанию. Вместе с этим компания показала примеры работ, которые по качеству превосходят DALL-E 2.
Стоит учитывать, что для демонстрации Google отбирает самые лучшие работы, поэтому средний результат у пользователей может оказаться другим. Даже в показанных изображениях, которые сгенерировала Imagen, можно найти смазанные места и неверный фокус.
Голубая сойка, стоящая на большой корзине с радужными макаронами
Собака с любопытством смотрит в зеркало, увидев кошку
Фото: Google
Пара роботов изысканно ужинает на фоне Эйфелевой башни
Фото: Google
Маленький кактус в соломенной шляпе и неоновых солнцезащитных очках в пустыне Сахара
Фото: Google
Енот в шлеме космонавта смотрит в окно ночью
Фото: Google
Британская короткошерстная кошка в ковбойской шляпе катается на велосипеде
Фото: Google
Гигантская кобра из кукурузы на ферме
Фото: Google
Плюшевый медведь плывёт на Олимпийских играх на дистанции 400 метров баттерфляем
Фото: Google
Проблемы других нейросетей заключаются в том, что они неправильно оценивают текст и подсказки в нём, из-за чего результат получается неожиданный. Google утверждает, что Imagen будет лучше благодаря бенчмарку DrawBench. В нём можно найти список фраз, которые загружаются в нейросеть для получения корректного результата.
Google пока не планирует делать Imagen общедоступной из-за предубеждений и вероятности создания изображений с жестокостью. Согласно данным исследователей, модель копирует информацию со стереотипами. Из-за этого публичный релиз не состоится, пока компания не разработает новый способ оценки культурных и социальных предрассудков.