Здесь уже выкладывали результаты работы dall-e2, я также выкладывал результаты работы более простой, но тоже интересной сетки Midjourney. И google сделала свою нейронную сеть для генерации изображений по текстовому описанию Imagen. Но плохие новости в том, что если Midjourney точно будет доступна, dalle2 тоже вероятно дадут пощупать людям, то google гораздо более закрыта в плане доступности своих нейронных сеток, даже показанные ниже изображения даны гуглом, когда как dalle2 и Midjourney бетатестят и выкладывают в твиттере куча людей.
A photo of a raccoon wearing an astronaut helmet, looking out of the window at night.
A robot couple fine dining with Eiffel Tower in the background.
Teddy bears swimming at the Olympics 400m Butterfly event.
An extremely angry bird.
A photo of a rusted alien spaceship stuck in a frozen lake. Two moons in the background.
(по запросу wolf fine dining full moon)
По запросу "выпивка зелёнка" на rudalle.ru я получаю нормальную такую бутылку...
Дискуссия на тему "нашего уровня" же.
Корпорации больше всего боятся выкладывать такие сетки из-за выученных ею стереотипах, если типа просишь сгенерить судью, то это будет чаще всего пожилой белый мужик, ну и прочее подобное. Гугл уже обожглась когда одна их сетка классифицировала черных как горилл.