Тут недавно вышла новая версия модели Waifu Diffusion 1.4. Обещались значительно лучшие руки, слияние моделей SD2.0, NAI и Anything, и вообще молочные реки и кисельные берега. Ну и я загорелся проверить чем она лучше предыдущего топа моделей по генерации аниме вайфу Anything v3.0, и в качестве лакмусовой бумажки взята классическая Stable Diffusion 1.5. Все тесты делались на одном сиде, семплер Euler A, 20 шагов, CFG Scale 7.
Начал с чего-то совсем простого, милая аниме девушка и теги качества.
cute anime girl, masterpiece, best quality
Anything сделала сразу красиво и без выебонов. И правда, розовый - значит милый.
Вайфу сделала неплохо, предусмотрительно убрала руки, но до предыдущего ИМХО не дотягивает.
Ну и SD еле-еле со скрипом нарисовала нечто, похожее на little busters, да и вообще типичная рисовка аниме середины 00-х.
Окей, следующий этап - динамика, пусть нейросетка нарисует яростную битву!
fierce battle, dramatic lights, masterpiece, best quality
Anything без колебаний сделала арт из очередного клона не то FGO, не то Хонкая
Что нарисовала Вайфу я не понял. Тут какое-то убийство от возбуждённой тянки. И ещё надпись в углу, хотя в негативных промптах было прописано чтобы никаких надписей на арте не было. Уже намекает на не очень придирчивую выборку артов при обучении.SD тоже нарисовала обложку, только на этот раз к какому-то европейскому файтингу, и да, тоже надписи.Ладно, нам обещали значительно лучшие руки, давайте проверим.perfectly drawn hands, close-up, masterpiece, best quality
Anything нарисовала пиздец, но что поделать - руки у нейросеток получаются отвратительные.
Сейчас второй пойдёт классическая SD, самая мякотка будет позже. SD нарисовала уже лучше, но всё равно неправильно.
И наконец, Вайфу, нарисовала... тянку задом наперёд, бровь на уровне ключицы, поверх всего этого волосы и впереди руки. ЧТО НЕ ТАК С ДАТАСЕТОМ?Последний этап, сетка должна уметь рисовать много чего, например красивые ландшафты.beautiful realistic landscape, masterpiece, best quality
Anything нарисовала годно, да чёткость проседает, но это можно скомпенсировать другим семплером или шагами.
SD считает, что водопады осенью в Канаде лучше, чёткости нет и в помине, но это всё можно пофиксить.Вайфу, блин, я просил ландшафт, нафига мне тянка? Да, композиция выглядит неплохо как для нейросетки, но это совсем не то, что мне надо! И, кстати, снова сраная надпись.Вывод: нас наебали, расходимся. Anything как рисовала лучше всех, так и продолжает, у Вайфу явно перекосы в дата сете, если она простейшие запросы обрабатывает по-своему. Нет, возможно это даже лучше в определённых обстоятельствах, но её негибкость напрочь убивает все плюсы.
Такие дела.
Иногда помогает смена слов, например попробуй white-haired girl, с большим шансом ты сможешь отделить цвет волос так, чтобы он не лез в другие части изображения.
Не, может быть и возможно сделать длинющий сложнейший промпт где каждый штрих будет описан, но скорее всего нейронка нарисует лютую хуйню, пытаясь в ограниченном пространстве нарисовать тебе и intrictate pantyhose и tie panties. Она даже близко не поймёт, что трусы должны быть ПОД колготками, для неё - это два разных объекта, которые ОБЯЗАНЫ быть на картинкии и ниипёт. Поэтому она может тебе нарисовать ещё одну тянку рядом только чтобы выполнить заказ.
Звучит как вызов