Stable Diffusion 3 теперь доступна для скачивания и запуска локально / Stable diffusion :: длиннопост :: нейронные сети

Stable Diffusion 3 теперь доступна для скачивания и запуска локально

нейронные сети,Stable diffusion,длиннопост

Генерация по промту: Epic anime artwork of a wizard atop a mountain at night casting a cosmic spell into the dark sky that says "Stable Diffusion 3" made out of colorful energy

Теперь модель можно скачать и запустить локально (пока только Medium-версию). Разработчики пишут, что новая модель лучше понимает текст промта, более реалистичная в плане рук и лиц. А так же лучше запоминает детали на даже на небольших дата сетах. Одна из интересных фитч - генерация надписей.

Еще пишут что она "идеально подходит для работы на стандартных потребительских графических процессорах без снижения производительности". Но тут бы я поспорил, легко переварить 10Gb не каждая видеокарта сможет. На моей машине работает медленнее по сравнению с SDXL.

Скачать саму модель можно с civitai или huggingface. Запустить на данный момент только в comfyui.

Немного погонял локально, промты действительно понимает хорошо. Но модель "недообучена" - качество оставляет желать лучшего. Предыдущие версии тоже от этого страдали, но люди из комьюнити допиливали до вполне не плохих результатов.

Несколько примеров на модели SD3 Medium Incl Clips T5XXLFP8

Сложный промт с положением объектов на картинке указанием цветов (у прошлых моделей возникали проблемы):

Three bottles on a table in a kitchen. Bottles that look like cola. Left bottle is full of blue liquid with the number 1 on it. Middle bottle is full of white liquid with the number 2 on it. Right bottle is full of red liquid with the number 3 on it.

Видно, что модель четко следует промту. Круто!

Попробуем с людьми:

Forest in the background. Dark theme, sunset, look at at viewer, captured in the late afternoon sunlight. Photo of three 21 year old woman. Left woman is blonde with the number 1 on blue T-shirt. Middle woman is redhead with the number 2 on white T-shirt. Right woman is brown hair with the number 3 on red T-shirt. Wearing shorts

$ ' 'Л <*щ: tC Y\ ^ МЦ , ,%f- > / « »®V .}?^■ ' . V » ‘ Y «Л • , г ‘У»7 f\ J¡«V >^|<1Л*П'*01Я^1^^^^Ея1. ájí&jrf * ?&"-Z1QH ¡г а*. "• a^2|^B|Uг> * * ¿jp v .уФ*ы г*Ьп|^НРЦН^&. . "J ль*,нейронные сети,Stable diffusion,длиннопост$

Тут пришлось сначала описать лес на фоне, потому что иначе он выглядел как будто прифотошопленным. В остальном модель четко соблюдает номера, цвет футболок и волос. Раньше, без танцев с бубном, четко прописать нескольких разных типажей на одной картинке было почти не реально - детали сливались и получались клоны. А в новой версии достаточно просто описания.

А что по надписям на картинке? Попробуем:

Neon sign with the text "Ты пидор"

Видимо, русскую кодировку не завезли, но видно что модель старается, попробуем иначе:

Neon sign with the text "You are awesome!"

Попробуем сгенерить котика:

A black cat walking along a street paved with stone.Close-up of a cat's face.

Опять неплохо, хотя пришлось реролить несколько раз, что бы получить более-менее нормальный результат. Модель знает основы анатомии кота, но иногда больше похоже на детский рисунок.

Как на счет аниме?

Illustration anime, cartoon. 1woman, blue eyes, brown hair, dynamic angle, centered, full body photo. Street in the background

Опять пришлось реролить несколько раз. Заметил, что если указывать больше деталей, картинка получается лучше.

Попробуем городской пейзаж:

Urban photography: houses, trees, cars, and peoples. the road goes from the bottom left to the right

$PM л «с* l4^:v:v^ >.:;->r^ t^jgr jP, jBgf ж ■ W5p дОДЙ'^с^ «. ЩМч к VT'^Г ‘ 1 т :’•кйк№т1^^и » \ 1 «!* *. j|, ЛД ^ ; >,нейронные сети,Stable diffusion,длиннопост$

Осторожно: если долго рассматривать картинку, можно подумать что у тебя инсульт...

Что мы имеем на данный момент? Пока реализм хромает... Не всегда с первого раза выходит что нужно. Лично я ожидал большего. Все те же проблемы с руками и склонностью к "плоскости" перспективы и объектов.

Но есть ощущение, что модель действительно лучше понимает что от нее хотят. Будем надеется, что дообучение будет по силам сообществу, и мы увидим NSFW версию от авторов Juggernaut или Pony Diffusion.

ЗЫ: надеюсь теги эротики и аниме не нужны.

Подробнее

' 'Л <*щ: tC Y\ ^ МЦ , ,%f- > / « »®V .}?^■ ' . V » ‘ Y «Л • , г ‘У»7 f\ J¡«V >^|<1Л*П'*01Я^1^^^^Ея1. ájí&jrf * ?&"-Z1QH ¡г а*. "• a^2|^B|Uг> * * ¿jp v .уФ*ы г*Ьп|^НРЦН^&. . "J ль*

PM л «с* l4^:v:v^ >.:;->r^ t^jgr jP, jBgf ж ■ W5p дОДЙ'^с^ «. ЩМч к VT'^Г ‘ 1 т :’•кйк№т1^^и » \ 1 «!* *. j|, ЛД ^ ; >
нейронные сети,Stable diffusion,длиннопост

Еще на тему

нейронные сети(26871)

Stable diffusion(3717)

длиннопост(43267)

Развернуть

Комментарии 3315.06.202412:36ссылка71.9

Что-то нормальных рук я не увидел в аниме-генерации. У трёх девушек с руками тоже проблемы.

Bill Ein 15.06.202412:41 ответить ссылка 0.5

это голая дифузка, паки дообучения подключаются
главная киллер фича -- более точное исполнение запроса

Гидродант 15.06.202413:38 ответить ссылка ↑ 1.3

А как с nsfw? Стоит фильтр?

siderr 15.06.202412:43 ответить ссылка 1.1

Нет, она просто не обучена обнаженке. Пишешь "nude" - генерит в белье/купальнике.

Fireboy 15.06.202412:59 ответить ссылка ↑ 2.6

Siderit 15.06.202413:38 ответить ссылка ↑ 11.2

ничего, мы выждем...

Seraphim 15.06.202414:39 ответить ссылка ↑ 10.8

попробуй сгенерировать девушку на зеленой траве и вылолжи самый удачный вариант

Aleshkaune 15.06.202412:47 ответить ссылка 3.2

Ахаха, тега "жесть" нет, боюсь бан словить)

Fireboy 15.06.202413:12 ответить ссылка ↑ 4.7

Апдейт.
Авторы прочих моделей (особенно PonyXl, на базе которой стоит половина генерации контента сейчас) бухтят что в новой СД3 крайне мутно описана фин часть.

Именно - ответственность за контент и монетизацию.

Есть подозрения что может выйти боком для авторов, при массовом принятии СД3 как новой базы.

TAvy 15.06.202412:47 ответить ссылка 8.1

Бубы и писы рисует?

MaXM00D 15.06.202412:53 ответить ссылка -0.1

https://civitai.com/models/497255/stable-diffusion-3-sd3

$\ NO BOOBS, ONLy FACE.$

Siderit 15.06.202413:28 ответить ссылка ↑ 10.9

Ого, такая молодая, а уже слесарь.

Тук-Тук 15.06.202413:31 ответить ссылка ↑ 2.0

Freecazoid 15.06.202416:38 ответить ссылка ↑ 2.9

Что-то как-то вау-эффекта нет от картинок

xgffy 15.06.202412:55 ответить ссылка 1.2

те кто сравнивают общедоступную SD3 medium с полной SD3 развернутой в облаке отмечают отвратительную генерацию в первой

Aleshkaune 15.06.202412:58 ответить ссылка ↑ 0.3

Ну во первых сейчас доступна только средняя модель которая аналог SDXL как я понял, а ещё будут легкая (типа аналог 1.5), тяжелая и очень тяжелая (последнюю как раз все и ждут). Во вторых все жалуются на мутные новые лиц соглашение и монетизацию как выше написали. А ещё модель почти не может в людей. Народ предполагает что в угоду "нужно больше золота от инвесторов" эти умники максимум порезали датасет с людьми в базе чтобы никто не жаловался на засилье порно.
Первые 2 дня хейт был такой что все думали что SAI закроется к хренам. Все призывали перетекать в аналоги типа пиксарта и люмины. Что там сейчас не в курсе, но думаю смирятся и допилят потом как обычно.

Mathias_Duke 15.06.202413:25 ответить ссылка 5.8

Создатель Пони кстати написал уже что 7 версии на SD3 пока не будет, а будет 6.9 на SDXL. А 7 версия вообще возможно с SD переедет куда-то ещё.

Mathias_Duke 15.06.202413:29 ответить ссылка ↑ 5.5

1.5 уже настолько разветвилась, что ещё долго неумрёт.

Tormen 15.06.202414:36 ответить ссылка -1.2

А есть под третью инструкция, как её на своей модели обучать?

ratishonok 15.06.202415:03 ответить ссылка 0.0

Вот например от huggingface, но я сам не пробовал.
https://github.com/huggingface/diffusers/blob/main/examples/dreambooth/README_sd3.md

Fireboy 15.06.202417:41 ответить ссылка ↑ 0.3

Пажи, Pony Diffusion? То есть и в порно-нейросетках бронивечество свои пять копеек вставило?

Это пойдет в папку с доказательствами...

Ayzek_Pie 15.06.202415:20 ответить ссылка 0.6

Фурфаги были единственными кто допилили SDXL с немикроскопическим датасетом и без пейвола. Беда только в том что половина этого датасета составили фури и копро.

vodochka 15.06.202417:05 ответить ссылка ↑ 0.6

А где можно скачать то?

Megacybergluk 15.06.202416:42 ответить ссылка 0.0

А можно гайдик как накатить новую версию? я пользовался старой, но не помню даже как обновить и где взять

Kover_Bez_Druzei 15.06.202416:58 ответить ссылка 0.0

Вот гайд, где всё описано. Работает пока только в Комфи. Накатить можно, но базовая модель мало что может, ждём файнтьюнов.
https://education.civitai.com/quickstart-guide-to-stable-diffusion-3/

bublegumer 15.06.202417:26 ответить ссылка ↑ 0.3

У SD3 medium _очень_ плохо с генерацией человеков, прямо совсем. Особенно женщин, особенно не совсем одетых

Kl
?as«¡s
vKv'S'tt^l*1
Sli
oki
МЪЩШт$
ft.^§:ÄvA^
ШММ
mm

Pocket Star 15.06.202418:51 ответить ссылка 1.5

P.S. соски оно умеет, но только политкорректные

Pocket Star 15.06.202418:52 ответить ссылка ↑ 1.4

Понимание промта хорошо, но большие проблемы с конечностями, людьми, детализация на базовую 1.5 похожа, что печально с учетом ее аппетитов. Large перспективно выглядит, но ждать нужно еще прилично когда выкатят и допилит комьюнити.
А еще раскопали что в названии в последнюю минуту удалили слово Beta из названия.

Fefnik 15.06.202419:26 ответить ссылка 0.0

На amd опять болт положили, или таки добавили поддержку?

Guljaca 15.06.202419:48 ответить ссылка -0.4

через DirectML вроде можно юзать
https://github.com/microsoft/Stable-Diffusion-WebUI-DirectML

jobman 15.06.202423:37 ответить ссылка ↑ -0.9

да и на Linux+ROCm - тоже

https://github.com/AUTOMATIC1111/stable-diffusion-webui/wiki/Install-and-Run-on-AMD-GPUs#install-on-amd-and-arch-linux

ford0focus 16.06.202404:20 ответить ссылка ↑ 0.0

Похоже такое же мертворожденное как 2.0 будет.

Ion maus 15.06.202420:36 ответить ссылка 0.9

один хер и прикольно и сыкотно.

Монокарп 16.06.202401:18 ответить ссылка 0.0

Только зарегистрированные и активированные пользователи могут добавлять комментарии.

Похожие темы

Фендомы

Warhammer 40000

Dota

Mortal Kombat

Тренды

Похожие посты

подробнее»

	нейромазняРейтинг: 210,607.1
	нейросетевые фурриРейтинг: 81,794.4
	нагенерил самРейтинг: 75,989.1
	Stable diffusionРейтинг: 56,014.8
	MidJourneyРейтинг: 46,365.6
	нейродичьРейтинг: 9,997.2
	ChatGPTРейтинг: 8,829.6
	AI ArtistРейтинг: 8,056.1
	нейрогифкиРейтинг: 5,348.0
	NovelAIРейтинг: 5,299.8

	WhiteKuroe
	Kyutty
	Miruko (Boku no Hero Academia)
	Michiru Kagemori
	diva (hyxpk)

Stable Diffusion 3 теперь доступна для скачивания и запуска локально / Stable diffusion :: длиннопост :: нейронные сети