Мнение инженера о нейроарте.
Выход Stable Diffusion (SD) прогремел как бомба в художественном мире. И самым обсуждаемым во всем этом месиве событий является то, что изначальная модель SD была обучена на огромном массиве произведений авторы которых даже близко своего согласия на подобные штуки не давали. И это буквально открыло портал в ад - от абсолютно справедливых судебных исков до дикой охоты на ведьм машинного обучения. Но я хочу обратить внимание что пока ведется жаркий бой на просторах судов и интернетов с “нейроартистами”, командой SD и всеми кто попался под горячую руку, почти никто из борцов с AI-артом не замечает, что война во многом уже проиграна.
И проиграна она потому что центральный конструктивный тезис вокруг которого крутится вся эта дискуссия “нейронки никогда не были бы так хороши если бы не работы крутых художников” если не в корне неверен, то как минимум полон самообмана и ложных следствий. Во всех дискуссиях он неизбежно используется как несколько другое утверждение - “невозможно натренировать нейронку сравнимую со Stable Diffusion без нарушения авторских прав”, а уже это утверждение ложно полностью. При необходимой бизнес-мотивации это вопрос одного года и вложений масштаба от сотен миллионов до миллиардов долларов. И если не у OpenAI, то у компаний вроде Adobe эта мотивация без сомнения есть.
Вопрос “как?” - это отдельная история. Но если вкратце: в случае когда вам доступен весь creative commons арт и публично доступные фотоархивы, все что вам надо - это тысяча-другая художников на зарплате или на контракте с разделением доходов чтоб воссоздать все популярные художественные стили и приемы во всей их полноте. Остальное - дело бизнес процесса. Столько-то лицензионных контрактов для известных художников, столько-то месяцев для художников на зарплате выполняющих абсолютно чистые с легальной точки зрения заказы “три версии терминатора в стиле Хаяо Миядзаки”, столько-то мегаватт пропущенных через видяшки и нейронка свободная от любых легальных и моральных обязательств будет готова.
Если присмотреться к истории, то обратите внимание что первой была Dall-E от OpenAI в 2021 году, после была Dall-E2 в 2022, к которым не подкопаться. Потом появилась “пиратская” Stable Diffusion, натренированная по сути дела методами Dall-E 2 на очень сомнительном датасете, и только тогда художники обратили на это все внимание. Точно так же было три версии GPT и они волновали только спецов по ML, но стоило выйти chatGPT как зазвенело по всему миру. Что трижды иронично, для обучения chatGPT как раз и используются все эти методы на которые я мутно сослался раньше (разновидности Active Learning with Human Feedback), только вместо художников там были составлены примеры вопросов и ответов, а после армия контрактников сортировала ответы по качеству.
Что из этого всего выйдет? Как мне кажется, как и в многих других отраслях - будет происходить расслоение и специализация. Как в ML Data Scientist-ы разошлись на аналитиков, инженеров и исследователей, как программисты расходятся по частям стека, как в анимационных студиях есть ключевые, промежуточные и колористы, как в комиксах разделена работа карандашом и чернилами. Я думаю, появится промпт-художник, который умеет набирать референсов и хорошо миксовать их с промптами и править результаты нейронки в фотошопе на скорость и их ключевым качеством будет то, как быстро и хорошо они смогут делать именно это. Возможно, в области художников расчитывающих на комишшены и патреоны все станет еще сложнее, придут промпт-художники, уйдут те, кто не смог поддержать темп и качество.
Может, появится художник стилей и концептов, который будет готовить новые стили и приемы, изучая матчасть нейронок, историю искусства, психологю или потребляя грибы. Будут продавать “стиль, сука, стиль” и им перейдет кубок артистического гламура.
Единственное что может затормозить поступь нейронок - это если на горячую голову под давлением где-либо в США или Европе примут какой-либо дикий закон за все хорошее против роботов, косяки и метастазы которого человечество будет вычищать веками как патентную систему и систему лицензирования музыки.
Так что если бы художник у меня сейчас бы попросил совета, я бы ответил:
С этого момента все что выставлено на всеобщее обозрение выставлено на всеобщее обучение. Скорее всего художник в нынешнем понимании слова больше не может выставлять все свои работы на витрину.
Если твое имя не зашито в SD и ты не являешься художественным директором или художником в какой-либо AI-компании, скорее всего через три года ты будешь промпт-художником то есть кем-то кто использует нейронки в своей повседневной работе.
Напоследок я хотел бы повторить что Stable Diffusion и датасет LAION-5B - это однозначно нарушены права художников на предмет согласия включения в этот датасет. И нынешняя экосистема нейросеток позволяет продолжать нарушать права художников. Но ситуация с самой SD - это уже немного отрезанный ломоть и думать о ситуации стоит не в контексте конкретно этого датасета и этих склок, но в совершенно других масштабах.