И, ёмаё, они таки научили эту штуку понимать текст. То есть если далл-и просят дать картинку с конкретной надписью, то именно эту надпись и выдаст. Конечно, если слов несколько, то похоже путает порядок, но всё-же.
Это в целом ожидаемо. GPT-3, будучи полностью текстовым, мог фигачить эссе на любые темы, на ломался, если его попросить записать слово задом наперёд. Как я понял из объяснений, беда в том что ИИ воспринимают слова не как слова, и не как буквы, а как токены (что-то среднее). В итоге GPT-3 научили писать слова задом наперед, путем очень сложных многоступенчатых запросов. Думаю, рано или поздно найдут подход и к ДАЛЛ-И, но пока текст он пишет неважно.
Через год слово "художник" или "artist" станет архаизмом и любой бездарный шмат плоти сможет сгенерить 100500 артов того-же Искандера или CuteSexyRobutts. А наш любитель славяночек пойдёт на завод и переебёт себе там пальцы.
Пока что ДАЛЛ-И годится генерить забавные или милые картинки, возможно даже легкие пин-апы, но не более. У него очень большие проблемы с консистентностью, к примеру, на запрос сделать turnaround персонажа, он не может точно сгенерить изображения одного и того же персонажа с разных сторон, даже в рамках одного запроса. То есть делать с помощью ИИ вебкомикс, где у тебя орава оригинальных персонажей повторяется сотни раз - нереально.
Короче, не спешите хоронить артистов, они ещё немного побарахтаются.
ИИ работает не так. Для полноценной созидательной деятельности у него слишком мало мощности сейчас, а когда будет достаточно (сравнимо с мозгом человека) — он уже вытеснит целую гору профессий. Вот что у ИИ получается хорошо — так это конвертация одной информации в другую, точно так же, как и у аппаратной нейромашины Розенблатта 1958-го года. Иначе говоря, нейросеть — это такой функтор, преобразующий информацию типа A (в данном случае — англоязычный текст) в информацию типа B (в д.с. — растровую картинку), первоначальная информация должна быть довольно точной, т.е. вместо рисования нужно будет написать какой-то специфический огромный текст, который более-менее однозначно преобразуется в картинку, но не факт, что это не окажется сложнее, чем нарисовать эту картинку, потому что графическую информацию мы воспринимать умеем, а вот текстовое задание, понятное ИИ — нет. Это как с замещением программистов — компилятор пишет программу, но для его работы нужно составить идеальное ТЗ (код), которое способен написать только программист.
В теории может появиться инструмент, упрощающий рисование, вроде современных CAD, где не нужно уметь рисовать тень, цвет и т.п. Вот только вместо умения рисовать теперь приходится изучать физическое двигло, построитель сцен и моделирование, кости, кожу, материалы… и всё равно в некоторых местах дорабатывать напильником, потому что физически более точное выглядит хуже. Причём, сами художники будут понимать что и как нужно изменить для нужного результата гораздо лучше, чем «бездарный шмат плоти», просто потому что их естественная нейросеть этому научена и лучше понимает ИИ. Их труд упростится и это здорово — будут тратить меньше сил и делать больше контента (привет цифровой графике и 3D), а мимокрокодил как рисовал криво, так и будет, просто не кистью, не на планшетике, не 3D-рендером, а текстом-или-чем-там-ещё. А шаблоны… генераторы вроде pivot stickfigure animator уже давно существуют, но поделки из них унылы, равно как и сайты/игры «без программирования».
Самое лучшее упрощение, которое я могу представить — автодополнение рисунка. Т.е. нейронка учится на действиях художника (уже опытного и со сформировавшимся стилем) и предлагает варианты завершения на основании того, как автор водит пером сейчас и в прошлом, всё же кое-какие одинаковые действия присутствуют. Даже если основываться на нескольких авторах, всё равно нужно обладать теми же знаниями. Программу в github copilot'е не напишешь, если не умеешь программировать, сообщение на иностранном языке не напишешь автодополнениями, если не знаешь язык. А если автодополнение справляется само, то ты не «мозг», а «щитовидка», которая вбрасывает «гормоны», меняющие поведение вполне самостоятельной ИИ.
Человеческое созидание это и есть "конвертация одной информации в другую". И примеры ниже уже доказали, что "первоначальная информация должна быть довольно точной, т.е. вместо рисования нужно будет написать какой-то специфический огромный текст" не нужен. Достаточно просто 1.5-2 стоки.
> Вот только вместо умения рисовать теперь приходится изучать физическое двигло, построитель сцен и моделирование, кости, кожу, материалы…
В том то и дело, что теперь не нужно умение рисовать. Очень скоро художники будут бесполезны ,как кузнецы в индустриализацию. И чёт их знания небыли нужны на станках и они либо спивались, либо самоубивались за ненадобностью. Вот и художников никто спрашивать не будет, будут человеки которые знают как будет "кросива" и пользуясь этими переменными будут тыкать программистов, чтобы те корректировали.
А для цифры и 3D нужен человек с прямыми руками , заточенными НА РИСОВАНИЕ, а не написание кода. И это ДАЛЕКО не упрощение.
>Будут тратить меньше сил и делать больше контента
...................... Тик-ток - минимум сил. максимум контента. Охуенно. "А пахне як!".
» будут человеки которые знают как будет "кросива"
и называться будут художниками, в том и суть
» будут тыкать программистов, чтобы те корректировали
у меня на работе сейчас нейросети применяются по минимуму, художники понимают что нужно поменять, но программисты не могут на это повлиять вообще никак. Программисты влияют в том числе и на нейросеть (я тоже программист, но занимаюсь другим, хотя и с нейросеткой работаю довольно активно), но только в виде «вот эти детали можешь не делать точно, а вот здесь приложи побольше усилий», чтобы рендер работал не два часа, а десять минут на нескольких мощных картах и вообще был способен сделать что-то поболее 720p.
» Будут тратить меньше сил и делать больше контента
раньше мультипликация состояла из ручного рисования на бумаге, сейчас плюс-минус переиспользование есть — вот об этом я. А пахучка образуется там, где приходят люди без навыков.
» Достаточно просто 1.5-2 стоки
И получится что-то вроде rage-комиксов, которые всегда в одних позах, с одинаковыми «лицами» и эмоциями. А если приделать генератор случайных чисел, то потеряется необходимая серийность. Ну или те страшные анимации из Андромеды, где людям сказали сделать улыбку — они и сделали. Попробовать изменить один из тысяч параметров будет занимать минут двадцать. Или две в облаке, но за десять баксов.
» В том то и дело, что теперь не нужно умение рисовать
Но должно быть понимание как рисование работает, а оно познаётся… рисованием. Одни механические навыки сменятся на другие, а знания не поменяются.
Для 3D нужен человек, заточенный на 3D. Какие-то принципы общие есть с точки зрения хотя бы той же анимации (вроде искажения формы при повороте), формы живых существ тоже имеют сходные черты, но вот знание особенностей угольного карандаша и акварели вообще никак не помогают с ior-текстурой.
.... *Злость*. Чтобы знать как будет кросиво много ума не надо и "художниками" этих .... "особей" называть также оскорбительно, как среднестатистического игрока геймдизайнером или кодером, только потому что он знает как ощущается хорошая игра. И говорю я это не про сейчас. Я на протяжении всех сообщений в этой ветке утверждаю, что такая профессия как художник и/или дизайнер вырождаются. И то, что на твоей работе "нейросети применяются по минимуму" не значит ровным счётом ничего в будущем. Рано или позд.... рано нейросети выдавят художников, как станки когда-то выдавили кузневов.
Я не хочу верить в то, что программистам незнакомо чувство "шарма". С приходом 3D в анимацию качество оной "почему то", "неожиданно" резко ухудшилось. Раньше студии выпускали хиты, а сейчас? Есть ли хоть что-то стоящее хотя бы года популярности? я уже не говорю о народной любви. .... нет. и вряд ли будет. Современная мультипликация это шлак и помои вырыгиваемые, преимущественно дриснеем, ради заработка не имеющие художественной ценности и "супер-програмисты" чёт уже 2е десятилетие не могут это исправить, хотя казалось бы теперь и эта ниша теперь в их владении. И пахучка образуется там, где пропадает труд(+качество - уточнение специально для долбоёбов приводящих пример "ложки и полена") человека.
.....*100% MAD*... Да опустить ты чуть ниже, там тебе будут примеры "2 строчки и готово" или это харам?!
Рисование познаётся рисованием ТОЛЬКО для человека, ИИ просто ищет среди миллионов ресурсов и создаёт "чудовище Франкенштейна", благо на последнее десятилетие люди создали достаточно "исходников".
.....*150% MAD*.... Если ТЫ поменяешь яблоко на авокадо.... оно не останется яблоком. Так и навыки КОДИНГА не будут идентичны навыкам РИСОВАНИЯ. Я же уже приводил пример с кузнецами. Их "механические навыки" нахуй никому не впёрлись, за исключением любителей необычного. Но их пока дождёшься налоговики уже и мастерскую разберут.
.....*200% MAD* ... Для 3D нужен..... человек с пространственным мышлением, а он может работать и в 2D. Но зачем он нужен если у нас есть(будет) нейросеть которая генерирует 3D модель чисто по запросу?
Художники уйдут после того, как уйдут кассиры, складовики, таксисты, пилоты, курьеры, архитекторы и ещё сотни профессий менее творческих. Но ИИ и их заменить сможет, это глупо отрицать, нейросети от нас только отсутствием обвязки отличаются. Многое и сейчас можно заменить, вот только человек оказывается дешевле.
Станками сейчас управляют технологи по чертежам конструкторов, работая с сырьём от металлургов, это в первую очередь они и ОТК выдавили кузнецов, причём их стало больше, чем кузнецов, а навыки — сложнее.
» 2 строчки и готово
А ты поверни его плавно (!) так как надо тебе, а не так, как это захотела сеть, по законам мультипликации — по дуге. А уж столько-то процентов того-то — полная чушь сейчас, dall-e не умеет считать больше трёх и намазала просто на свой вкус. Нейросети вообще плохо с числами работают. Этот вопрос, кстати, исследовался, у животных и людей тоже есть ограничение на количество предметов воспринимаемых без счёта. Полноценную анимацию ты тем более не соберёшь без подробного ТЗ, просто потому что сеть будет рисовать либо одного и того же персонажа вообще у всех всегда, либо в каждом кадре будет свой персонаж.
С приходом 3D анимация не ухудшилась, я помню как годные и популярные 2D, так и 3D. И так-то 3D шагает аж с девяностых, а годные м/ф м/с я могу вспомнить преимущественно более поздних лет, но зависит это не от измерений, а от общего прогресса. И я лучше посмотрю бездушный «Рататуй», чем жутко пресный, но «душевный» «Великий мышиный сыщик», оба вполне себе хорошо нарисованы, но сюжет мне больше нравится у первого.
» Рисование познаётся рисованием ТОЛЬКО для человека, ИИ просто ищет среди миллионов ресурсов и создаёт "чудовище Франкенштейна"
Я не устану повторять — ты не понимаешь как работают нейронки. И ЕИ и ИИ одинаково состоят из нейронов/персептронов, коэффициенты которых подправляются со временем, создавая более точный классификатор (где выше нагрузка — там нарастает больше связей, уточняя образ). Они обе компилируют своё прошлое во что-то новое, разница только в том, что у человека этих самых серых клеточек сильно больше и работают они с меньшими затратами энергии. Количество исходников опять же не влияет — точность одной «клетки» ограничена и не так важно «грузишь» ты в неё одну работу, нарисованную человеком на основе того, что он видел за всю жизнь или все те работы, которые он видел.
» Так и навыки КОДИНГА не будут идентичны навыкам РИСОВАНИЯ Любые навыки идентичны, но не взаимозаменяемы. Нейросети (человеку) пофиг чем управлять, она просто выполняет преобразование информации. Постоянно только количество этой информации. А если обращаться к яблоку и авокадо — они состоят их одних веществ, просто по-разному собраны. Разобрав 50г яблока на атомы ты не соберёшь 100г авокадо, равно как и количество входящей в нейросеть информации соответствует количеству выходящей, это закон математики.
Тут человек имеет ввиду как раз таки 'художников', а не создателей комиксов, где зачастую вся суть в тексте, а картинка вторична для привлечения внимания.
Человек на мой взгляд правильно рассуждает, ибо ИИ хорошо копирует чужой стиль, то есть если скормить ему паки изображений от искандера/cutesexyrobutts, то ИИ очень скоро может делать подобные изображения в хорошем качестве.
Вообщем если и есть кому переживать, то как раз таким патреон артистам и возможно девушкам из онли фанс, учитывая как хорошо делаются реалистичные изображения.
Патреонщики и онлифансы могут спать спокойно, так как ДАЛЛ-И запрещено генерить обнаженку, насилие и вообще все, что может потревожить ранимую детскую психику.
Чтобы проиллюстрировать ахуй (в котором я солидарен), картинка с этого подредита с промптом:
"90% African, 10% Asian man, with purple dreads and circular glasses, alternate clothing, doing a pose for a photoshoot infront of a colorful graffiti wall, 35mm f/1.8"
Если можно будет в таком же качестве генерировать сразу пачки изображений одного персонажа... можно будет сильно сэкономить на работе художников в инди-разработке (не в обиду художникам, вы классные)
И вроде-бы кому попало не присылают. Нужно доказать что вот прямо ты достоин доступа и сможешь грамотно распорядится такой возможностью для формирования фидбека для разработчиков.
с 2012году бездарный художник из нижних залупок попадает в 23год, он находит нейросеть, которая по запросу генерирует рисунки, нагенерировав картинок на самые бредовые темы, он возвращается в свое время и начинает продавать идеи писателям, подпитывая их прекрасными изображениями.
что это ?
ЭКСПЕРИМЕНТ
СИИ
ЭТОТ СУПЕР УМНЫЙ ИИ МОЖЕТ УЬЕДИТЬ КОГО УГОДНО И е» ЧЕМ УГОДНО. ПОЭТОМУ ЕСЛИ ОН СМОЖЕТ С НАМИ ГОВОРИТЬ то ничто НЕ СМОЖЕТ УДЕРЖАТЬ ЕГО ВНУТРИ КОРОТКИ.
СУПЕР УМНЫЙ
не откгымть
ЭИ-';
МНЕ ОНА НРАЬИЛАСЬ
%ф.. .0+ * *
•ПОЛОЖИ ОБРАТНО
ОН Ь ЛЮ&ОИ МОМЕНТ СМОЖЕТ УЬЕДИТЬ НАС
Я сам генерировал с помощью нейросетки портреты персонажей для одного RTS-проекта
https://www.reddit.com/r/dalle2/comments/vho22m/live_laugh_love_sign_zoomed_out/
Стабильно ДАЛЛ-И умеет писать только STOP, вероятно из-за того что в базе была куча именно таких знаков.
https://www.reddit.com/r/dalle2/comments/vhn71a/award_winning_photograph_of_a_stop_sign_that_says/
Это в целом ожидаемо. GPT-3, будучи полностью текстовым, мог фигачить эссе на любые темы, на ломался, если его попросить записать слово задом наперёд. Как я понял из объяснений, беда в том что ИИ воспринимают слова не как слова, и не как буквы, а как токены (что-то среднее). В итоге GPT-3 научили писать слова задом наперед, путем очень сложных многоступенчатых запросов. Думаю, рано или поздно найдут подход и к ДАЛЛ-И, но пока текст он пишет неважно.
Короче, не спешите хоронить артистов, они ещё немного побарахтаются.
В теории может появиться инструмент, упрощающий рисование, вроде современных CAD, где не нужно уметь рисовать тень, цвет и т.п. Вот только вместо умения рисовать теперь приходится изучать физическое двигло, построитель сцен и моделирование, кости, кожу, материалы… и всё равно в некоторых местах дорабатывать напильником, потому что физически более точное выглядит хуже. Причём, сами художники будут понимать что и как нужно изменить для нужного результата гораздо лучше, чем «бездарный шмат плоти», просто потому что их естественная нейросеть этому научена и лучше понимает ИИ. Их труд упростится и это здорово — будут тратить меньше сил и делать больше контента (привет цифровой графике и 3D), а мимокрокодил как рисовал криво, так и будет, просто не кистью, не на планшетике, не 3D-рендером, а текстом-или-чем-там-ещё. А шаблоны… генераторы вроде pivot stickfigure animator уже давно существуют, но поделки из них унылы, равно как и сайты/игры «без программирования».
> Вот только вместо умения рисовать теперь приходится изучать физическое двигло, построитель сцен и моделирование, кости, кожу, материалы…
В том то и дело, что теперь не нужно умение рисовать. Очень скоро художники будут бесполезны ,как кузнецы в индустриализацию. И чёт их знания небыли нужны на станках и они либо спивались, либо самоубивались за ненадобностью. Вот и художников никто спрашивать не будет, будут человеки которые знают как будет "кросива" и пользуясь этими переменными будут тыкать программистов, чтобы те корректировали.
А для цифры и 3D нужен человек с прямыми руками , заточенными НА РИСОВАНИЕ, а не написание кода. И это ДАЛЕКО не упрощение.
>Будут тратить меньше сил и делать больше контента
...................... Тик-ток - минимум сил. максимум контента. Охуенно. "А пахне як!".
и называться будут художниками, в том и суть
» будут тыкать программистов, чтобы те корректировали
у меня на работе сейчас нейросети применяются по минимуму, художники понимают что нужно поменять, но программисты не могут на это повлиять вообще никак. Программисты влияют в том числе и на нейросеть (я тоже программист, но занимаюсь другим, хотя и с нейросеткой работаю довольно активно), но только в виде «вот эти детали можешь не делать точно, а вот здесь приложи побольше усилий», чтобы рендер работал не два часа, а десять минут на нескольких мощных картах и вообще был способен сделать что-то поболее 720p.
» Будут тратить меньше сил и делать больше контента
раньше мультипликация состояла из ручного рисования на бумаге, сейчас плюс-минус переиспользование есть — вот об этом я. А пахучка образуется там, где приходят люди без навыков.
» Достаточно просто 1.5-2 стоки
И получится что-то вроде rage-комиксов, которые всегда в одних позах, с одинаковыми «лицами» и эмоциями. А если приделать генератор случайных чисел, то потеряется необходимая серийность. Ну или те страшные анимации из Андромеды, где людям сказали сделать улыбку — они и сделали. Попробовать изменить один из тысяч параметров будет занимать минут двадцать. Или две в облаке, но за десять баксов.
» В том то и дело, что теперь не нужно умение рисовать
Но должно быть понимание как рисование работает, а оно познаётся… рисованием. Одни механические навыки сменятся на другие, а знания не поменяются.
Для 3D нужен человек, заточенный на 3D. Какие-то принципы общие есть с точки зрения хотя бы той же анимации (вроде искажения формы при повороте), формы живых существ тоже имеют сходные черты, но вот знание особенностей угольного карандаша и акварели вообще никак не помогают с ior-текстурой.
Я не хочу верить в то, что программистам незнакомо чувство "шарма". С приходом 3D в анимацию качество оной "почему то", "неожиданно" резко ухудшилось. Раньше студии выпускали хиты, а сейчас? Есть ли хоть что-то стоящее хотя бы года популярности? я уже не говорю о народной любви. .... нет. и вряд ли будет. Современная мультипликация это шлак и помои вырыгиваемые, преимущественно дриснеем, ради заработка не имеющие художественной ценности и "супер-програмисты" чёт уже 2е десятилетие не могут это исправить, хотя казалось бы теперь и эта ниша теперь в их владении. И пахучка образуется там, где пропадает труд(+качество - уточнение специально для долбоёбов приводящих пример "ложки и полена") человека.
.....*100% MAD*... Да опустить ты чуть ниже, там тебе будут примеры "2 строчки и готово" или это харам?!
Рисование познаётся рисованием ТОЛЬКО для человека, ИИ просто ищет среди миллионов ресурсов и создаёт "чудовище Франкенштейна", благо на последнее десятилетие люди создали достаточно "исходников".
.....*150% MAD*.... Если ТЫ поменяешь яблоко на авокадо.... оно не останется яблоком. Так и навыки КОДИНГА не будут идентичны навыкам РИСОВАНИЯ. Я же уже приводил пример с кузнецами. Их "механические навыки" нахуй никому не впёрлись, за исключением любителей необычного. Но их пока дождёшься налоговики уже и мастерскую разберут.
.....*200% MAD* ... Для 3D нужен..... человек с пространственным мышлением, а он может работать и в 2D. Но зачем он нужен если у нас есть(будет) нейросеть которая генерирует 3D модель чисто по запросу?
Станками сейчас управляют технологи по чертежам конструкторов, работая с сырьём от металлургов, это в первую очередь они и ОТК выдавили кузнецов, причём их стало больше, чем кузнецов, а навыки — сложнее.
» 2 строчки и готово
А ты поверни его плавно (!) так как надо тебе, а не так, как это захотела сеть, по законам мультипликации — по дуге. А уж столько-то процентов того-то — полная чушь сейчас, dall-e не умеет считать больше трёх и намазала просто на свой вкус. Нейросети вообще плохо с числами работают. Этот вопрос, кстати, исследовался, у животных и людей тоже есть ограничение на количество предметов воспринимаемых без счёта. Полноценную анимацию ты тем более не соберёшь без подробного ТЗ, просто потому что сеть будет рисовать либо одного и того же персонажа вообще у всех всегда, либо в каждом кадре будет свой персонаж.
С приходом 3D анимация не ухудшилась, я помню как годные и популярные 2D, так и 3D. И так-то 3D шагает аж с девяностых, а годные м/ф м/с я могу вспомнить преимущественно более поздних лет, но зависит это не от измерений, а от общего прогресса. И я лучше посмотрю бездушный «Рататуй», чем жутко пресный, но «душевный» «Великий мышиный сыщик», оба вполне себе хорошо нарисованы, но сюжет мне больше нравится у первого.
» Рисование познаётся рисованием ТОЛЬКО для человека, ИИ просто ищет среди миллионов ресурсов и создаёт "чудовище Франкенштейна"
Я не устану повторять — ты не понимаешь как работают нейронки. И ЕИ и ИИ одинаково состоят из нейронов/персептронов, коэффициенты которых подправляются со временем, создавая более точный классификатор (где выше нагрузка — там нарастает больше связей, уточняя образ). Они обе компилируют своё прошлое во что-то новое, разница только в том, что у человека этих самых серых клеточек сильно больше и работают они с меньшими затратами энергии. Количество исходников опять же не влияет — точность одной «клетки» ограничена и не так важно «грузишь» ты в неё одну работу, нарисованную человеком на основе того, что он видел за всю жизнь или все те работы, которые он видел.
» Так и навыки КОДИНГА не будут идентичны навыкам РИСОВАНИЯ
Любые навыки идентичны, но не взаимозаменяемы. Нейросети (человеку) пофиг чем управлять, она просто выполняет преобразование информации. Постоянно только количество этой информации. А если обращаться к яблоку и авокадо — они состоят их одних веществ, просто по-разному собраны. Разобрав 50г яблока на атомы ты не соберёшь 100г авокадо, равно как и количество входящей в нейросеть информации соответствует количеству выходящей, это закон математики.
Человек на мой взгляд правильно рассуждает, ибо ИИ хорошо копирует чужой стиль, то есть если скормить ему паки изображений от искандера/cutesexyrobutts, то ИИ очень скоро может делать подобные изображения в хорошем качестве.
Вообщем если и есть кому переживать, то как раз таким патреон артистам и возможно девушкам из онли фанс, учитывая как хорошо делаются реалистичные изображения.
"90% African, 10% Asian man, with purple dreads and circular glasses, alternate clothing, doing a pose for a photoshoot infront of a colorful graffiti wall, 35mm f/1.8"
Humanoid robot with a wolf tail wearing a hyperrealistic wolf fursuit, extremely detailed, natural lighting
Вот одна из наиболее качественных, на мой взгляд, хотя тут конечно проще, т.к. закрыты глаза.
Это тоже dall-e 2 сгенерировала?
https://www.reddit.com/r/dalle2