у нейросетей странная логика, и чем больше художники и обычные люди будут акцентировать свое внимание на плохих руках и прочих нейросетевых артефактах, тем больше нейросеть убедится что она все делает правильно.
Так это работает только в нейросетях. которые дообучаются в реальном времени.
Большинство популярных генераторов картинок вроде SD обучены заранее и обновляются версиями как любой софт.
Проблема рук имеет несколько аспектов:
- Недостаточное количество картинок с руками в датасете.
- Низкое разрешение датасета (512х512), где на руки обычно приходится слишком мало пикселей если картинка без фокуса на руки.
Скорее, различные ракурсы и количество рук, дающее от 1(кулак с пальцем вверх) до 10(рукопожатие или скрещенные руки с ракурса, когда видны все пальцы обоих рук) пальцев.
Так как нейросеть понятия не имеет про анатомию, и что такое рука, почему на ней пять пальцев, и вообще что такое "пять", выходит вот такая поебень.
И это тоже. У нейронок проблемы так-то не только с количеством пальцев, а с любой сложной последовательной детализацией вроде геометрических узоров, сложной архитектуры вроде готических соборов и сложной симметрии. Руки просто больше бросаются в глаза из за человеческого восприятия. В плане людей что у нейронок неплохо получаются лица так как примеров всегда в избытке и более крупные черты тела имеющие относительно простые формы (конечности, сиськи и т.д).
Да, так как абстрактного мышления, а уж тем более, мышления процессами, у нейронки нет.
Как мы рисуем квадрат?
Ровная линия горизонтально, потом ровно такая же перпендикулярно, и так далее.
Вот этого мышления последовательности действий у нейронки нету, как и всех этих понятий равенства, горизонтально, вертикально.
У неё есть совокупный визуальный образ, который сборная солянка из виденных похожих. Но нет понимания, что это за хуета, и нет попыток логического анализа.
Именно так. Нейронка по сути производит компрессию входящих картинок,разбивая их на черты при помощи матана, а на выходе рандомно собирает картинку по взаимосвязям на основе всех картинок, которые хранятся внутри в сжатом виде. В этом плане нейронки очень хороши для сжатия огромного количества данных одного типа, принцип схожий с популярными форматами, где есть сжатие с потерями, вроде Jpeg или Mp3.
В твоём примере всё органическое и с довольно абстрактными формами, хотя и здесь видно, что клопы на переднем плане отличаются от тех, что дальше, может так задумано, но всё же.
Акцент в воём комменте именно на Последовательной детализации, а это всякие узоры , неорганические вещи такие как сложная архитектура, ну и сложная органика вроде тех же рук.
Художники, вынуждая создателей нн вычеркнуть их имена из нейросети, буквально удаляют себя из истории. Вот, если не ошибаюсь, Грег Рутковски чего этим добился? Да, известный художник, но если хочет продолжать им быть очень долгое время, так чтобы тебя еще долго поминали, лучше бы было принять изменения. Нейронки неизбежно останутся, и с позиции художника лучше запечатлеть свое имя и стиль в ней.
Картины художника остаются в любом случае, а значит и в истории человечества тоже. А в нейронке работы художника будут лишь бесформенной кашей весов из которой машина лепит картинки. Хоть кто-нибудь из разработчиков нейронок опубликовал список художников и фотографов чьи работы были увековечены в нейросетях? Нет, просто безымянный корм для нейронки, только некоторые будут увековечены в качестве тега для имитации оригинала.
Большинство популярных генераторов картинок вроде SD обучены заранее и обновляются версиями как любой софт.
Проблема рук имеет несколько аспектов:
- Недостаточное количество картинок с руками в датасете.
- Низкое разрешение датасета (512х512), где на руки обычно приходится слишком мало пикселей если картинка без фокуса на руки.
Так как нейросеть понятия не имеет про анатомию, и что такое рука, почему на ней пять пальцев, и вообще что такое "пять", выходит вот такая поебень.
Как мы рисуем квадрат?
Ровная линия горизонтально, потом ровно такая же перпендикулярно, и так далее.
Вот этого мышления последовательности действий у нейронки нету, как и всех этих понятий равенства, горизонтально, вертикально.
У неё есть совокупный визуальный образ, который сборная солянка из виденных похожих. Но нет понимания, что это за хуета, и нет попыток логического анализа.
Акцент в воём комменте именно на Последовательной детализации, а это всякие узоры , неорганические вещи такие как сложная архитектура, ну и сложная органика вроде тех же рук.
Лишние руки-ноги мне бы не помешали бы
А нало было на Джой и собирать лайки, эххх