Классификатор хентай картинок
Здравствуй дорогой реактор. Сразу скажу, что далее под катом будет материал +18. Я поставил тег NSFW, но ставить тег хентай, фурри и тд не хочу, т.к. цель этого поста не порно материалы, а рассказать о том, как я познакомился с машинным обучением и как оно мне помогло решить мою реакторавскую боль. Думаю, реакторчанам будет интересно.
Итак. Как полагается тру реакторчанину, у меня есть своя коллекция фап материалов. Она была аккуратно разбита на категории и я их регулярно и аккуратно пополнял последние 5 лет.
Но в какой то момент у меня случилась авария на компе. Результат - все картинки получилось восстановить, но после восстановления только половина архива была разбита по категориям, а вторая часть - оставшиеся картинки, но без своей категории.
Восстанавливать вручную “руками” было неохота, т.к. речь идет о 5’000 картинок. Было бы здорово как-то автоматизировать процесс…
Надо добавить, что по профессии я тыжпрограммист и немного знаком с азами машинного обучения. Так я быстро нашел игрушку от Google - tensorflow. Это библиотека которая позволяет достаточно легко создавать всякого рода классификаторы изображений, которые автоматически может определять “класс” изображения. Вишенка на торте - не нужно писать никакого кода :-)
Работает он по следующему принципу: ты закидываешь ему папки с изображениями одного класса и он обучается распозновать этот класс. Недолго думая, я закинул ему свой архив на обучение.
Сказать что результаты меня поразили - этого ничего не сказать.
Мой архив из 10 000 картинок состоял из следующих категорий: Лоликон, тентакли, хентай, Этти взрослое, Этти лоли, БДСМ, General, 3D, фурри. Определение данных категорий думаю приводить не стоит.
Итак, что в итоге у меня получилось. Прокрутите далее вниз, так как я хотел спрятать NSFW под кат
______________
______________
______________
______________
______________
______________
______________
______________
______________
______________
______________
Эту картинку я бы определил как хентай, т.к. стиль рисовки хентайный, но девушка не лоли:
hentai.jpeg
Вот что мне выдал мой классификатор:
hentai_ml.jpeg
Вот картинка из General. Тут мы увидим простые порно фото половых актов или эротику. в даном случае это просто эротическое фото
Классификатор выдал:
Вот эту картинку, я бы определил как фурри. Имеем 2 человекоподобных фурри разного пола.
фурри.jpeg
Вот что мне выдал мой классификатор:
furry_ml.jpeg
Эту картинку я бы определил как Лоликон. Девушка виглядит молодой, маленькая грудь и гладко выбритый лобок:
Вот что мне выдал мой классификатор:
loli_ml.jpeg
Сразу надо сказать, что разница между хентаем и лоликоном очень размыта. Иногда я сам могу по разному оценивать одни и те же картинки, но все равно поразительно как машина близко угадывает правильные теги
Удивительно не правда ли :)
Машина реально научилась распознавать классы хентая и порно картинок так как я этого хочу и выдает достаточно точные результаты.
Я сейчас добавлю в комментах еще немного примеров распознавания классов по другим категориям
Машины поработят этот мир. я в этом не сомневаюсь.
но у меня хотя бы будет моя коллекция картиночек которую машины милостливо для меня распределили :0
Подробнее
version 9. Use tf.nn.batch_normalization(). hentai (score = 0.46495) ecchi adult (score = 0.19789) lolicon (score = 0.15593) bdsm (score = 0.04990) ecchi loli mix (score = 0.04061)
JT" vi À
general (score = 0.86378) 3d all (score = 0.12632) lolicon (score = 0.00375) ecchi loli mix (score = 0.00165) ecchi adult (score = 0.00140)
atchNormWithGlobalNormalization is deprecated. It will cease to work in GraphDef version 9. Use tf.nn.batch_normalization(). furry (score = 0.86602) bdsm (score = 0.08940) hentai (score = 0.01532) ecchi adult (score = 0.01210) tentacles (score = 0.00744)
lolicon (score = 0.40534) hentai (score = 0.24213) tentacles (score = 0.12034) bdsm (score = 0.09925) ecchi loli mix (score = 0.05603)
программирование,it,машинное обучение,Искусственный Интеллект,Google,удалённое
удалил и перезалью завтра с новыми тегами