Под недавним постом меня снова попинали на тему того, как хуево работает баянометр и все такое. / баянометр

Под недавним постом меня снова попинали на тему того, как хуево работает баянометр и все такое. О его недостатках мне хорошо известно, но, к сожалению это просто ограничения алгоритма который используется(pHash). Соответственно что бы от них избавиться - нужно заменять алгоритм, заново собирать новую базу и т.д. В качестве тестов уже был испробован ORB и SURF, и разные варианты на их основе. Они себя неплохо показали, особенно с поиском кропнутых картинок, но, когда речь заходит о другой деформации картинки в лице шакалов или ватермарков - начинаются большие проблемы. Даже незначительное шакальство они переваривают плохо и начинают давать в разы больше ложно положительных результатов, или наоборот не находить то, что точно должны. Был испробован другой алгоритм, использующий акселерацию ресурсами GPU. Он себя показал неплохо, но требует просто дохуища ресурсов, а без них - просто неюзабелен, ибо время поиска даже на тестовом, не особо большом объеме данных, достигало минут. Арендовать сервер с GPU крайне недешевое удовольствие, потому отпал как вариант. Сейчас на примете есть несколько еще алгоритмов которые можно было бы попробовать, и которые не на столько жрущие, но все ровно сулят существенным увеличением требований к серверу, потому решил провести опрос, дабы понимать вообще стоит тратить время на тесты и проработку вариантов, или оставляем как есть.

Текущий сервер на котором крутиться баянометр обходиться 12$/месяц. Его хватает с достаточным запасом, а благодаря трем реакторчанам на патреоне я могу снять с себя вопрос содержания сервера, за что им отдельное спасибо. Предполагаемая стоимость аренды сервера которого будет достаточна для +- адекватной роботы с терпимой скоростью поиска лежит в диапазоне 40-70$. Брать на себя полную ответственность за спонсирование этого я не готов, потому решил спросить у вас, готовы ли вы оплачивать содержание этого добра, если это будет реализовано. Метод оплаты - patreon / buymeacoffee. Отвечайте пожалуйста честно, с расчетом на своим реальные возможности, а так же учитывая среднесрочное прогнозирование. Спасибо

Подробнее
баянометр

Готовы ли вы спонсировать содержание сервера баянометра

Да, готов. Могу позволить выделить на это 10$/мес. без какого либо дискомфорта
	20 (1.7%)
Да, готов. Мой комфортный придел - 3$ или около того
	55 (4.6%)
Мне бы хотелось что бы это было реализовано, но на финансовую поддержку действа я не готов
	263 (22.1%)
Забей хуй, и так нормально все работает, а те косяки которые есть - терпимы
	851 (71.6%)

Еще на тему

баянометр(177)

Развернуть

Комментарии 5101.07.202302:14ссылка20.2

Тем кому похуй листают дальше молча.

Forest Gimp 01.07.202302:21 ответить ссылка ↑ 20.8

Нет! Прошу прощенья, я не могу об этом молчать!!!

Sal1500900 01.07.202302:56 ответить ссылка ↑ 13.0

ExtraDJ 01.07.202302:22 ответить ссылка ↑ 12.0

Где вариант "Я Стас" ?

vover 01.07.202302:33 ответить ссылка 1.6

Он есть, но его видят только Стасы.

IvanDolgunA 01.07.202303:33 ответить ссылка ↑ 8.5

А как стать Стасом?

Eyeball 01.07.202304:19 ответить ссылка ↑ 1.1

Стас - это состояние души. Это нельзя понять или научиться. Либо дано, либо не дано.

IvanDolgunA 01.07.202304:27 ответить ссылка ↑ 1.7

Прямо как Олег

Silendor 01.07.202304:29 ответить ссылка ↑ 3.8

Макет?

krololo11 01.07.202307:32 ответить ссылка ↑ 2.3

ГДЕ?!

Койкого 04.07.202314:49 ответить ссылка ↑ 0.0

*Захеканий мудило*: "Там!" - помирає.

Tezcatlipoca 04.07.202315:48 ответить ссылка ↑ 0.0

а нельзя просто 3 простых алгоритмов использовать? и на основе пересечения между ними распологать выдачу в порядке убывания вероятности совпадения с искомым вариантом.

Вирус лени 01.07.202302:53 ответить ссылка 0.0

Вот тебе тянка, вот тебе жопа тянки, вот тебе жопа тянки с цветокором, вот тебе жопа тянки спижженая с какого то гавносайта с 3 ватермарками одна поверх другой

ExtraDJ 01.07.202302:55 ответить ссылка ↑ 0.7

Комбинированные неплохая идея, но скорее полумера. Потому что pHash покрывает деформации изображения, а тот же ORB покрывает существенный кроп. Понятное дело что результаты поиска будут лучше, но хотелось бы внедрять решение которое покрывает большинство проблем

ExtraDJ 01.07.202302:59 ответить ссылка ↑ 1.6

ну это то понятно, что лучше одно универсальное решение

Вирус лени 01.07.202303:02 ответить ссылка ↑ 0.2

а вариант зашить баянометр в реактор и подписать вождя на него?

fghjk 01.07.202302:54 ответить ссылка 1.3

Да не, бред какой-то

lumen 01.07.202304:10 ответить ссылка ↑ 5.3

При чем тут видеоплеер... При чем тут реклама... Что бы заработать на Бентли мне нужно было выбрать другой сайт. Onlyfans называется. А то что я делаю тут - делаю себе в убыток, потому что за время потраченное на эти плюшки можно было заработать реально на машину, пускай и не на бентли

ExtraDJ 01.07.202303:05 ответить ссылка ↑ 10.5

Есть вещи которыми хочется позаниматься просто потому что интересно, а не ради денег. Надоест - буду заниматься чем то другим

ExtraDJ 01.07.202317:56 ответить ссылка ↑ 2.7

Так это же восхитительно, а я тут просто размечтался о развитии сайта. Мне нравится реактор. Если добьюсь приличного заработка - задоню на баллон с кислородом для сервера.

Альтернатива 01.07.202318:13 ответить ссылка ↑ -0.9

Ну тогда

ExtraDJ 05.07.202300:04 ответить ссылка ↑ 0.0

нельзя просто чатгпт спрашивать "это баян или не?" ?

chaky 01.07.202303:36 ответить ссылка -1.8

Лучше тогда визуальный поиск гугла. И находить он будет только реальные физические баяны :3

yoburg 01.07.202303:41 ответить ссылка ↑ 0.1

Находить он будет херню, которую попытается тебе продать в онлайн магазинах.

iHronos 01.07.202309:59 ответить ссылка ↑ 2.3

Кроме шуток, вариант был бы неплохой. Но для него все шаблонные мемы с разным текстом - на одно лицо.

Койкого 04.07.202314:51 ответить ссылка ↑ 0.0

И чат такой:

ссылка на гифку

Jack Shadow 02.07.202318:01 ответить ссылка ↑ 0.3

А можно сделать по иному - накидать на банку денег на 1-3 месяца чтобы проверить это предположение с гпу в долгую

если сработает - то уже предлагать финансировать на постоянку показывая результат что в тестовом режиме баяны не проходили

4ever_free 01.07.202303:49 ответить ссылка 0.4

Точно не сработает. Я в этом сумме сильно сомневаюсь, а сервер с подходящей GPU это 150$+
Слишком дорогое удовольствие

ExtraDJ 01.07.202303:55 ответить ссылка ↑ 1.0

Большинство считает, что баянометр работает? Вы тут все больные на голову, или это рейтинг поддержки вождя?

conversant 01.07.202306:56 ответить ссылка -1.8

Большинству просто естественно состояние "забей хуй". Как-то он работает. Где не работает, помогают пидоры в комментах. Сейчас особого вала дубликатов не наблюдается... спрашивается, нахуя напрягаться?

Vlad_Hm 01.07.202309:11 ответить ссылка ↑ 2.1

ExtraDJ 01.07.202311:45 ответить ссылка ↑ 7.0

*голосом из Червячков* Промазал!

Jack Shadow 02.07.202318:03 ответить ссылка ↑ 0.1

Perceptual hash бывает разный, потому интересно почитать про то, какой был выбран. И он игнорирует цвета, сохраняя лишь грубый силуэт в хэше. Есть ещё RGB Histogram, простейший хэш, сохраняющий распределение цветов в картинке, соответственно устойчив к любым трансформациям. Возможно, что склеив их получится что-то сделать.
Плюс, вспоминаю статью чуваков, которым понадобилось находить кропнутые кадры из видео. Они сохраняли в базу phash сделанный с небольшим отступом от краёв кадра. А потом, при сравнении, входное изображение аугментировали, обрезая с разных сторон.

orekh 01.07.202307:43 ответить ссылка 0.1

Не знаю что тебе на это ответить. pHash есть pHash
RGB Histogram - худшее из возможных решений. Не пережевывает цветокор, пережатие изображения, ватермарки как и кроп. А еще скриншоты из всякого твиттера передают привет, с одинаковыми показателями.
Угадывать как могло быть обрезано изображение... Да наверное можно, но эффективность такого метода сомнительна + очень затратна по времени

ExtraDJ 01.07.202311:51 ответить ссылка ↑ 0.1

pHash, если дашь ссылку на используемую либу, то прекрасно.
А насчёт затрат времени, поиск идёт за O(n) или O(log(n))?

orekh 01.07.202316:05 ответить ссылка ↑ 0.1

Я не использую готовую либу. Какая то была взята за основу и потом допиливалась. Какая - не помню. Поиск по готовым хеша - базируется на этой статье https://habr.com/ru/articles/211264/
с некоторыми изменениями, в лице поддержки регенерации всей базы на лету

ExtraDJ 01.07.202318:05 ответить ссылка ↑ 0.0

Может стоит собирать сразу на год хостинга ? И раз в год поднимать этот вопрос ?
Чтобы не получилось так, что уважаемые пидоры не рассчитали свои реальные возможности и через пару месяцев, даже из пожертвований по $3 не набралось нужной суммы.

sniger1 01.07.202308:51 ответить ссылка 0.7

Может быть, собрать собственный сервер с GPU, может прям с Китая, объединить всё с основным сервером JoyReactor, и заказать колокацию? Просто Mind-storm идея так сказать.

Hantivic 01.07.202309:20 ответить ссылка -0.2

нету варианта "уже спонсирую", поэтому "да, готов"

pils 01.07.202309:26 ответить ссылка 1.3

Насколько мне не изменяет память, самым эффективным алгоритмом был SIFT. ORB и SURF не дают такой точности, но и работают быстрее. Вся проблема SIFT - он отрабатывает на CPU 1-3 секунды, если картинки имеют большое количество одинаковых кейпоинтиов. Плюс надо использовать FlannBasedMatcher.knnMatch (для SURF тоже, а вот для ORB юзают BFMatcher). Дальше отбираешь только хорошие кейпоинты, а потом их решейпишь. В итоге на 3 значениях решаешь, баян или нет.

matches = matcher.knnMatch(des1, des2, k=2)
good = [m for m, n in matches if m.distance < 0.6 * n.distance]
src_pts = np.float32([kp1[m.queryIdx].pt for m in good]).reshape(-1, 1, 2)
dst_pts = np.float32([kp2[m.trainIdx].pt for m in good]).reshape(-1, 1, 2)

Перед сравнением картинки надо перегнать в COLOR_BGR2GRAY, сделать normalize с NORM_MINMAX, потом equalizeHist.

Из вариантов для GPU есть такая моча https://arxiv.org/abs/2112.02906
Работает в разы быстрее SIFT/ORB/SURF, запущенных на cuda_backend, но опять таки нужна видеокарта.

MrJack31 01.07.202311:45 ответить ссылка 0.1

В том то и проблема, что нужен быстрый поиск. То что сейчас есть позволяет ворочать 7 лямов картинок

ExtraDJ 01.07.202312:29 ответить ссылка ↑ 0.1

Проверил еще раз SIFT и поиск через knnMatch
Проверка 10к картинок - 2.5 минуты. Итого, для всей базы в 7 лямов картинок - больше суток
И это при заранее известных кейпоинтах, а не перегенерации

ExtraDJ 04.07.202319:39 ответить ссылка ↑ 0.0

Я реактор на патреоне не поддерживаю, потому что он кредитную карту требует. 240р я готов выделить на спонсирование (да я мог бы и ещё за одного пидора потянуть взнос), но не через эти сервисы.

Хермоус Мора 01.07.202312:19 ответить ссылка 0.3

платить за то что не работает постоянно?

баяны когда постит школота по не знанию, то их минусят, а когда олдфаги и кармодрочены, то в коментах пишут, что то подобное "это древний баян и пришло время его запостить." то он улетает в плюсы.

Так что единственный баянометр который работает - это бесплатные местные пидоры.

гость 01.07.202312:41 ответить ссылка 1.4

не хватает вариант "поддержать готов, но patreon / buymeacoffee не подходят"

Ascard 10.07.202312:13 ответить ссылка 0.0

Только зарегистрированные и активированные пользователи могут добавлять комментарии.

Похожие темы

dev

Баян

реактор

NSFW

Баянометр

Фендомы

Fallout

Rick and Morty

League of Legends

Тренды

Новый Год

S.T.A.L.K.E.R

Arcane (LoL)

Похожие посты

SeaBIOS (version re 1-1.S.3-0-ge2fc41e-prebuiIt.qemu-project.org) Machine UUID 24d5244c-48ec-4475-8a41-ade944c4e00c Booting from Hard Disk...
Boot failed: not a bootable disk
No bootable device. Retrying in 1 seconds.
iayanometr:/srv # touch test
touch: cannot touch 'test': Read-only file sy

подробнее»

$■ Demo application ImageHash □ X : [[«*>■ Dl ^ [□] . {o}6 I (2) < AverageHash DifferenceHash Perceptual Hash Browse Load Clear 73051550389305359 1112177781819418778 14419936282921065570 AverageHash DifferenceHash PerceptualHash Browse Load Clear 73051550389305359 1112177781817321882$

подробнее»