Под недавним постом меня снова попинали на тему того, как хуево работает баянометр и все такое. / баянометр

баянометр 

Под недавним постом меня снова попинали на тему того, как хуево работает баянометр и все такое. О его недостатках мне хорошо известно, но, к сожалению это просто ограничения алгоритма который используется(pHash). Соответственно что бы от них избавиться - нужно заменять алгоритм, заново собирать новую базу и т.д. В качестве тестов уже был испробован ORB и SURF, и разные варианты на их основе. Они себя неплохо показали, особенно с поиском кропнутых картинок, но, когда речь заходит о другой деформации картинки в лице шакалов или ватермарков - начинаются большие проблемы. Даже незначительное шакальство они переваривают плохо и начинают давать в разы больше ложно положительных результатов, или наоборот не находить то, что точно должны. Был испробован другой алгоритм, использующий акселерацию ресурсами GPU. Он себя показал неплохо, но требует просто дохуища ресурсов, а без них - просто неюзабелен, ибо время поиска даже на тестовом, не особо большом объеме данных, достигало минут. Арендовать сервер с GPU крайне недешевое удовольствие, потому отпал как вариант. Сейчас на примете есть несколько еще алгоритмов которые можно было бы попробовать, и которые не на столько жрущие, но все ровно сулят существенным увеличением требований к серверу, потому решил провести опрос, дабы понимать вообще стоит тратить время на тесты и проработку вариантов, или оставляем как есть.

Текущий сервер на котором крутиться баянометр обходиться 12$/месяц. Его хватает с достаточным запасом, а благодаря трем реакторчанам на патреоне я могу снять с себя вопрос содержания сервера, за что им отдельное спасибо. Предполагаемая стоимость аренды сервера которого будет достаточна для +- адекватной роботы с терпимой скоростью поиска лежит в диапазоне 40-70$. Брать на себя полную ответственность за спонсирование этого я не готов, потому решил спросить у вас, готовы ли вы оплачивать содержание этого добра, если это будет реализовано. Метод оплаты - patreon / buymeacoffee. Отвечайте пожалуйста честно, с расчетом на своим реальные возможности, а так же учитывая среднесрочное прогнозирование. Спасибо


Подробнее
баянометр
Готовы ли вы спонсировать содержание сервера баянометра
Да, готов. Могу позволить выделить на это 10$/мес. без какого либо дискомфорта
20 (1.7%)
Да, готов. Мой комфортный придел - 3$ или около того
55 (4.6%)
Мне бы хотелось что бы это было реализовано, но на финансовую поддержку действа я не готов
263 (22.1%)
Забей хуй, и так нормально все работает, а те косяки которые есть - терпимы
851 (71.6%)
Еще на тему
Развернуть
Тем кому похуй листают дальше молча.
Нет! Прошу прощенья, я не могу об этом молчать!!!
ExtraDJ ExtraDJ 01.07.202302:22 ответить ссылка 12.0
Где вариант "Я Стас" ?
vover vover 01.07.202302:33 ответить ссылка 1.6
Он есть, но его видят только Стасы.
А как стать Стасом?
Стас - это состояние души. Это нельзя понять или научиться. Либо дано, либо не дано.
Прямо как Олег
Макет?
ГДЕ?!
*Захеканий мудило*: "Там!" - помирає.
а нельзя просто 3 простых алгоритмов использовать? и на основе пересечения между ними распологать выдачу в порядке убывания вероятности совпадения с искомым вариантом.
Вот тебе тянка, вот тебе жопа тянки, вот тебе жопа тянки с цветокором, вот тебе жопа тянки спижженая с какого то гавносайта с 3 ватермарками одна поверх другой
Комбинированные неплохая идея, но скорее полумера. Потому что pHash покрывает деформации изображения, а тот же ORB покрывает существенный кроп. Понятное дело что результаты поиска будут лучше, но хотелось бы внедрять решение которое покрывает большинство проблем
ну это то понятно, что лучше одно универсальное решение
а вариант зашить баянометр в реактор и подписать вождя на него?
fghjk fghjk 01.07.202302:54 ответить ссылка 1.3
Да не, бред какой-то
lumen lumen 01.07.202304:10 ответить ссылка 5.3
При чем тут видеоплеер... При чем тут реклама... Что бы заработать на Бентли мне нужно было выбрать другой сайт. Onlyfans называется. А то что я делаю тут - делаю себе в убыток, потому что за время потраченное на эти плюшки можно было заработать реально на машину, пускай и не на бентли
ExtraDJ ExtraDJ 01.07.202303:05 ответить ссылка 10.5
Есть вещи которыми хочется позаниматься просто потому что интересно, а не ради денег. Надоест - буду заниматься чем то другим
Так это же восхитительно, а я тут просто размечтался о развитии сайта. Мне нравится реактор. Если добьюсь приличного заработка - задоню на баллон с кислородом для сервера.
Ну тогда
нельзя просто чатгпт спрашивать "это баян или не?" ?
chaky chaky 01.07.202303:36 ответить ссылка -1.8
Лучше тогда визуальный поиск гугла. И находить он будет только реальные физические баяны :3
yoburg yoburg 01.07.202303:41 ответить ссылка 0.1
Находить он будет херню, которую попытается тебе продать в онлайн магазинах.
Кроме шуток, вариант был бы неплохой. Но для него все шаблонные мемы с разным текстом - на одно лицо.
И чат такой:
А можно сделать по иному - накидать на банку денег на 1-3 месяца чтобы проверить это предположение с гпу в долгую

если сработает - то уже предлагать финансировать на постоянку показывая результат что в тестовом режиме баяны не проходили
Точно не сработает. Я в этом сумме сильно сомневаюсь, а сервер с подходящей GPU это 150$+
Слишком дорогое удовольствие
Большинство считает, что баянометр работает? Вы тут все больные на голову, или это рейтинг поддержки вождя?
Большинству просто естественно состояние "забей хуй". Как-то он работает. Где не работает, помогают пидоры в комментах. Сейчас особого вала дубликатов не наблюдается... спрашивается, нахуя напрягаться?
*голосом из Червячков* Промазал!
Perceptual hash бывает разный, потому интересно почитать про то, какой был выбран. И он игнорирует цвета, сохраняя лишь грубый силуэт в хэше. Есть ещё RGB Histogram, простейший хэш, сохраняющий распределение цветов в картинке, соответственно устойчив к любым трансформациям. Возможно, что склеив их получится что-то сделать.
Плюс, вспоминаю статью чуваков, которым понадобилось находить кропнутые кадры из видео. Они сохраняли в базу phash сделанный с небольшим отступом от краёв кадра. А потом, при сравнении, входное изображение аугментировали, обрезая с разных сторон.
orekh orekh 01.07.202307:43 ответить ссылка 0.1
Не знаю что тебе на это ответить. pHash есть pHash
RGB Histogram - худшее из возможных решений. Не пережевывает цветокор, пережатие изображения, ватермарки как и кроп. А еще скриншоты из всякого твиттера передают привет, с одинаковыми показателями.
Угадывать как могло быть обрезано изображение... Да наверное можно, но эффективность такого метода сомнительна + очень затратна по времени
pHash, если дашь ссылку на используемую либу, то прекрасно.
А насчёт затрат времени, поиск идёт за O(n) или O(log(n))?
orekh orekh 01.07.202316:05 ответить ссылка 0.1
Я не использую готовую либу. Какая то была взята за основу и потом допиливалась. Какая - не помню. Поиск по готовым хеша - базируется на этой статье https://habr.com/ru/articles/211264/
с некоторыми изменениями, в лице поддержки регенерации всей базы на лету
Может стоит собирать сразу на год хостинга ? И раз в год поднимать этот вопрос ?
Чтобы не получилось так, что уважаемые пидоры не рассчитали свои реальные возможности и через пару месяцев, даже из пожертвований по $3 не набралось нужной суммы.
sniger1 sniger1 01.07.202308:51 ответить ссылка 0.7
Может быть, собрать собственный сервер с GPU, может прям с Китая, объединить всё с основным сервером JoyReactor, и заказать колокацию? Просто Mind-storm идея так сказать.
Hantivic Hantivic 01.07.202309:20 ответить ссылка -0.2
нету варианта "уже спонсирую", поэтому "да, готов"
pils pils 01.07.202309:26 ответить ссылка 1.3

Насколько мне не изменяет память, самым эффективным алгоритмом был SIFT. ORB и SURF не дают такой точности, но и работают быстрее. Вся проблема SIFT - он отрабатывает на CPU 1-3 секунды, если картинки имеют большое количество одинаковых кейпоинтиов. Плюс надо использовать FlannBasedMatcher.knnMatch (для SURF тоже, а вот для ORB юзают BFMatcher). Дальше отбираешь только хорошие кейпоинты, а потом их решейпишь. В итоге на 3 значениях решаешь, баян или нет.

matches = matcher.knnMatch(des1, des2, k=2)
good = [m for m, n in matches if m.distance < 0.6 * n.distance]
src_pts = np.float32([kp1[m.queryIdx].pt for m in good]).reshape(-1, 1, 2)
dst_pts = np.float32([kp2[m.trainIdx].pt for m in good]).reshape(-1, 1, 2)

Перед сравнением картинки надо перегнать в COLOR_BGR2GRAY, сделать normalize с NORM_MINMAX, потом equalizeHist.

Из вариантов для GPU есть такая моча https://arxiv.org/abs/2112.02906
Работает в разы быстрее SIFT/ORB/SURF, запущенных на cuda_backend, но опять таки нужна видеокарта.

MrJack31 MrJack31 01.07.202311:45 ответить ссылка 0.1
В том то и проблема, что нужен быстрый поиск. То что сейчас есть позволяет ворочать 7 лямов картинок
Проверил еще раз SIFT и поиск через knnMatch
Проверка 10к картинок - 2.5 минуты. Итого, для всей базы в 7 лямов картинок - больше суток
И это при заранее известных кейпоинтах, а не перегенерации
Я реактор на патреоне не поддерживаю, потому что он кредитную карту требует. 240р я готов выделить на спонсирование (да я мог бы и ещё за одного пидора потянуть взнос), но не через эти сервисы.

платить за то что не работает постоянно?

баяны когда постит школота по не знанию, то их минусят, а когда олдфаги и кармодрочены, то в коментах пишут, что то подобное "это древний баян и пришло время его запостить." то он улетает в плюсы.

Так что единственный баянометр который работает - это бесплатные местные пидоры.

не хватает вариант "поддержать готов, но patreon / buymeacoffee не подходят"
Ascard Ascard 10.07.202312:13 ответить ссылка 0.0
Только зарегистрированные и активированные пользователи могут добавлять комментарии.
Похожие темы

Похожие посты
SeaBIOS (version re 1-1.S.3-0-ge2fc41e-prebuiIt.qemu-project.org) Machine UUID 24d5244c-48ec-4475-8a41-ade944c4e00c Booting from Hard Disk...
Boot failed: not a bootable disk
No bootable device. Retrying in 1 seconds.
iayanometr:/srv # touch test
touch: cannot touch 'test': Read-only file sy
подробнее»

баянометр длиннопост

SeaBIOS (version re 1-1.S.3-0-ge2fc41e-prebuiIt.qemu-project.org) Machine UUID 24d5244c-48ec-4475-8a41-ade944c4e00c Booting from Hard Disk... Boot failed: not a bootable disk No bootable device. Retrying in 1 seconds. iayanometr:/srv # touch test touch: cannot touch 'test': Read-only file sy
■ Demo application ImageHash
□
X
: [[«*>■ Dl ^ [□]	. {o}6 I (2) <
AverageHash DifferenceHash Perceptual Hash
Browse
Load
Clear
73051550389305359
1112177781819418778
14419936282921065570
AverageHash DifferenceHash PerceptualHash Browse Load
Clear
73051550389305359
1112177781817321882
подробнее»

баянометр разработка длиннопост

■ Demo application ImageHash □ X : [[«*>■ Dl ^ [□] . {o}6 I (2) < AverageHash DifferenceHash Perceptual Hash Browse Load Clear 73051550389305359 1112177781819418778 14419936282921065570 AverageHash DifferenceHash PerceptualHash Browse Load Clear 73051550389305359 1112177781817321882
URL
http://img08.deviantart.net/480e/i/2016/037/4/d/rose_andJissa_by_may12324-d9qot0v.jpg
ФАЙЛ
ч/
I Начать поиск картинки
Сервер не может загрузить картинку; undefined
■ Картинка не выбрана
Картинка не выбрана Картинка не выбрана
Сервис недоступен.
КАК ЭТО РАБОТАЕТ
подробнее»

баянометр баянометр молчал баг не работает dev реактор

URL http://img08.deviantart.net/480e/i/2016/037/4/d/rose_andJissa_by_may12324-d9qot0v.jpg ФАЙЛ ч/ I Начать поиск картинки Сервер не может загрузить картинку; undefined ■ Картинка не выбрана Картинка не выбрана Картинка не выбрана Сервис недоступен. КАК ЭТО РАБОТАЕТ

Original
Content