Добавление тега "Баян". / dev :: личное :: лично :: реализовано :: закрыто

dev закрыто реализовано лично личное 
Добавление тега "Баян".

В общем - есть такая идея. Чтоб на реакторе была хэшированная база изображений. Суть следующая.
Слоупок, добавляющий пост с изображением, которое уже светилось ранее на реакторе, автоматом к посту получает тег "баян".

Реализация весьма банальна и вроде не сильно ресурсо-емкая.
Каждое новое изображение, обрабатывается функцией хэширования (md5, sha1, sha256, sha512 или другими не ресурсоемкими операциями) и отправляется в NoSQL хранилище с ключом этого хэша.

Если хэша в БД нету, то изображение НЕ получает тег "боян", иначе получает. Так можно будет частично освободить ленту, от баянов.

Крупная проблема:
1) баянистое изображение должно быть идентичным, тому что ранее размещалось. Т.е. 100% совпадение.
Думаю с такой фичей можно будет отрезать 15-20% баянов.
2) Существующая база изображений может обрабатываться либо ночью, либо просто забить на старые изображения и вылавливать только новые баяны.

Идея оставляю на рассуждение администрации и общества.

Подробнее
dev,закрыто,реализовано,лично,личное
Еще на тему
Развернуть
при добавлении новой фотки надо проверку делать...
gourojou gourojou 07.11.201211:51 ответить ссылка 0.0
NoSQL БД быстрые и даже среди 10.000.000 записей, поиск 32-64-256 символьного хэша будет очень быстрый. Счет будет идти на 0,01 секунды. Так что проверка не страшна в плане производительности.

И еще фишка в том, что основной сайт не будет страдать, т.к. основная БД (MySQL, PostgreeSQL или другие SQL) не затронуты.

По этому проверка не является затруднительной.
Отличная идея. Поддерживаю
Goster Goster 07.11.201211:53 ответить ссылка 0.2
faq в тэги
zorgED zorgED 07.11.201211:55 ответить ссылка -0.2
Причем тут FAQ?
Учитывая что FAQ расшифровывается как - Frequently Asked Question
Бывает, что приходится переделывать свой собственный пост, что-то подправить, что-то изменить. И когда постишь собственный материал (слегка видоизменённый), срабатывает анти-баян. Такое бывает не часто, но всё же бывает. И тег баян будет явно не к месту. Сможете обойти этот нюанс - ради б-га, делайте. Нет - нахуй!
по хэшу глупо проверять, достаточно размер изменить или вырезать один пиксель и тэг "баян" не будет добавлен.

тогда уж надо прикручивать метод поиска похожих изображений (как у Гугла например и не только). тогда при добавлении картинки она будет пропускаться через этот алгоритм и сравнивать новую картинку с уже имеющимися на сайте.

или можно просто научить всех ньюфагов как в гугле искать картинки не во всем инете а только на этом сайте.
SunRabbit SunRabbit 07.11.201211:57 ответить ссылка -0.9
слоупок. попробуй запостить картинку с реактора на реактор. 100% дубли отсекает сразу
Спасибо админу, что обозвал слоупоком, но при чем тут постинг с "реактора" на "реактор".

За все время, выскочила эта фича - аж один раз. Хотя постил баяны пару раз.
Или вы уже реализовали подобный алгоритм отсечения старых записей?
наш антибаян срабатывает на точные совпадения. если хоть 1 пиксель не тот, уже не срабатывает.
сделать антибаян получше можно, но сложно.
Согласен, т.к. сами по себе, операции с изображениями закрыты.

А что на счет тега "баян"?
Имеет место быть?
Такс, тема закрыта, по причине реализованности.

Единая просьба к Re-l, все ж таки добавлять тег "баян" к таким дублям.
новые псты просто не постятся, ежели это баян. а если на главной вспылвает баян, мы его убираем с помощью админского тега "повтор"
Только зарегистрированные и активированные пользователи могут добавлять комментарии.
Похожие темы

Похожие посты
НапехуоН
выпечка еда МБРУУ кулинария гуро секретные разделы
подробнее»

спам в тегах реактор теги dev

НапехуоН выпечка еда МБРУУ кулинария гуро секретные разделы