Эксперты составили портрет типичного хейтера в Рунете
Чаще всего агрессия и агрессивность проявляется на развлекательных молодежных ресурсах и форумах с политической тематикой, выяснили эксперты. Чаще всего кибербуллингом занимаются молодые люди и девушки в возрасте до 19 летАналитический центр Brand Analytics провел исследование кибербуллинга в российских социальных медиа, чтобы определить, какие есть особенности у хейтеров в русскоязычном интернете. Итоги исследования есть в распоряжении РБК.
Brand Analytics использовала два типа материалов из открытых русскоязычных интернет-источников: во-первых, сообщения из соцмедиа за октябрь 2018 года, их общее число превысило 6,8 млн; во-вторых, были проанализировано частотное распределение слов за декабрь того же года.
В компании отмечают, что рассматривали кибербуллинг как одно из проявлений агрессии (наряду с расизмом, харрасментом, сексизмом и пр.), то есть направленного воздействия на объект с целью нанести ему ущерб. В интернете таким воздействием может быть снижение с помощью текста статуса субъекта или объекта сообщения. Также сообщения анализировались на содержание агрессивности, то есть языковой реакции человека на негативное воздействие внешнего окружения или собственную внутреннюю неудовлетворенность.
Из проанализированных почти 7 млн сообщений агрессивность несли около 5%. Эксперты пришли к выводу, что чаще всего агрессия и агрессивность встречаются на развлекательных доменах юношеской возрастной категории (в качестве примеров приводятся 2ch.hk, yap****l.com, pi***u.ru), киберспортивных ресурсах (prodota.ru, dota2.ru и пр.), а также на форумах, где обсуждаются политические темы (echo.msk.ru, politforums.net и др.). При этом на последних уровень агрессии был заметно выше уровня агрессивности. «Иначе говоря, обсуждая политику люди достаточно часто «переходят на личности», — поясняют в Brand Analytics.
Далее в списке с небольшим отставанием идут женские сайты и форумы автолюбителей.
Чаще всего (более 86% сообщений) пользователи, чьи сообщения содержали агрессию, не обращали их против личности, а реагировали таким образом на события. Сообщения с агрессией, направленные на конкретное лицо или группу людей, — 13,9%. Реже всего пользователи соцсетей проявляли агрессию в отношении неодушевленного объекта (около 2,1%).
Как и ожидали аналитики, относительная агрессивность мужской части пользователей оказалась выше, чем женской, а пики агрессивного поведения и у мужской, и у женской части пользователей были зафиксированы в возрастных группах 14–19 лет и 25–35 лет. Максимальный пик — 14 лет, эксперты связали это с тем, что большинство соцсетей допускает регистрацию пользователей только при достижении этого возраста. У пользователей старше 35 лет уровень агрессивности постепенно снижается, однако у женщин вновь поднимается в возрасте 55–65 лет.
Эксперты также установили, что чаще всего пользователи проявляли агрессивность с помощью наречий и междометий (по интенсивности употребления — около 70% от всех частей речи), реже — с помощью глаголов и прилагательных.
Сурс
Подробнее
I. ‘^Скт здНЯ Ъ Ьнщ ,f^oM ПА/^ ^QV0 KIJ^CUßA9)/ - •
экспертное мнение,хейтеры,много текста,интернет,рунет
Еще на тему
А комменты платных троллей они
каквообще отсеивали? Или, может, ещё учли всяких там альтов/твинков?Спарсить тексты комментов и прогнать через какой-нибудь морфемный анализатор для ловли оскорблений - это сейчас модно называть бигдатой и аналитикой, но ценность результатов понятно какая.
Парсер (которых десятки до почти полностью автоматических) настроить на десяток разных сайтов, чтоб текст комментов от html-шаблона чистил?
Или обработка голого текста потом уже давно имеющимся в количестве софтом?
"Исследование" на уровне лабораторной работы первых курсов по программированию.
Вот если бы они паттерны поведения или другие особенности "интернет-почерка" вычисляли, чтоб понять заодно, сколько в комментах мусора, а сколько живых людей, это было бы ценно.
Так можно сказать, что и любое социологическое исследование - взяли, анкетки раздали, любой дурак справится. И программирование туда же. Взял, программу напечатал - ничего сложного.
Парсеров к услугам спамеров написано много. Это многофункциональные комбайны с продвинутым интерфейсом. Загружаешь список урлов (которые можно вытащить тем же парсером или другим), выделяешь блок текста как пример, что нужно. Остальное делает парсер.
никаких "больших" объёмов данных тут нет и не будет.
Объёмы у Яндекса, большие объёмы у Google. Скачать тексты пару десятков тыщ страничек - это получаса до пары часов на офисном калькуляторе с более-менее живым интернетом.
Научно всё давно доказано, алгоритмы анализа текстов давно написаны, оптимизированы и выложены в паблик. От спецбиблиотек для питона и кучи других языков до официальных бесплатных инструментов от того же Яндекса.
В общем, не морочь себе и людям голову.
p.s.
Современная социология на 98% хуита с рисованием циферок.
А про программирование лучше даже не заикайся с таким уровнем знаний и аргументации.
Людей, которые работают в области анализа текстов и текстового поиска, подобное "исследование" только рассмешит. Херню, рассчитанную исключительно на ничего не понимающих в теме, обычно как раз шараги типа упомянутой в стартпосте делают.
https://www.semrush.com/blog/most-common-internal-link-building-mistakes/
"Мы проанализировали 150,000 сайтов со 175 миллионами страниц и 15 миллиардов ссылок ..."
Люди работают и решают прикладные задачи, а не тупо пиарятся на интернет-неграмотности.