враждебные высказывания вк это что
ВКонтакте тестирует нейросеть для борьбы с языком вражды
ВКонтакте работает над искусственным интеллектом для автоматического распознавания материалов с хейтспичем — враждебными высказываниями. Технология призвана ускорить время обработки жалоб и помочь пользователям реже сталкиваться с проявлениями нетерпимости.
Новая нейросеть поможет быстрее находить материалы с враждебными высказываниями, а также публикации, которые провоцируют аудиторию проявлять агрессию. Нейросеть учится определять самые разные категории оскорблений и угроз. Среди них — проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.
Чтобы усилить модерацию по теме языка ненависти и обучить искусственный интеллект, ВКонтакте добавила новую категорию жалоб — «Враждебные высказывания». Пользователь может выбрать её, если нажмёт кнопку «Пожаловаться» у оскорбительной публикации. После этого материал попадёт на рассмотрение к модераторам. Эта категория позволит точнее откалибровать уже существующие инструменты и собрать датасет для новых решений на основе нейросетей. При этом команды Модерации и Поддержки не только реагируют на жалобы, но и проводят проактивный внутренний мониторинг — в частности, с помощью механизмов автоматического поиска, технологии цифровых отпечатков и нейронных сетей.
Иван Корнеев, руководитель команды модерации ВКонтакте:
«Мы разделяем позицию наших пользователей и партнёров касательно языка вражды и прославления насилия. Модераторы ВКонтакте ежедневно обрабатывают огромный объём контента, в том числе с использованием искусственного интеллекта — большинство опасных материалов удаляются ещё до того, как их кто-то увидит. Если же вы заметили оскорбительную публикацию, пожалуйтесь на неё. С проявлениями нетерпимости эффективнее бороться вместе — и мы призываем пользователей присоединяться к нам в этой борьбе».
За первую половину 2020 года на платформе было удалено 520 тысяч единиц контента по теме разжигания вражды и ненависти, а также заблокировано 1340 профилей и 2470 сообществ, распространяющих враждебные высказывания.
ВКонтакте представил фильтр враждебных комментариев и высказываний
ВКонтакте начал выкатывать фильтр враждебных комментариев для всех сообществ. Напомним, что соцсеть проводила тестирование данной функции ещё осенью прошлого года.
Под фильтр попадают комментарии, в которых содержатся угрозы: например, пожелания смерти или обещания причинить вред здоровью. В дальнейшем фильтр научится распознавать травлю по национальному и религиозному принципу.
Рекомендуем: Click.ru – маркетплейс рекламных платформ:
Как включить и настроить фильтр враждебных комментариев
Фильтр можно включить или выключить в любой момент. Чтобы включить фильтр, зайдите в управление сообществом, откройте вкладку «Комментарии» в разделе «Настройки».
Поставьте галочку напротив поля «Фильтр враждебных высказываний».
Сделать это можно только в версии ВКонтакте для компьютера. Там же вы сможете увидеть все отсеянные комментарии и восстановить их или отправить автора в чёрный список.
По мнению разработчиков, что это поможет снизить враждебность — оградить подписчиков от травли и сделать группы ещё более приятным и дружелюбным местом.
Ранее ВКонтакте позволил создавать сайты из групп, а в еженедельных отчётах по сообществам появился блок «Рекламные показатели».
Враждебные высказывания вк это что
«Вконтакте» начала тестировать нейросеть, которая будет распознавать «враждебные» и провоцирующие на агрессию комментарии. Об этом говорится в блоге разработчиков социальной сети.
Компания добавила новую категорию «Враждебные высказывания», которая доступна, если пожаловаться на комментарий. Эта мера поможет обучить нейросеть фильтровать публикации, считают в компании. Пока удалять комментарии будут модераторы.
Система сможет выявлять «проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний».
Команда «ВКонтакте» сообщила, что за первую половину 2020 года они удалили больше 500 тысяч материалов «по теме разжигания вражды и ненависти» и заблокировали 1 340 профилей и 2 470 сообществ. В прошлом году они также тестировали алгоритм, который предлагал пользователям отказаться от комментария с враждебными высказываниями.
Информационно-аналитический центр «Сова» отмечал, что даже после частичной декриминализации статьи 282 УК о возбуждении ненависти в 2018 году большая часть уголовных дел о публикациях в интернете по-прежнему приходится на «ВКонтакте». В прошлом году пользователи обращали внимание, что соцсеть автоматически удаляет комментарии с материалами из реестра экстремистских материалов.
Раз в неделю наши авторы делятся своими впечатлениями от главных событий и текстов
«ВКонтакте» внедряет фильтр враждебных высказываний, который удаляет комментарии с угрозами. Функция доступна в 50 % пабликов
«ВКонтакте» запустила фильтр враждебных высказываний для комментариев в сообществах, рассказали «Бумаге» в пресс-службе компании. Он работает на основе нейросети, администраторы могут включить его в настройках.
Сейчас новая функция появилась у владельцев 50 % пабликов, в скором времени она станет доступна всем. Как сообщили в компании, алгоритмы умеют определять прямые угрозы: пожелания смерти или обещания причинить вред здоровью. При этом тестирование еще продолжается: в будущем фильтр научится распознавать, например, травлю по национальности или религиозной принадлежности.
Тестирование фильтра запустили в ноябре 2020 года. За почти четыре месяца функцией воспользовались руководители более 10 % сообществ, то есть 13 миллионов пабликов, групп и мероприятий, рассказали во «ВКонтакте». Из подключивших фильтр впоследствии от него отказались 1,8 %.
В ноябре 2019 года «ВКонтакте» на один день запустила функцию для борьбы с оскорблениями в комментариях. При попытке написать агрессивный комментарий пользователь получал совет отказаться от обидных слов. Есть ли в тексте признаки оскорблений, определяли алгоритмы соцсети. Эксперимент был призван предотвратить травлю по национальному признаку и издевательства над подростками.
В августе «ВКонтакте» также сообщила о тестировании нейросети для борьбы с языком вражды. Нейросеть должна была ускорить время обработки жалоб и помогать быстрее находить материалы с оскорблениями и угрозами, публикации, которые содержат проявления ксенофобии, расизма, гомофобии, сексизма, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.
ВКонтакте поделилась статистикой блокировок по языку вражды и развеяла основные мифы
На прошлой неделе мы обновили нормы платформы — и рассказали о своей роли в борьбе с призывами преследовать или унижать людей.
За неделю по этой причине заблокировали 142 сообщества. Пробежимся по основным мифам, расскажем, что конкретно изменилось и какие паблики рискуют улететь в бан.
ВКонтакте ввела цензуру, запретила шутки и свободу слова?
Нет, нет и нет. ВКонтакте всегда была и остаётся открытой площадкой, где каждый может высказать мнение. Но есть большая разница между мнениями и травлей. С теми, кто использует ВКонтакте для преследования людей, нам не по пути.
Мы баним тех, кто явно пропагандирует идею, что представители какой-то социальной группы заслуживают, чтобы над ними издевались, их изолировали, избивали, уничтожали или сравнивали с грязью. Речь здесь не о неосторожном слове, а о сообществах и профилях, которые используются для распространения хейтспича.
✅ мнение
мне не нравятся люди в жёлтых штанах, они мне неприятны
❌ травля и оскорбление
людей в жёлтых штанах нужно заплевать и изгнать
И обзываться теперь нельзя?
Мы за мир, дружбу и жвачку, но здесь решать вам. Мы не баним за употребление в речи обидных слов. Если человек использует их, выражая мнение, это не язык вражды и не повод для бана.
Одно дело — если вы посмотрели футбольный матч, недовольны решениями судьи и написали про это пост. Совсем другое — если будете призывать к унижению, травле и преследованию болельщиков неприятной вам команды. Это уже совсем другая ситуация, которая может стать причиной для бана.
✅ мнение
судья облажался, он [нехороший человек]
❌ травля и оскорбление
болельщикам той команды нужно доступно объяснить, что их место не в этой стране: собираемся за стадионом и бьём
Что нужно сделать, чтобы заработать бан?
Бан — это не про какую-то случайность. Мы блокируем тех, кто систематически публикует оскорбительный контент или призывы к насилию.
Важно учитывать, что мы сначала предупреждаем админов и предлагаем им самим убрать всю травлю. Если они не прислушиваются — баним. Сообщества могут быть разблокированы после разговора с Поддержкой и обещания отказаться от враждебных выражений и травли. Но это не касается организаций и движений, которые созданы конкретно для поощрения идеологии насилия и вражды.
Каковы масштабы банов?
Пока по этой теме забанили 142 сообщества. Абсолютное большинство (120 из 142) — паблики с травлей уроженцев стран Средней Азии.
Это примеры блокировок. Мы намеренно скрыли часть названий, чтобы не продвигать ни подобного рода движения, ни способы их преследований и оскорблений:
Кажется, был скриншот, что человека забанили за голос в опросе. Это правда?
Бан был не за голос в опросе, а за создание самого опроса с жёстким религиозным оскорблением. Помимо этого опроса вся страница пользователя была посвящена оскорблению всех и вся. Но поначалу мы ошибочно указали в интерфейсе и при общении в Поддержке, что причина блокировки — участие в опросе. Это уже исправили.
А в сообщениях тоже хейтспич ищете?
Нет, у модерации нет к ним доступа. При этом если кто-то из ваших собеседников отправит жалобу на полученное от вас сообщение — тогда модераторы увидят именно это сообщение. Это нужно, чтобы рассмотреть жалобу.
Вдобавок уже много лет работает автоматическая система, которая не позволяет делиться запрещённым контентом. Например, картинками и видео с опасным содержимым — призывами к суициду или насилию. Она может автоматически удалить их, независимо от того, куда вы пытались это загрузить.
Вы топите за какую-то сторону или что-то навязываете?
ВКонтакте не «топит» за какие-то идеи, мы предоставляем площадку для общения и обсуждений. Но мы не позволим использовать профили или сообщества для травли и прославления насилия. Совершенно неважно, кто именно распространяет враждебные высказывания — мужчины, женщины, сторонники или противники чего-либо — хейтспичу не место на нашей платформе.
А что ещё, помимо хейтспича, под запретом на платформе?
Всякая мерзость — от спама до призывов к суициду. Более-менее лаконично информация о нормах платформы собрана в Центре безопасности.