враждебные высказывания вк это что

ВКонтакте тестирует нейросеть для борьбы с языком вражды

ВКонтакте работает над искусственным интеллектом для автоматического распознавания материалов с хейтспичем — враждебными высказываниями. Технология призвана ускорить время обработки жалоб и помочь пользователям реже сталкиваться с проявлениями нетерпимости.

Новая нейросеть поможет быстрее находить материалы с враждебными высказываниями, а также публикации, которые провоцируют аудиторию проявлять агрессию. Нейросеть учится определять самые разные категории оскорблений и угроз. Среди них — проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.

Чтобы усилить модерацию по теме языка ненависти и обучить искусственный интеллект, ВКонтакте добавила новую категорию жалоб — «Враждебные высказывания». Пользователь может выбрать её, если нажмёт кнопку «Пожаловаться» у оскорбительной публикации. После этого материал попадёт на рассмотрение к модераторам. Эта категория позволит точнее откалибровать уже существующие инструменты и собрать датасет для новых решений на основе нейросетей. При этом команды Модерации и Поддержки не только реагируют на жалобы, но и проводят проактивный внутренний мониторинг — в частности, с помощью механизмов автоматического поиска, технологии цифровых отпечатков и нейронных сетей.

Иван Корнеев, руководитель команды модерации ВКонтакте:

«Мы разделяем позицию наших пользователей и партнёров касательно языка вражды и прославления насилия. Модераторы ВКонтакте ежедневно обрабатывают огромный объём контента, в том числе с использованием искусственного интеллекта — большинство опасных материалов удаляются ещё до того, как их кто-то увидит. Если же вы заметили оскорбительную публикацию, пожалуйтесь на неё. С проявлениями нетерпимости эффективнее бороться вместе — и мы призываем пользователей присоединяться к нам в этой борьбе».

За первую половину 2020 года на платформе было удалено 520 тысяч единиц контента по теме разжигания вражды и ненависти, а также заблокировано 1340 профилей и 2470 сообществ, распространяющих враждебные высказывания.

Источник

ВКонтакте представил фильтр враждебных комментариев и высказываний

ВКонтакте начал выкатывать фильтр враждебных комментариев для всех сообществ. Напомним, что соцсеть проводила тестирование данной функции ещё осенью прошлого года.

Под фильтр попадают комментарии, в которых содержатся угрозы: например, пожелания смерти или обещания причинить вред здоровью. В дальнейшем фильтр научится распознавать травлю по национальному и религиозному принципу.

Рекомендуем: Click.ru – маркетплейс рекламных платформ:

Как включить и настроить фильтр враждебных комментариев

Фильтр можно включить или выключить в любой момент. Чтобы включить фильтр, зайдите в управление сообществом, откройте вкладку «Комментарии» в разделе «Настройки».

враждебные высказывания вк это что. Смотреть фото враждебные высказывания вк это что. Смотреть картинку враждебные высказывания вк это что. Картинка про враждебные высказывания вк это что. Фото враждебные высказывания вк это что

Поставьте галочку напротив поля «Фильтр враждебных высказываний».

враждебные высказывания вк это что. Смотреть фото враждебные высказывания вк это что. Смотреть картинку враждебные высказывания вк это что. Картинка про враждебные высказывания вк это что. Фото враждебные высказывания вк это что

Сделать это можно только в версии ВКонтакте для компьютера. Там же вы сможете увидеть все отсеянные комментарии и восстановить их или отправить автора в чёрный список.

По мнению разработчиков, что это поможет снизить враждебность — оградить подписчиков от травли и сделать группы ещё более приятным и дружелюбным местом.

Ранее ВКонтакте позволил создавать сайты из групп, а в еженедельных отчётах по сообществам появился блок «Рекламные показатели».

Источник

Враждебные высказывания вк это что

«Вконтакте» начала тестировать нейросеть, которая будет распознавать «враждебные» и провоцирующие на агрессию комментарии. Об этом говорится в блоге разработчиков социальной сети.

Компания добавила новую категорию «Враждебные высказывания», которая доступна, если пожаловаться на комментарий. Эта мера поможет обучить нейросеть фильтровать публикации, считают в компании. Пока удалять комментарии будут модераторы.

Система сможет выявлять «проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний».

Команда «ВКонтакте» сообщила, что за первую половину 2020 года они удалили больше 500 тысяч материалов «по теме разжигания вражды и ненависти» и заблокировали 1 340 профилей и 2 470 сообществ. В прошлом году они также тестировали алгоритм, который предлагал пользователям отказаться от комментария с враждебными высказываниями.

Информационно-аналитический центр «Сова» отмечал, что даже после частичной декриминализации статьи 282 УК о возбуждении ненависти в 2018 году большая часть уголовных дел о публикациях в интернете по-прежнему приходится на «ВКонтакте». В прошлом году пользователи обращали внимание, что соцсеть автоматически удаляет комментарии с материалами из реестра экстремистских материалов.

Раз в неделю наши авторы делятся своими впечатлениями от главных событий и текстов

Источник

«ВКонтакте» внедряет фильтр враждебных высказываний, который удаляет комментарии с угрозами. Функция доступна в 50 % пабликов

«ВКонтакте» запустила фильтр враждебных высказываний для комментариев в сообществах, рассказали «Бумаге» в пресс-службе компании. Он работает на основе нейросети, администраторы могут включить его в настройках.

Сейчас новая функция появилась у владельцев 50 % пабликов, в скором времени она станет доступна всем. Как сообщили в компании, алгоритмы умеют определять прямые угрозы: пожелания смерти или обещания причинить вред здоровью. При этом тестирование еще продолжается: в будущем фильтр научится распознавать, например, травлю по национальности или религиозной принадлежности.

Тестирование фильтра запустили в ноябре 2020 года. За почти четыре месяца функцией воспользовались руководители более 10 % сообществ, то есть 13 миллионов пабликов, групп и мероприятий, рассказали во «ВКонтакте». Из подключивших фильтр впоследствии от него отказались 1,8 %.

враждебные высказывания вк это что. Смотреть фото враждебные высказывания вк это что. Смотреть картинку враждебные высказывания вк это что. Картинка про враждебные высказывания вк это что. Фото враждебные высказывания вк это что

В ноябре 2019 года «ВКонтакте» на один день запустила функцию для борьбы с оскорблениями в комментариях. При попытке написать агрессивный комментарий пользователь получал совет отказаться от обидных слов. Есть ли в тексте признаки оскорблений, определяли алгоритмы соцсети. Эксперимент был призван предотвратить травлю по национальному признаку и издевательства над подростками.

В августе «ВКонтакте» также сообщила о тестировании нейросети для борьбы с языком вражды. Нейросеть должна была ускорить время обработки жалоб и помогать быстрее находить материалы с оскорблениями и угрозами, публикации, которые содержат проявления ксенофобии, расизма, гомофобии, сексизма, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.

Источник

ВКонтакте поделилась статистикой блокировок по языку вражды и развеяла основные мифы

На прошлой неделе мы обновили нормы платформы — и рассказали о своей роли в борьбе с призывами преследовать или унижать людей.

За неделю по этой причине заблокировали 142 сообщества. Пробежимся по основным мифам, расскажем, что конкретно изменилось и какие паблики рискуют улететь в бан.

ВКонтакте ввела цензуру, запретила шутки и свободу слова?

Нет, нет и нет. ВКонтакте всегда была и остаётся открытой площадкой, где каждый может высказать мнение. Но есть большая разница между мнениями и травлей. С теми, кто использует ВКонтакте для преследования людей, нам не по пути.

Мы баним тех, кто явно пропагандирует идею, что представители какой-то социальной группы заслуживают, чтобы над ними издевались, их изолировали, избивали, уничтожали или сравнивали с грязью. Речь здесь не о неосторожном слове, а о сообществах и профилях, которые используются для распространения хейтспича.

✅ мнение

мне не нравятся люди в жёлтых штанах, они мне неприятны

❌ травля и оскорбление

людей в жёлтых штанах нужно заплевать и изгнать

И обзываться теперь нельзя?

Мы за мир, дружбу и жвачку, но здесь решать вам. Мы не баним за употребление в речи обидных слов. Если человек использует их, выражая мнение, это не язык вражды и не повод для бана.

Одно дело — если вы посмотрели футбольный матч, недовольны решениями судьи и написали про это пост. Совсем другое — если будете призывать к унижению, травле и преследованию болельщиков неприятной вам команды. Это уже совсем другая ситуация, которая может стать причиной для бана.

✅ мнение

судья облажался, он [нехороший человек]

❌ травля и оскорбление

болельщикам той команды нужно доступно объяснить, что их место не в этой стране: собираемся за стадионом и бьём

Что нужно сделать, чтобы заработать бан?

Бан — это не про какую-то случайность. Мы блокируем тех, кто систематически публикует оскорбительный контент или призывы к насилию.

Важно учитывать, что мы сначала предупреждаем админов и предлагаем им самим убрать всю травлю. Если они не прислушиваются — баним. Сообщества могут быть разблокированы после разговора с Поддержкой и обещания отказаться от враждебных выражений и травли. Но это не касается организаций и движений, которые созданы конкретно для поощрения идеологии насилия и вражды.

Каковы масштабы банов?

Пока по этой теме забанили 142 сообщества. Абсолютное большинство (120 из 142) — паблики с травлей уроженцев стран Средней Азии.

Это примеры блокировок. Мы намеренно скрыли часть названий, чтобы не продвигать ни подобного рода движения, ни способы их преследований и оскорблений:

враждебные высказывания вк это что. Смотреть фото враждебные высказывания вк это что. Смотреть картинку враждебные высказывания вк это что. Картинка про враждебные высказывания вк это что. Фото враждебные высказывания вк это что

враждебные высказывания вк это что. Смотреть фото враждебные высказывания вк это что. Смотреть картинку враждебные высказывания вк это что. Картинка про враждебные высказывания вк это что. Фото враждебные высказывания вк это что

враждебные высказывания вк это что. Смотреть фото враждебные высказывания вк это что. Смотреть картинку враждебные высказывания вк это что. Картинка про враждебные высказывания вк это что. Фото враждебные высказывания вк это что

Кажется, был скриншот, что человека забанили за голос в опросе. Это правда?

Бан был не за голос в опросе, а за создание самого опроса с жёстким религиозным оскорблением. Помимо этого опроса вся страница пользователя была посвящена оскорблению всех и вся. Но поначалу мы ошибочно указали в интерфейсе и при общении в Поддержке, что причина блокировки — участие в опросе. Это уже исправили.

А в сообщениях тоже хейтспич ищете?

Нет, у модерации нет к ним доступа. При этом если кто-то из ваших собеседников отправит жалобу на полученное от вас сообщение — тогда модераторы увидят именно это сообщение. Это нужно, чтобы рассмотреть жалобу.

Вдобавок уже много лет работает автоматическая система, которая не позволяет делиться запрещённым контентом. Например, картинками и видео с опасным содержимым — призывами к суициду или насилию. Она может автоматически удалить их, независимо от того, куда вы пытались это загрузить.

Вы топите за какую-то сторону или что-то навязываете?

ВКонтакте не «топит» за какие-то идеи, мы предоставляем площадку для общения и обсуждений. Но мы не позволим использовать профили или сообщества для травли и прославления насилия. Совершенно неважно, кто именно распространяет враждебные высказывания — мужчины, женщины, сторонники или противники чего-либо — хейтспичу не место на нашей платформе.

А что ещё, помимо хейтспича, под запретом на платформе?

Всякая мерзость — от спама до призывов к суициду. Более-менее лаконично информация о нормах платформы собрана в Центре безопасности.

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *