враждебные высказывания вк это что

05.01.202412.04.2022 admin 0 Comments

ВКонтакте тестирует нейросеть для борьбы с языком вражды

ВКонтакте работает над искусственным интеллектом для автоматического распознавания материалов с хейтспичем — враждебными высказываниями. Технология призвана ускорить время обработки жалоб и помочь пользователям реже сталкиваться с проявлениями нетерпимости.

Новая нейросеть поможет быстрее находить материалы с враждебными высказываниями, а также публикации, которые провоцируют аудиторию проявлять агрессию. Нейросеть учится определять самые разные категории оскорблений и угроз. Среди них — проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.

Чтобы усилить модерацию по теме языка ненависти и обучить искусственный интеллект, ВКонтакте добавила новую категорию жалоб — «Враждебные высказывания». Пользователь может выбрать её, если нажмёт кнопку «Пожаловаться» у оскорбительной публикации. После этого материал попадёт на рассмотрение к модераторам. Эта категория позволит точнее откалибровать уже существующие инструменты и собрать датасет для новых решений на основе нейросетей. При этом команды Модерации и Поддержки не только реагируют на жалобы, но и проводят проактивный внутренний мониторинг — в частности, с помощью механизмов автоматического поиска, технологии цифровых отпечатков и нейронных сетей.

Иван Корнеев, руководитель команды модерации ВКонтакте:

«Мы разделяем позицию наших пользователей и партнёров касательно языка вражды и прославления насилия. Модераторы ВКонтакте ежедневно обрабатывают огромный объём контента, в том числе с использованием искусственного интеллекта — большинство опасных материалов удаляются ещё до того, как их кто-то увидит. Если же вы заметили оскорбительную публикацию, пожалуйтесь на неё. С проявлениями нетерпимости эффективнее бороться вместе — и мы призываем пользователей присоединяться к нам в этой борьбе».

За первую половину 2020 года на платформе было удалено 520 тысяч единиц контента по теме разжигания вражды и ненависти, а также заблокировано 1340 профилей и 2470 сообществ, распространяющих враждебные высказывания.

Источник

ВКонтакте представил фильтр враждебных комментариев и высказываний

ВКонтакте начал выкатывать фильтр враждебных комментариев для всех сообществ. Напомним, что соцсеть проводила тестирование данной функции ещё осенью прошлого года.

Под фильтр попадают комментарии, в которых содержатся угрозы: например, пожелания смерти или обещания причинить вред здоровью. В дальнейшем фильтр научится распознавать травлю по национальному и религиозному принципу.

Рекомендуем: Click.ru – маркетплейс рекламных платформ:

Как включить и настроить фильтр враждебных комментариев

Фильтр можно включить или выключить в любой момент. Чтобы включить фильтр, зайдите в управление сообществом, откройте вкладку «Комментарии» в разделе «Настройки».

Поставьте галочку напротив поля «Фильтр враждебных высказываний».

Сделать это можно только в версии ВКонтакте для компьютера. Там же вы сможете увидеть все отсеянные комментарии и восстановить их или отправить автора в чёрный список.

По мнению разработчиков, что это поможет снизить враждебность — оградить подписчиков от травли и сделать группы ещё более приятным и дружелюбным местом.

Ранее ВКонтакте позволил создавать сайты из групп, а в еженедельных отчётах по сообществам появился блок «Рекламные показатели».

Источник

Враждебные высказывания вк это что

«Вконтакте» начала тестировать нейросеть, которая будет распознавать «враждебные» и провоцирующие на агрессию комментарии. Об этом говорится в блоге разработчиков социальной сети.

Компания добавила новую категорию «Враждебные высказывания», которая доступна, если пожаловаться на комментарий. Эта мера поможет обучить нейросеть фильтровать публикации, считают в компании. Пока удалять комментарии будут модераторы.

Система сможет выявлять «проявления ксенофобии, расизма, гомофобии, сексизма и других предрассудков, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний».

Команда «ВКонтакте» сообщила, что за первую половину 2020 года они удалили больше 500 тысяч материалов «по теме разжигания вражды и ненависти» и заблокировали 1 340 профилей и 2 470 сообществ. В прошлом году они также тестировали алгоритм, который предлагал пользователям отказаться от комментария с враждебными высказываниями.

Информационно-аналитический центр «Сова» отмечал, что даже после частичной декриминализации статьи 282 УК о возбуждении ненависти в 2018 году большая часть уголовных дел о публикациях в интернете по-прежнему приходится на «ВКонтакте». В прошлом году пользователи обращали внимание, что соцсеть автоматически удаляет комментарии с материалами из реестра экстремистских материалов.

Раз в неделю наши авторы делятся своими впечатлениями от главных событий и текстов

Источник

«ВКонтакте» внедряет фильтр враждебных высказываний, который удаляет комментарии с угрозами. Функция доступна в 50 % пабликов

«ВКонтакте» запустила фильтр враждебных высказываний для комментариев в сообществах, рассказали «Бумаге» в пресс-службе компании. Он работает на основе нейросети, администраторы могут включить его в настройках.

Сейчас новая функция появилась у владельцев 50 % пабликов, в скором времени она станет доступна всем. Как сообщили в компании, алгоритмы умеют определять прямые угрозы: пожелания смерти или обещания причинить вред здоровью. При этом тестирование еще продолжается: в будущем фильтр научится распознавать, например, травлю по национальности или религиозной принадлежности.

Тестирование фильтра запустили в ноябре 2020 года. За почти четыре месяца функцией воспользовались руководители более 10 % сообществ, то есть 13 миллионов пабликов, групп и мероприятий, рассказали во «ВКонтакте». Из подключивших фильтр впоследствии от него отказались 1,8 %.

В ноябре 2019 года «ВКонтакте» на один день запустила функцию для борьбы с оскорблениями в комментариях. При попытке написать агрессивный комментарий пользователь получал совет отказаться от обидных слов. Есть ли в тексте признаки оскорблений, определяли алгоритмы соцсети. Эксперимент был призван предотвратить травлю по национальному признаку и издевательства над подростками.

В августе «ВКонтакте» также сообщила о тестировании нейросети для борьбы с языком вражды. Нейросеть должна была ускорить время обработки жалоб и помогать быстрее находить материалы с оскорблениями и угрозами, публикации, которые содержат проявления ксенофобии, расизма, гомофобии, сексизма, а также оскорбления на почве религиозной принадлежности, возраста, внешности или наличия заболеваний.

Источник

ВКонтакте поделилась статистикой блокировок по языку вражды и развеяла основные мифы

На прошлой неделе мы обновили нормы платформы — и рассказали о своей роли в борьбе с призывами преследовать или унижать людей.

За неделю по этой причине заблокировали 142 сообщества. Пробежимся по основным мифам, расскажем, что конкретно изменилось и какие паблики рискуют улететь в бан.

ВКонтакте ввела цензуру, запретила шутки и свободу слова?

Нет, нет и нет. ВКонтакте всегда была и остаётся открытой площадкой, где каждый может высказать мнение. Но есть большая разница между мнениями и травлей. С теми, кто использует ВКонтакте для преследования людей, нам не по пути.

Мы баним тех, кто явно пропагандирует идею, что представители какой-то социальной группы заслуживают, чтобы над ними издевались, их изолировали, избивали, уничтожали или сравнивали с грязью. Речь здесь не о неосторожном слове, а о сообществах и профилях, которые используются для распространения хейтспича.

✅ мнение

мне не нравятся люди в жёлтых штанах, они мне неприятны

❌ травля и оскорбление

людей в жёлтых штанах нужно заплевать и изгнать

И обзываться теперь нельзя?

Мы за мир, дружбу и жвачку, но здесь решать вам. Мы не баним за употребление в речи обидных слов. Если человек использует их, выражая мнение, это не язык вражды и не повод для бана.

Одно дело — если вы посмотрели футбольный матч, недовольны решениями судьи и написали про это пост. Совсем другое — если будете призывать к унижению, травле и преследованию болельщиков неприятной вам команды. Это уже совсем другая ситуация, которая может стать причиной для бана.

✅ мнение

судья облажался, он [нехороший человек]

❌ травля и оскорбление

болельщикам той команды нужно доступно объяснить, что их место не в этой стране: собираемся за стадионом и бьём

Что нужно сделать, чтобы заработать бан?

Бан — это не про какую-то случайность. Мы блокируем тех, кто систематически публикует оскорбительный контент или призывы к насилию.

Важно учитывать, что мы сначала предупреждаем админов и предлагаем им самим убрать всю травлю. Если они не прислушиваются — баним. Сообщества могут быть разблокированы после разговора с Поддержкой и обещания отказаться от враждебных выражений и травли. Но это не касается организаций и движений, которые созданы конкретно для поощрения идеологии насилия и вражды.

Каковы масштабы банов?

Пока по этой теме забанили 142 сообщества. Абсолютное большинство (120 из 142) — паблики с травлей уроженцев стран Средней Азии.

Это примеры блокировок. Мы намеренно скрыли часть названий, чтобы не продвигать ни подобного рода движения, ни способы их преследований и оскорблений:

Кажется, был скриншот, что человека забанили за голос в опросе. Это правда?

Бан был не за голос в опросе, а за создание самого опроса с жёстким религиозным оскорблением. Помимо этого опроса вся страница пользователя была посвящена оскорблению всех и вся. Но поначалу мы ошибочно указали в интерфейсе и при общении в Поддержке, что причина блокировки — участие в опросе. Это уже исправили.

А в сообщениях тоже хейтспич ищете?

Нет, у модерации нет к ним доступа. При этом если кто-то из ваших собеседников отправит жалобу на полученное от вас сообщение — тогда модераторы увидят именно это сообщение. Это нужно, чтобы рассмотреть жалобу.

Вдобавок уже много лет работает автоматическая система, которая не позволяет делиться запрещённым контентом. Например, картинками и видео с опасным содержимым — призывами к суициду или насилию. Она может автоматически удалить их, независимо от того, куда вы пытались это загрузить.

Вы топите за какую-то сторону или что-то навязываете?

ВКонтакте не «топит» за какие-то идеи, мы предоставляем площадку для общения и обсуждений. Но мы не позволим использовать профили или сообщества для травли и прославления насилия. Совершенно неважно, кто именно распространяет враждебные высказывания — мужчины, женщины, сторонники или противники чего-либо — хейтспичу не место на нашей платформе.

А что ещё, помимо хейтспича, под запретом на платформе?

Всякая мерзость — от спама до призывов к суициду. Более-менее лаконично информация о нормах платформы собрана в Центре безопасности.

Источник

Образовательный портал shkolapola.ru

враждебные высказывания вк это что

ВКонтакте тестирует нейросеть для борьбы с языком вражды

ВКонтакте представил фильтр враждебных комментариев и высказываний

Как включить и настроить фильтр враждебных комментариев

Враждебные высказывания вк это что

«ВКонтакте» внедряет фильтр враждебных высказываний, который удаляет комментарии с угрозами. Функция доступна в 50 % пабликов

ВКонтакте поделилась статистикой блокировок по языку вражды и развеяла основные мифы

ВКонтакте ввела цензуру, запретила шутки и свободу слова?

И обзываться теперь нельзя?

Что нужно сделать, чтобы заработать бан?

Каковы масштабы банов?

Кажется, был скриншот, что человека забанили за голос в опросе. Это правда?

А в сообщениях тоже хейтспич ищете?

Вы топите за какую-то сторону или что-то навязываете?

А что ещё, помимо хейтспича, под запретом на платформе?

Добавить комментарий

ВКонтакте тестирует нейросеть для борьбы с языком вражды

ВКонтакте представил фильтр враждебных комментариев и высказываний

Как включить и настроить фильтр враждебных комментариев

Враждебные высказывания вк это что

«ВКонтакте» внедряет фильтр враждебных высказываний, который удаляет комментарии с угрозами. Функция доступна в 50 % пабликов

ВКонтакте поделилась статистикой блокировок по языку вражды и развеяла основные мифы

ВКонтакте ввела цензуру, запретила шутки и свободу слова?

И обзываться теперь нельзя?

Что нужно сделать, чтобы заработать бан?

Каковы масштабы банов?

Кажется, был скриншот, что человека забанили за голос в опросе. Это правда?

А в сообщениях тоже хейтспич ищете?

Вы топите за какую-то сторону или что-то навязываете?

А что ещё, помимо хейтспича, под запретом на платформе?

Вам также понравится

Я понял сразу что между нами невозможна дружба

к чему снится старая бабушка знакомая

чему учит сказка гадкий утенок для читательского дневника

Добавить комментарий