«ВКонтакте» вновь раскинул нейросеть на угрозы и оскорбления в комментариях Спектр
Вторник, 23 апреля 2024
Сайт «Спектра» доступен в России через VPN
«ВКонтакте» вновь раскинул нейросеть на угрозы и оскорбления в комментариях
"ВКонтакте". Фото AFP PHOTO / Scanpix/LETA «ВКонтакте». Фото AFP PHOTO / Scanpix/LETA

Российская социальная сеть «ВКонтакте» в День народного единства 4 ноября 2020 года проводит эксперимент в целях борьбы с оскорблениями в комментариях. Как сообщает пресс-служба соцсети, тестируются две новых функции: фильтр враждебных высказываний и пользовательские рекомендации отказаться от оскорблений. Оба алгоритма работают на основе нейросетей. Похожий эксперимент проводился ровно год назад, 4 ноября 2019 года.

С помощью фильтра враждебных высказываний соцсеть удаляет комментарии, содержащие угрозы убийства и обещания вреда здоровью. У администраторов сообществ появилась возможность видеть такие комментарии в отдельном списке и при необходимости отправлять их авторов в «черный список». Фильтр можно включать или выключать в любой момент.

Также «ВКонтакте» выводит сообщение авторам комментариев, если в них есть признаки оскорблений. Пользователя призывают не тратить время на агрессию и отказаться от обидной реплики. Враждебные высказывания определяются на почве религиозной принадлежности, возраста, пола и других характеристик. Другим пользователям сообществ предоставлена возможность пожаловаться на автора «враждебных высказываний» модераторам.

В прошлом году благодаря эксперименту соцсети удалось снизить суточное число оскорблений, распознанных в комментариях, на 36%. После 4 ноября 2019 проводился долгосрочный тест, рассчитанный на часть аудитории. По результатам серии экспериментов соцсеть «ВКонтакте» намерена принять решение о дальнейшем использовании функции.

Около года назад о запуске аналогичного инструмента заявляла сеть микроблогов Twitter. Ее фильтры позволяют определять и блокировать оскорбляющие сообщения и спам в Direct Messages.

В Facebook действует система блокировок доступа к соцсети за оскорбления, в том числе направленные на широкие социальные группы. Меры предпринимаются вручную на основании жалоб, поступающих от пользователей соцсети.