Версия // Общество // Издатели тратят огромные суммы на поиск запрещённой информации в книгах

Издатели тратят огромные суммы на поиск запрещённой информации в книгах

13
Издатели тратят огромные суммы на поиск запрещённой информации в книгах (изображение: shedevrum.ai)
В разделе

Крупнейшее российское издательство «Эксмо» вложило значительные ресурсы в создание системы искусственного интеллекта, которая сканирует многомиллионный архив книжной продукции на предмет запрещенного контента.

Как сообщили в издательстве, маркировка должна присутствовать в книгах, выходивших с 1990 года, а затраты уже исчисляются «огромными средствами». Алгоритмы проверяют тексты на наличие пропаганды наркотиков, экстремистских высказываний, а также тем, связанных с движениями чайлдфри и ЛГБТ* (международное движение ЛГБТ признано экстремистским и запрещено в России).

Как рассказал глава «Эксмо» Евгений Капьев, сначала текст разбивается на небольшие фрагменты, чтобы нейросеть могла корректно проанализировать контекст. Затем система выявляет потенциально опасные места по нескольким категориям: экстремизм, наркотики и запрещенный сексуальный контент. На втором этапе ИИ отсеивает очевидные ложные срабатывания, а на третьем – классифицирует тип нарушения. По словам Капьева, издательство использует самые дорогие и продвинутые модели, обученные на действующем законодательстве и судебной практике.

Помимо основной проверки, задействованы дополнительные агенты, которые в реальном времени сверяют данные с постоянно обновляющимися официальными перечнями запрещенных организаций и списками иностранных агентов. Однако, как подчеркнул глава «Эксмо», ключевой принцип системы заключается в том, что машина не принимает окончательного решения – финальный вердикт всегда остается за человеком. В планах издательства внедрение интерактивной функции, которая позволит редакторам задавать нейросети конкретные вопросы по тексту, например: «Найти все упоминания слова "мак"».

Из-за введения обязательной маркировки книг специалистам «Эксмо» пришлось проверить более 3 миллионов наименований, выпущенных с 1990 года. Капьев ранее жаловался, что искусственный интеллект порой выдает курьезные результаты. Например, нейросеть сочла фамилию известного детского писателя Виктора Драгунского пропагандой наркотиков из-за ее созвучности с английским словом drug.

*
ЛГБТ-движение признано Верховным судом РФ экстремистским
Логотип versia.ru
Опубликовано:
Отредактировано: 07.04.2026 08:57
Комментарии 0
Еще на сайте
Наверх