Издатели тратят огромные суммы на поиск запрещённой информации в книгах
Как сообщили в издательстве, маркировка должна присутствовать в книгах, выходивших с 1990 года, а затраты уже исчисляются «огромными средствами». Алгоритмы проверяют тексты на наличие пропаганды наркотиков, экстремистских высказываний, а также тем, связанных с движениями чайлдфри и ЛГБТ (международное движение ЛГБТ признано экстремистским и запрещено в России).
Как рассказал глава «Эксмо» Евгений Капьев, сначала текст разбивается на небольшие фрагменты, чтобы нейросеть могла корректно проанализировать контекст. Затем система выявляет потенциально опасные места по нескольким категориям: экстремизм, наркотики и запрещенный сексуальный контент. На втором этапе ИИ отсеивает очевидные ложные срабатывания, а на третьем – классифицирует тип нарушения. По словам Капьева, издательство использует самые дорогие и продвинутые модели, обученные на действующем законодательстве и судебной практике.
Помимо основной проверки, задействованы дополнительные агенты, которые в реальном времени сверяют данные с постоянно обновляющимися официальными перечнями запрещенных организаций и списками иностранных агентов. Однако, как подчеркнул глава «Эксмо», ключевой принцип системы заключается в том, что машина не принимает окончательного решения – финальный вердикт всегда остается за человеком. В планах издательства внедрение интерактивной функции, которая позволит редакторам задавать нейросети конкретные вопросы по тексту, например: «Найти все упоминания слова "мак"».
Из-за введения обязательной маркировки книг специалистам «Эксмо» пришлось проверить более 3 миллионов наименований, выпущенных с 1990 года. Капьев ранее жаловался, что искусственный интеллект порой выдает курьезные результаты. Например, нейросеть сочла фамилию известного детского писателя Виктора Драгунского пропагандой наркотиков из-за ее созвучности с английским словом drug.
Просмотров: 34