В «Эксмо» рассказали об «огромных» тратах на поиск запрещенного контента

По словам Капьева, для этого издание использует самые дорогие и продвинутые модели, которые обучены на действующих законах и судебной практике

Артем Геодакян / ТАСС

Евгений Капьев (Фото: Артем Геодакян / ТАСС)

Входит в сюжет
В этой статье

«Эксмо» затратило «огромные средства» на анализ ассортимента с 1990 года для маркировки упоминаний наркотиков, а также на борьбу с экстремистской литературой, сообщили РБК в издательстве.

В «Эксмо» уточнили, что работы направлены в том числе на профилактику в книгах тем чайлдфри и других, а также на борьбу с ЛГБТ-литературой («международное движение ЛГБТ» признано экстремистским и запрещено в России).

Ранее глава издательства Евгений Капьев в ходе пресс-конференции рассказал, что искусственный интеллект, который использует издательство «Эксмо» для выявления запрещенного контента в книгах, работает в несколько этапов.

Вначале текст делят на фрагменты, чтобы алгоритмы могли корректно анализировать контекст. После этого система начинает проверку содержимого и выявляет потенциально проблемные места по нескольким категориям — признакам экстремизма, упоминанию наркотиков и сексуальному контенту.

На втором этапе искусственный интеллект исключает очевидные ложные срабатывания, а на третьем — классифицирует нарушение. По словам Капьева, для этого издание использует самые дорогие и продвинутые модели, которые обучены на действующих законах и судебной практике.

Помимо основной проверки, также работают другие агенты, которые взаимодействуют с постоянно обновляемыми официальными перечнями запрещенных организаций и иноагентов.

Однако ключевым принципом системы глава «Эксмо» назвал то, что машина «не принимает окончательное решение».

В издательстве добавили, что в планах есть внедрение интерактивной функции, которая позволит редакторам задавать вопросы непосредственно по книге. Пример запроса — «Найти все упоминания слова «мак».

Капьев в прошлом месяце жаловался, что из-за введения запретов или обязательных маркировок специалисты должны провести проверку более 3 млн наименований книг, вышедших с 1990 года.

Тогда он рассказал, что искусственный интеллект счел фамилию писателя Виктора Драгунского пропагандой наркотиков из-за созвучности фамилии английскому drug, что переводится как «наркотик». «Законов и регулирования много, а ИИ настраивают специально максимально широко, чтобы ничего не пропустить. <...> Это лишь в очередной раз иллюстрирует, как непросто нам, книжникам, подстроиться под требования о маркировке», — сказал Капьев.

Оставайтесь на связи с РБК в Max.