В «Эксмо» рассказали об «огромных» тратах на поиск запрещенного контента
По словам Капьева, для этого издание использует самые дорогие и продвинутые модели, которые обучены на действующих законах и судебной практике

Евгений Капьев (Фото: Артем Геодакян / ТАСС)
«Эксмо» затратило «огромные средства» на анализ ассортимента с 1990 года для маркировки упоминаний наркотиков, а также на борьбу с экстремистской литературой, сообщили РБК в издательстве.
В «Эксмо» уточнили, что работы направлены в том числе на профилактику в книгах тем чайлдфри и других, а также на борьбу с ЛГБТ-литературой («международное движение ЛГБТ» признано экстремистским и запрещено в России).
Ранее глава издательства Евгений Капьев в ходе пресс-конференции рассказал, что искусственный интеллект, который использует издательство «Эксмо» для выявления запрещенного контента в книгах, работает в несколько этапов.
Вначале текст делят на фрагменты, чтобы алгоритмы могли корректно анализировать контекст. После этого система начинает проверку содержимого и выявляет потенциально проблемные места по нескольким категориям — признакам экстремизма, упоминанию наркотиков и сексуальному контенту.
На втором этапе искусственный интеллект исключает очевидные ложные срабатывания, а на третьем — классифицирует нарушение. По словам Капьева, для этого издание использует самые дорогие и продвинутые модели, которые обучены на действующих законах и судебной практике.
Помимо основной проверки, также работают другие агенты, которые взаимодействуют с постоянно обновляемыми официальными перечнями запрещенных организаций и иноагентов.
Однако ключевым принципом системы глава «Эксмо» назвал то, что машина «не принимает окончательное решение».
В издательстве добавили, что в планах есть внедрение интерактивной функции, которая позволит редакторам задавать вопросы непосредственно по книге. Пример запроса — «Найти все упоминания слова «мак».
Капьев в прошлом месяце жаловался, что из-за введения запретов или обязательных маркировок специалисты должны провести проверку более 3 млн наименований книг, вышедших с 1990 года.
Тогда он рассказал, что искусственный интеллект счел фамилию писателя Виктора Драгунского пропагандой наркотиков из-за созвучности фамилии английскому drug, что переводится как «наркотик». «Законов и регулирования много, а ИИ настраивают специально максимально широко, чтобы ничего не пропустить. <...> Это лишь в очередной раз иллюстрирует, как непросто нам, книжникам, подстроиться под требования о маркировке», — сказал Капьев.
Оставайтесь на связи с РБК в Max.










