Роскомнадзор внедрил систему автоматизированного поиска запрещенного в России контента в интернете. До этого сотрудники ведомства просматривали такие фото и видео «преимущественно вручную».
Всевидящий «Окулус»
Роскомнадзор запустил информационную систему автоматического поиска запрещенного контента «Окулус», сообщил представитель подведомственного Роскомнадзору Главного радиочастотного центра (ФГУП ГРЧЦ), который выступал заказчиком по проекту. Как пишут «Ведомости», протестировали систему в декабре 2022 г., в январе 2023 г. началась интеграция с другими инструментами мониторинга Роскомнадзора.
Система выявляет нарушения российского законодательства в картинках и видеороликах. Как уточняет собеседник издания, программа распознает изображения и символы, противоправные сцены и действия, анализирует текст в фото- и видеоматериалах.
«Окулус» автоматически обнаруживает такие правонарушения, как экстремистская тематика, призывы к массовым незаконным мероприятиям, суициду, пронаркотический контент, пропаганда ЛГБТ и др.», — пояснил он.
От ручного труда к программному
До «Окулуса» специалисты ГРЧЦ анализировали контент «преимущественно вручную». По словам представителя подведомственного Роскомнадзору органа, операторы в среднем обрабатывали 106 изображений и 101 видео в день.
Система поможет автоматизировать и ускорить этот процесс и будет анализировать более 200 тыс. изображений в сутки, «просмотр» одного изображения займет около трех секунд.
Однвременно будет вестись доработка программы. До 2025 года система научится распознавать позы людей и их действия, будет выявлять запрещенные материалы «в нескольких кадрах на видеофрагментах, в сложных рукописных текстах и рисованном контенте». Также появится возможность добавления новых классов и типов нарушений, добавил представитель ГРЧЦ.
Зачем все это нужно
Как пояснили в ГРЧЦ, автоматизированное решение для поиска запрещенного контента необходимо из-за многократно растущего потока подобных материалов в интернете.
Сейчас в Сети распространяется «невиданные ранее объемы фейков, в особенности об СВО, которые направлены на подмену реальных фактов специально сконструированной “реальностью”», отмечает представитель ГРЧЦ.
В 2022 г. на основании требований Генпрокуратуры было удалено или заблокировано свыше 100 тыс. интернет-ресурсов, которые содержат недостоверную информацию (в том числе о ходе военной спецоперации), сообщил эксперт. Еще в 2021 г. таких материалов было порядка 7 тыс., в 2020 г. — 1,5 тыс., а в 2019 г. — несколько сотен.
Помимо массива контента тематики СВО, в интернете лавинообразно растет и объем материалов с пропагандой наркотиков, призывами к суициду, детской порнографией, добавил представитель ГРЧЦ.
Как отмечает гендиректор компании «Социальная лаборатория» Наталия Тылевич, «Окулус» не собирает данные, а только их классифицирует по заданным требованиям. У системы есть заданный набор источников информации, она может анализировать конкретные страницы сайтов или же паблики и профили в соцсетях.
Риски использования «Окулуса» проявляются только в том, насколько корректно осуществляется классификация контента и как он будет в дальнейшем интерпретированы в связке с другими компонентами системы и человеком, добавляет эксперт.
«Вопрос интерпретации и настроек будет определять масштаб таких погрешностей, как будет классифицироваться спорный контент — считать ли его запрещенным или нет. Но так или иначе это будут риски не столько самого решения, сколько риски уже дальнейшей работы с полученными в результате его работы данными», — резюмировала эксперт.
Всевидящий «Окулус»
Роскомнадзор запустил информационную систему автоматического поиска запрещенного контента «Окулус», сообщил представитель подведомственного Роскомнадзору Главного радиочастотного центра (ФГУП ГРЧЦ), который выступал заказчиком по проекту. Как пишут «Ведомости», протестировали систему в декабре 2022 г., в январе 2023 г. началась интеграция с другими инструментами мониторинга Роскомнадзора.
Система выявляет нарушения российского законодательства в картинках и видеороликах. Как уточняет собеседник издания, программа распознает изображения и символы, противоправные сцены и действия, анализирует текст в фото- и видеоматериалах.
«Окулус» автоматически обнаруживает такие правонарушения, как экстремистская тематика, призывы к массовым незаконным мероприятиям, суициду, пронаркотический контент, пропаганда ЛГБТ и др.», — пояснил он.
От ручного труда к программному
До «Окулуса» специалисты ГРЧЦ анализировали контент «преимущественно вручную». По словам представителя подведомственного Роскомнадзору органа, операторы в среднем обрабатывали 106 изображений и 101 видео в день.
Система поможет автоматизировать и ускорить этот процесс и будет анализировать более 200 тыс. изображений в сутки, «просмотр» одного изображения займет около трех секунд.
Однвременно будет вестись доработка программы. До 2025 года система научится распознавать позы людей и их действия, будет выявлять запрещенные материалы «в нескольких кадрах на видеофрагментах, в сложных рукописных текстах и рисованном контенте». Также появится возможность добавления новых классов и типов нарушений, добавил представитель ГРЧЦ.
Зачем все это нужно
Как пояснили в ГРЧЦ, автоматизированное решение для поиска запрещенного контента необходимо из-за многократно растущего потока подобных материалов в интернете.
Сейчас в Сети распространяется «невиданные ранее объемы фейков, в особенности об СВО, которые направлены на подмену реальных фактов специально сконструированной “реальностью”», отмечает представитель ГРЧЦ.
В 2022 г. на основании требований Генпрокуратуры было удалено или заблокировано свыше 100 тыс. интернет-ресурсов, которые содержат недостоверную информацию (в том числе о ходе военной спецоперации), сообщил эксперт. Еще в 2021 г. таких материалов было порядка 7 тыс., в 2020 г. — 1,5 тыс., а в 2019 г. — несколько сотен.
Помимо массива контента тематики СВО, в интернете лавинообразно растет и объем материалов с пропагандой наркотиков, призывами к суициду, детской порнографией, добавил представитель ГРЧЦ.
Как отмечает гендиректор компании «Социальная лаборатория» Наталия Тылевич, «Окулус» не собирает данные, а только их классифицирует по заданным требованиям. У системы есть заданный набор источников информации, она может анализировать конкретные страницы сайтов или же паблики и профили в соцсетях.
Риски использования «Окулуса» проявляются только в том, насколько корректно осуществляется классификация контента и как он будет в дальнейшем интерпретированы в связке с другими компонентами системы и человеком, добавляет эксперт.
«Вопрос интерпретации и настроек будет определять масштаб таких погрешностей, как будет классифицироваться спорный контент — считать ли его запрещенным или нет. Но так или иначе это будут риски не столько самого решения, сколько риски уже дальнейшей работы с полученными в результате его работы данными», — резюмировала эксперт.