Оценка влияния новостного фона в СМИ на уровень инфляции в России
Оценка влияния новостного фона в СМИ на уровень инфляции в России
Авторы статьи посредством специально разработанного методологического инструментария изучают связь между картиной дня в национальных медиа и динамикой инфляционных процессов в экономике страны. Путем обработки 147 тыс. статей и применения методов машинного обучения, включая нейронные сети и большие языковые модели, исследователи определили индекс инфляционного фона опубликованного медиаконтента, влияющий на восприятие аудиторией текущего уровня инфляции и позволяющий прогнозировать его изменения в будущем.
Динамичное развитие вычислительных технологий и интернета в современном мире, утверждают авторы, расширяют функциональность и доступность машинного анализа слабоструктурированных данных, таких как публикации СМИ. Несмотря на это, степень влияния потребляемого медиаконтента на инфляционные ожидания и экономическое поведение российской аудитории изучена, по мнению авторов, недостаточно.
Для решения этой научной проблемы на начальном этапе исследования учеными был проведен анализ методов обработки информации о ценах и инфляции в российских СМИ, вследствие чего был разработаны рекомендации для прогнозирования потребительских цен на основе оценки инфляционного фона медиаполя. Для этого массив собранных эмпирических данных авторы подвергли контент-анализу с применением как классических алгоритмов обработки естественного языка, так и специально дообученных нейронных сетей.
Для автоматизации поиска, сбора и классификации новостей об инфляции сначала авторами был алгоритм обработки текстов mDeBERTa-v3. Затем данные были размечены вручную, и на их основе было проведено обучение как классических моделей CatBoost и TF-IDF, так и предобученных русскоязычных моделей BERT (DeepPavlov и ai-forever). Далее с использованием метрик F1-score и ROC-AUC была протестирована точность работы каждой и определена лучшая — dbdi ai-forever/ruBert-base — с показателем F1, равным 0,85.
В ходе исследования был разработан индекс инфляционного фона, который основывается на качественно-количественном анализе релевантных статей с категорическим их разделением либо на «проинфляционные», либо на «дезинфляционные» с помощью модели с порогом 70%. Динамика этого индекса, скорректированная с учетом сезонных колебаний и сглаженная с использованием фильтра Ходрика-Прескотта, демонстрирует высокую корреляцию (0,71) с годовой инфляцией, что, согласно видению авторов, открывает возможность его применения для прогнозирования инфляционных процессов.
Для апробации и подтверждения функциональности предлагаемого метода разработчиками были созданы шесть моделей прогнозирования инфляции: линейная регрессия, CatBoost и Random Forest, с использованием предложенного индекса инфляционного фона и без него. Для обучения моделей использовались данные за период с 2014 по 2022 г., а тестовая выборка включала данные за период с октября 2022 г. по март 2024 г. включая периоды высокой волатильности. Добавление индекса значительно улучшило показатели моделей, снизив MAE (среднюю абсолютную ошибку) и RMSE (среднюю квадратическую ошибку) до значения 1,23 и 0,98 пункта, подтвержденных тестом Диболда-Мариано. Для расчета индекса авторами были использованы оперативные переменные: курс рубля, ценовые и инфляционные ожидания с лагом в один месяц, а также ежедневные новостные данные. В дальнейшем планируется расширить сбор эмпирической базы посредством подключения через RSS‑каналы большего числа новостных ресурсов, а также добавления комментариев пользователей соцсетей для измерения эффекта воздействия на них контента СМИ.
Переходя к выводам, авторы утверждают, что в результате выполненной ими научной работы была создана оригинальная методика расчета индекса инфляционного фона на основе новостных материалов российских СМИ. Автоматизированный с помощью ИИ-технологий анализ текстов позволяет быстро формировать набор статей, отбирать затрагивающие темы инфляции и цен медиатексты и классифицировать их как дезинфляционные или проинфляционные.
Для обеспечения правильности классификации собранных материалов на этой стадии исследования были использованы предобученные модели-трансформеры, которые продемонстрировали значительно более высокую точность по сравнению с традиционными алгоритмами. Апробированные учеными на практике автоматический сбор и обработка новостей позволяют в реальном времени выявлять экономические «шоки», порождающие в медиапространстве информационные волнения, штормы и даже цунами.
Включение построенного авторами индекса в модели прогнозирования инфляции доказательно улучшило их качество по метрикам RMSE и MAE. Это подтверждает прогностическую ценность новостных данных и их сигнальный потенциал для оперативного реагирования на происходящие в экономической сфере изменения и своевременное принятие обоснованных решений.
кандидат экономических наук, главный экономист Отделения по Ставропольскому краю Южного главного управления Центрального банка Российской Федерации, г. Ставрополь, Россия
доктор экономических наук, профессор, заведующая кафедрой финансов и кредита ФГАОУ ВО «Северо-Кавказский федеральный университет», г. Ставрополь, Россия
связь