Машинное обучение и NLP в оценке территориальных различий социального самочувствия: комбинированный анализ опросов и данных ВКонтакте
Аннотация
Статья исследует территориальные различия социального самочувствия жителей Санкт-Петербурга, сопоставляя данные репрезентативного опроса и цифровые следы районных сообществ социальной сети ВКонтакте. В качестве аналитической рамки используется социология эмоций, а в качестве инструментария — методы машинного обучения и обработки естественного языка (NLP). Тематическое моделирование (LDA) применялось для выделения ключевых сфер городской повседневности, а ансамбль моделей для анализа тональности — для классификации более чем полумиллиона комментариев по пяти базовым эмоциональным категориям. Опросные данные позволили оценить субъективные характеристики городской среды и эмоциональные реакции жителей, тогда как цифровые следы зафиксировали ситуативные и коллективные формы выражения эмоций. Полученные результаты демонстрируют, что различия в социальном самочувствии устойчиво формируются на пересечении инфраструктурных особенностей районов, качества жилья, демографического состава и характера повседневных маршрутов. Данные социальных сетей уточняют и развивают опросные показатели, выявляя локальные точки напряжения — сбои инфраструктуры, «боли роста» новых территорий, хронические бытовые неудобства старых районов. Работа показывает, что сочетание опросов и автоматизированных методов анализа текстов позволяет рассматривать социальное самочувствие не как статичную оценку, а как динамический процесс, чувствительный к изменениям городской среды. Результаты исследования имеют прикладное значение для городской социальной политики и диагностики территориальных неравенств.









