Как рассчитан индекс?
Чтобы подготовить Индекс, исследователи КБ Стрелка соотнесли субъективные и объективные показатели:
▶ Количество и содержание текстов туристов о поездках по России (в социальных медиа, блогах, на сайтах-агрегаторах отзывов)
▶ Объемы туристического потока в регионах
Структура оценки по индексу
Оценка проводилась для 82 регионов России. Из анализа были исключены города федерального значения: Москва, Санкт-Петербург и Севастополь.
Чтобы исследовать образ регионов России глазами туристов, специалисты КБ Стрелка провели анализ 6 300 000 пользовательских текстов в социальных медиа методами цифровой антропологии. Для этого применили технологию удаленного анализа социальной активности и особенностей восприятия городских объектов на материале массива данных из социальных сетей (Social Media Listening, SML). Использование SML в исследованиях КБ Стрелка позволяет выявить типологию пользователей, составить их портрет и исследовать паттерны поведения, а также определить, как пользователи относятся к выбранным объектам, на какие проблемы жалуются, описывая свой пользовательский опыт. Для анализа массива анонимизированных данных применялся графовый алгоритм TextRank и технологии машинного обучения, основанные на обработке естественного языка (Natural Language Processing, NLP).
Площадками для сбора текстов стали социальные сети, блоги, форумы, сайты отзывов, всего свыше 700 площадок разного уровня активности: в том числе, в социальной сети ВКонтакте было размещено 20 % обнаруженных текстов, в сети Одноклассники — 13 %, на Фейсбуке — 7 %, в Инстаграме – 5 %, в Твиттере – 1 %, на Youtube – 1 %. Исследователи изучили тексты, которые были опубликованы за 12 месяцев: с июля 2019 по июль 2020 года, — и захватили период пандемии COVID-19 и введения карантинных мер, ограничивавших туризм.
более
700
онлайн-площадок в социальных сетях, блогах, форумах, сайтах отзывов было задействовано в сборе данных
6,3
млн
текстов были проанализированы с помощью искусственного интеллекта
12
месяцев
составил период сбора текстов (июль 2019 г. — июль 2020 г.)
При разработке портретов регионов в текстах выявили 6 составляющих туристического продукта:
Материальное наследие
Здания, картины, скульптуры, памятники и так далее.
Нематериальное наследие
Музыка, кулинария, язык, традиции, литература и так далее.
Природа
Горы, реки, леса, дикая фауна, озера, моря и так далее.
Событийная программа
Фестивали, спектакли, концерты и так далее.
Технологии и производство
Космические технологии, сельское хозяйство, промышленность, военная техника и так далее.
Туристическая инфраструктура
Транспортная система, гостиницы, кафе, экскурсии, гиды, сувениры и так далее.
Особенности методики расчета индекса
Широкий охват
Анализ пользовательских текстов в социальных медиа позволяет в короткие сроки выявить позиции большого числа людей.
Непредвзятость
В социальных медиа люди оставляют неспровоцированные суждения. Отсутствие влияния исследователя минимизирует социально одобряемые ответы. Это позволяет получить более искреннее мнение, чем при использовании классических опросных методов.
Эмоциональность
Тексты в социальных медиа, как правило, размещают люди, эмоционально вовлеченные в тему обсуждения. Это позволяет получить уникальную информацию о запросах, ценностях, практиках целевой аудитории.
Влияние
Тексты пользователей социальных медиа не только отражают их впечатления от туристической поездки, но и влияют на их подписчиков, которые могут заинтересоваться регионом. Поэтому анализ социальных сетей — это не только барометр текущих туристических предпочтений, но и оценка привлекательности региона как туристического направления в ближайшем будущем.
Перспективность
Индекс основан на высказываниях людей, активно пользующихся социальными сетями. Среди них много молодых людей, которые станут основными потребителями туристического продукта в ближайшие десятилетия.