Как рассчитан Индекс?

Как рассчитан индекс?

Чтобы подготовить Индекс, исследователи КБ Стрелка соотнесли субъективные и объективные показатели:
▶ Количество и содержание текстов туристов о поездках по России (в социальных медиа, блогах, на сайтах-агрегаторах отзывов)
▶ Объемы туристического потока в регионах

Структура оценки по индексу

Структура оценки

Оценка проводилась для 82 регионов России. Из анализа были исключены города федерального значения: Москва, Санкт-Петербург и Севастополь.

Чтобы исследовать образ регионов России глазами туристов, специалисты КБ Стрелка провели анализ 6 300 000 пользовательских текстов в социальных медиа методами цифровой антропологии. Для этого применили технологию удаленного анализа социальной активности и особенностей восприятия городских объектов на материале массива данных из социальных сетей (Social Media Listening, SML). Использование SML в исследованиях КБ Стрелка позволяет выявить типологию пользователей, составить их портрет и исследовать паттерны поведения, а также определить, как пользователи относятся к выбранным объектам, на какие проблемы жалуются, описывая свой пользовательский опыт. Для анализа массива анонимизированных данных применялся графовый алгоритм TextRank и технологии машинного обучения, основанные на обработке естественного языка (Natural Language Processing, NLP).

Площадками для сбора текстов стали социальные сети, блоги, форумы, сайты отзывов, всего свыше 700 площадок разного уровня активности: в том числе, в социальной сети ВКонтакте было размещено 20 % обнаруженных текстов, в сети Одноклассники — 13 %, на Фейсбуке — 7 %, в Инстаграме – 5 %, в Твиттере – 1 %, на Youtube – 1 %. Исследователи изучили тексты, которые были опубликованы за 12 месяцев: с июля 2019 по июль 2020 года, — и захватили период пандемии COVID-19 и введения карантинных мер, ограничивавших туризм.

более

700

онлайн-площадок в социальных сетях, блогах, форумах, сайтах отзывов было задействовано в сборе данных

6,3

млн

текстов были проанализированы с помощью искусственного интеллекта

12

месяцев

составил период сбора текстов (июль 2019 г. — июль 2020 г.)

При разработке портретов регионов в текстах выявили 6 составляющих туристического продукта:

icon_1

Материальное наследие

Здания, картины, скульптуры, памятники и так далее.

icon_2

Нематериальное наследие

Музыка, кулинария, язык, традиции, литература и так далее.

icon_3

Природа

Горы, реки, леса, дикая фауна, озера, моря и так далее.

icon_4

Событийная программа

Фестивали, спектакли, концерты и так далее.

icon_5

Технологии и производство

Космические технологии, сельское хозяйство, промышленность, военная техника и так далее.

icon_6

Туристическая инфраструктура

Транспортная система, гостиницы, кафе, экскурсии, гиды, сувениры и так далее.

Особенности методики расчета индекса

Широкий охват

Анализ пользовательских текстов в социальных медиа позволяет в короткие сроки выявить позиции большого числа людей.

Непредвзятость

В социальных медиа люди оставляют неспровоцированные суждения. Отсутствие влияния исследователя минимизирует социально одобряемые ответы. Это позволяет получить более искреннее мнение, чем при использовании классических опросных методов.

Эмоциональность

Тексты в социальных медиа, как правило, размещают люди, эмоционально вовлеченные в тему обсуждения. Это позволяет получить уникальную информацию о запросах, ценностях, практиках целевой аудитории.

Влияние

Тексты пользователей социальных медиа не только отражают их впечатления от туристической поездки, но и влияют на их подписчиков, которые могут заинтересоваться регионом. Поэтому анализ социальных сетей — это не только барометр текущих туристических предпочтений, но и оценка привлекательности региона как туристического направления в ближайшем будущем.

Перспективность

Индекс основан на высказываниях людей, активно пользующихся социальными сетями. Среди них много молодых людей, которые станут основными потребителями туристического продукта в ближайшие десятилетия.