КЛАСТЕРНЫЙ АНАЛИЗ КАК ИНСТРУМЕНТ ИССЛЕДОВАНИЯ
МИГРАЦИОННЫХ ДОМИНАНТ
Аннотация:
представлены результаты статистического анализа
поисковых
запросов
воздушных
маршрутных
сетей
России
за
двенадцатимесячный период с 01.04.2020 г. по 01.04.2021 г. Проведен
корреляционный анализ между численностью населения по субъектам РФ и
количеством поисковых запросов. Также проведён кластерный анализ среди
субъектов РФ в целях определения миграционных доминант. Сформирована и
уточнена частотная карта наиболее насыщенных направлений и региональных
маршрутных сетей в зависимости от пункта отправления авиапассажиров.
Предложены классификации субъектов РФ по протяжённости и объёму
маршрутных сетей, по тесноте межрегиональных социально-экономических
связей, выявлена типология направленности межрегиональных связей,
влияющих на значимость миграционной доминанты.
Ключевые слова:
Трудовая миграция, внутренняя и внешняя миграция,
миграционная доминанта, кластеризация субъектов Федерации, поисковый
запрос.
CLUSTER ANALYSIS AS A TOOL FOR RESEARCHING
MIGRATION DOMINANTS
Abstract: presents the results of statistical analysis of search queries of air
route networks of Russia for the twelve-month period from 01.04.2020 to 01.04.2021.
A correlation analysis is carried out between the population size in the subjects of the
Russian Federation and the number of search queries. A cluster analysis is also
carried out among the subjects of the Russian Federation in order to determine the
migration dominants. A frequency map of the most saturated destinations and
regional route networks is formed and refined, depending on the departure point of
air passengers. The classifications of the subjects of the Russian Federation by the
length and volume of route networks, by the closeness of interregional socio-
economic ties are proposed, the typology of the orientation of interregional ties
affecting the significance of the migration dominant is revealed.
Key words: Labor migration, internal and external migration, migration
dominant,clustering of federal subjects, search query
440
Для оценки фактора социально-экономических связей между некоторыми
регионами Российской Федерации, а также для изучения фактора транспортной
инфраструктуры, рассмотрим статистику метапоисков, произведенных внутри
страны по внутренним направлениям авиасообщения.
Метапоиском в рамках данного исследования считается процесс подбора
маршрута в системе «ООО ‘E-Tickets’» [5]. Каждый запрос для покупки
авиабилета считается поиском. В результате автором была получена статистика
запросов для покупки авиабилетов в срезе даты поиска, города отправления,
города прибытия и количества поисковых запросов за период 01.04/20 –
01.04/21.
Автор исследования отдаёт себе отчет в том, что именно на указанный
период пришелся коллапс внутреннего и международного авиасообщения,
вызванного эпидемией коронавируса Covid-19, тем не менее, в контексте
данного исследования и в силу ограниченной доступности данных,
полагается, что объем поисковых запросов в указанный период должен быть
прямо пропорционален объёму до введения ограничений и закрытия
внутренних перелетов.
По причине неравномерного распределения численности населения по
городам перед исследователем, решившим изучить социально-экономические
связи на базе поисковых запросов авиабилетов, стояла задача объективно
взвесить значение каждого направления для региона – отправителя.
Автором предлагается следующая методология, базирующаяся на
выявлении и исчислении ранга направления в отношении региональной
численности населения. Для этого необходимо исключить из статистики
поисковых запросов те запросы, которые можно отнести к статистическим
выбросам в силу своей главенствующей позиции на карте РФ (г. Москва, г.
Санкт-Петербург), а также ряд населённых пунктов, привлекательных,
например, своими природными и территориальными характеристиками,
рекреационным потенциалом для всех российских туристов (районы Сочи,
Симферополя, Геленджика, Анапы и др.). Тем не менее, включение этих
441
маршрутов в анализ не обязательно будет свидетельствовать в полной мере о
существовании каких-либо устойчиво тесных социально-экономических и
производственных связей по следующим причинам:
1) На взаимоотношениях со столицей сегодня завязаны все регионы, к
тому же Москва и Санкт-Петербург не только самые густонаселённые города
на территории РФ, но и транспортные и перегрузочные хабы. Их котловой учёт
среди других субъектов может смазать истинную картину формирования их
действительных региональных связей и негативно повлиять на формирование
упомянутой карты.
2). Учет туристических маршрутов, в свою очередь, сильно зависит от
сезонности отдыха в туристских дестинациях. Данное явление должно быть
исследовано самостоятельно. Следуя из очевидной предпосылки, что
количество поисковых запросов напрямую зависит от численности населения в
рассматриваемом населенном пункте, представляется необходимым включение
в методологию в качестве составной части изучение маршрутных сетей,
учитывающих фактор численности населения территории.
Расчётный показатель двустороннего коэффициента корреляции Пирсона
подтверждает наличие высокой тесноты связи между количеством поисков и
численностью населения на уровне 0,92, что нашло отражение в табл. 1.
Таблица 1 – Расчет двустороннего коэффициента корреляции Пирсона
для пары количество поисков – численность населения
searches
population
searches
Корреляция Пирсона
1
,922
**
Значения.
(двухсторонняя)
.000
Объем
рандоминизированной
выборки
192
192
**. Корреляция значима на уровне 0,01 (двухсторонняя).
442
Источник: составлено автором на основе статистики поисковых запросов
в системе «ООО ‘E-Tickets’» и оценки численности населения по населенным
пунктам Росстата.
Таблица 2 – Расчёт одностороннего коэффициента корреляции Пирсона
по выделенным группам для пары факторов: количество поисков – численность
населения
Группа
Показатель
searches
population
1
Корреляция
Пирсона
1
,665**
Знач.
(односторонняя)
0.007
N
13
13
2
Корреляция
Пирсона
1
,454*
Знач.
(односторонняя)
0.025
N
19
19
3
Корреляция
Пирсона
1
0.289
Знач.
(односторонняя)
0.057746191
N
31
31
4
Корреляция
Пирсона
1
-0.044
Знач.
(односторонняя)
0.416
N
26
26
5
Корреляция
Пирсона
1
,397**
Знач.
(односторонняя)
0.004
N
44
44
6
Корреляция
Пирсона
1
,287*
Знач.
(односторонняя)
0.020
N
52
52
Источник: составлено автором на основе статистики поисковых запросов
в системе «ООО ‘E-Tickets’» и оценки численности населения по населенным
пунктам Росстата
.
443
Для учёта фактора численности населения предлагается следующая
типология субъектов РФ и иных населённых пунктов, социально-
экономические связи которых должны быть исследованы в зависимости от
численности населения:
1. Более 1 млн чел. населения;
2. От 500 тыс. чел. – до 1 млн чел.;
3. От 250 тыс. чел. – до 500 тыс. чел.;
4. От 100 тыс. чел. – до 250 тыс. чел.;
5. От 10 тыс. чел. – до 100 тыс. чел.;
6. Менее 10 тыс. человек населения.
Как можно видеть из данных табл. 2, в которой представлены расчеты
одностороннего коэффициента корреляции Пирсона между показателями
количества поисков и численности населения, зависимость остается значимой
на 1%-м уровне для типа территорий № 1 и № 5 (более 1 млн чел. Населения и
10 тыс. чел. – 100 тыс. чел., соответственно). Для типов территорий №2, № 4 и
№ 6 (500 тыс. чел. – 1 млн чел.; 100 тыс. чел. – 250 тыс. чел. и менее 10 тыс.
чел., соответственно) уровень статистической значимости определён для 5%.
Для типа территорий № 3 (250 тыс. чел. – 500 тыс. чел.) зависимость по
авторским расчётам признается статистически незначимой. Для целей
региональной экономики социально-экономические связи, оцениваемые по
малонаселенным пунктам, представляют собой особый интерес по целому ряду
вопросов, но в рамках данного исследования были рассмотрены
густонаселённые поселения на карте России, а именно с численностью
населения свыше 250 тыс. человек.
Исследуя полученные данные, автор пришёл к выводу, что субъекты РФ в
качестве объекта анализа поддаются типологизации в зависимости от размера
маршрутных сетей. Помимо этого, поддаются качественной оценке и сами
межрегиональные связи в контексте маршрутной сети. В качестве
промежуточной гипотезы можно сделать предположение, что размер
маршрутной сети может быть связан с социально-экономической
444
привлекательностью регионов. К базовым ключевым признакам в данном
случае можно отнести следующие показатели:
• Уровень среднемесячной номинальной заработной платы [6]
• Региональный прожиточный минимум [7]
• Доля безработного населения [8].
Таблица 3 – Кластерный анализ для определения экономически
привлекательных регионов РФ
Кластер 1
Кластер 2
Состав кластера
Дистанция
Состав кластера
Дистанция
Москва
0
Московская область
0.4231
Ханты-Мансийский
автономный округ
0.7364
Приморский край
0.7071
Красноярский край
0.7514
Амурская область
0.7108
Сахалинская область
1.2354
г. Санкт-Петербург
1.8263
Республика Крым
0.6761
Город федерального значения
Севастополь
0.4067
Республика Татарстан
0.5035
Нижегородская область
0.7491
Краснодарский край
0.6485
Кластер 3
Состав кластера
Дистанция
Состав кластера
Дистанция
Белгородская
область
0.3063
Свердловская область
0.476
Брянская область
0.5399
Астраханская область
0.1419
Воронежская
область
0.1186
Волгоградская область
0.1223
Калужская область
0.3055
Ростовская область
0.3365
Костромская область
0.3759
Республика Дагестан
0.5393
Рязанская область
0.1764
Карачаево-Черкесская
Республика
0.3643
Смоленская область
0.4721
Республика Северная Осетия
0.3688
Тамбовская область
0.4683
Чеченская Республика
0.1139
Ярославская область
0.2294
Ставропольский край
0.3412
Республика Хакасия
0.2965
Республика Башкортостан
0.3281
Алтайский край
0.0893
Республика Марий Эл
0.3932
Хабаровский край
0.3441
Республика Мордовия
0.2245
445
Иркутская область
0.4415
Удмуртская Республика
0.1908
Кемеровская область
0.1605
Чувашская Республика
0.2558
Новосибирская
область
0.5838
Пермский край
0.3952
Омская область
0.1274
Кировская область
0.2086
Томская область
0.2408
Оренбургская область
0.2802
Забайкальский край
0.4944
Пензенская область
0.136
Республика Карелия
0.2307
Самарская область
0.0936
Вологодская область
0.2337
Саратовская область
0.3472
Калининградская
область
0.3409
Ульяновская область
0.1472
Ленинградская
область
0.5623
Тюменская область
0.3929
Псковская область
0.3606
Республика Саха (Якутия)
0.1434
Республика
Калмыкия
0.6261
Челябинская область
0.4482
Результаты кластерного анализа, представленные в табл. 3, можно
назвать вполне показательными, так как наблюдается определённое
соответствие между регионами из второго кластера (из четырёх выделенных) и
регионами лидерами по размеру маршрутной сети: Ханты-Мансийский АО,
Краснодарский край, Красноярский край – отнесены ко второму кластеру, то
есть к группе социально привлекательных регионов [9].
Помимо классификации по принципу размера маршрутной сети региона
отправления следует отдельно рассматривать статистическую тесноту
межрегиональных связей для каждого региона. Обосновать это можно разным
уровнем значимости каждого направления в маршрутной сети регионов. Так, к
примеру, размер маршрутной сети Псковской области составляет 5
направлений, но 81,0% всех поисков приходится на Калининградскую область,
что делает связи с Краснодарским краем, Республикой Татарстан, Ростовской и
Свердловской областями явно несущественными, что представлено в табл. 4.
Автором исследования предлагается следующая интерпретация уровня
значимости направления (
K shm
) для региона отправителя, что позволяет
сформулировать деление субъектов на так называемые мононаправленные и
полинаправленные:
446
• 0% <
Достарыңызбен бөлісу: |