Дискложес Автоматизированный сбор деклараций о доходах | |
В этом исследовании мы изучаем доходы чиновников по регионам за 2020 год (см. предыдущие отчеты здесь ).
На февраль 2022 года в базе содержится всего 476708 деклараций за 2020 год, из них около 12% деклараций приписаны федеральным ведомствам, которые не рассматриваются в этом исследовании. Остальные деклараций пришли из регионов. Первая проблема — из-за ошибок парсинга доходов в базе возникают доходы больше 100 млн. рублей. Конечно, чиновники с такими доходами в природе есть, но ошибок больше, поэтому в этом исследовании мы не будем рассматривать доходы свыше 5 млн в год. Дальше нас интересуют доходы только самих чиновников, а не их жён(мужей). По сравнению с отчетами за прошлый год мы добавили условие, что доход чиновника не может быть меньше МРОТ (аналогичное условие введено в сравнении дохода отдельного чиновника c доходами населения)
Мы будем сравнивать доход чиновников с медианной зарплатой граждан по регионам, посчитанной Росстатом . Проблема в том, что Росстат публикует данные о медианной зарплате раз в два года (по нечетным годам), а у нас исследование касается четного года (2020). Будем считать, что мы можем получить приблизительное значение медианы за 2020 года, взяв среднее между 2019 и 2021 годам.
Если бы мы оперировали только данными от Росстата, сравнивать доход и зарплату было бы совсем неправильно. Доход жителя региона - это сумма всех доходов жителей региона, поделенное на число жителей (включая детей и других неработающих). Однако с учетом всех введенных выше ограничений, доход в декларации о доходах по большей части состоит именно из зарплаты чиновника (по нашим представлениям).
Ниже даны названия и описания колонок основной таблицы:
Название | Описание |
---|---|
Id | Идентификатор региона |
Region | Название региона |
MeD | Медианный доход чиновника (декларанта) в месяц в регионе |
MeP | Медианная зарплата граждан в регионе |
Ineq | Медианный доход чиновника, поделенный на медианную зарплату граждан |
DecCnt | Количество учтенных деклараций |
Population | Численность населения |
DecDens | Количество учтенных деклараций, поделенное на численность населения |
IncomeDens | Сумма доходов чиновников, поделенная на численность населения |
ER | Поддержка Единой России на последних выборах в Госдуму (проценты) |
Основная таблица для регионов (заголовки кликабельны):
Id | Region | MeD | MeP | Ineq | DecCnt | Population | DecDens | IncomeDens | ER |
---|---|---|---|---|---|---|---|---|---|
1 | Санкт-Петербург | 102627 | 54951 | 1,87 | 11217 | 5398064 | 0,0021 | 2920 | 35,0 |
3 | Республика Адыгея | 57128 | 26181 | 2,18 | 1509 | 463088 | 0,0033 | 2877 | 66,4 |
4 | Республика Башкортостан | 63348 | 32705 | 1,94 | 8868 | 4038151 | 0,0022 | 2277 | 66,6 |
5 | Республика Бурятия | 69952 | 33870 | 2,07 | 2178 | 985937 | 0,0022 | 2349 | 42,6 |
6 | Республика Алтай | 62264 | 26902 | 2,31 | 1394 | 220181 | 0,0063 | 5856 | 38,5 |
8 | Республика Ингушетия | 54852 | 21445 | 2,56 | 1036 | 507061 | 0,002 | 1701 | 85,2 |
9 | Кабардино-Балкарская Республика | 49471 | 21529 | 2,3 | 1684 | 868350 | 0,0019 | 1552 | 79,2 |
11 | Карачаево-Черкесская республика | 51772 | 22417 | 2,31 | 1231 | 465528 | 0,0026 | 2228 | 80,1 |
12 | Республика Карелия | 85832 | 37733 | 2,27 | 2595 | 614064 | 0,0042 | 5179 | 31,7 |
13 | Республика Коми | 84866 | 45589 | 1,86 | 2972 | 820473 | 0,0036 | 4461 | 29,4 |
17 | Республика Северная Осетия — Алания | 41516 | 22376 | 1,86 | 2328 | 696837 | 0,0033 | 2154 | 71,1 |
18 | Республика Татарстан | 54809 | 33653 | 1,63 | 9233 | 3902888 | 0,0024 | 2096 | 79,0 |
20 | Удмуртская республика | 49836 | 29914 | 1,67 | 2813 | 1500955 | 0,0019 | 1480 | 35,6 |
21 | Республика Хакасия | 65299 | 33362 | 1,96 | 1642 | 534262 | 0,0031 | 3080 | 33,4 |
24 | Алтайский край | 49159 | 26019 | 1,89 | 7370 | 2317153 | 0,0032 | 2391 | 33,7 |
27 | Краснодарский край | 60327 | 31895 | 1,89 | 17130 | 5675462 | 0,003 | 2795 | 61,0 |
28 | Красноярский край | 82842 | 41879 | 1,98 | 10948 | 2866255 | 0,0038 | 4686 | 34,6 |
29 | Пермский край | 61506 | 34173 | 1,8 | 9582 | 2599260 | 0,0037 | 3683 | 33,6 |
32 | Хабаровский край | 101238 | 46706 | 2,17 | 3820 | 1315643 | 0,0029 | 4250 | 24,5 |
33 | Амурская область | 70343 | 45266 | 1,55 | 3865 | 790044 | 0,0049 | 4982 | 34,3 |
35 | Брянская область | 56396 | 26722 | 2,11 | 4143 | 1192491 | 0,0035 | 3004 | 64,3 |
36 | Владимирская область | 60880 | 30642 | 1,99 | 3086 | 1358416 | 0,0023 | 2077 | 37,6 |
37 | Архангельская область | 78180 | 44906 | 1,74 | 4798 | 1092424 | 0,0044 | 5026 | 32,2 |
38 | Астраханская область | 55321 | 28440 | 1,95 | 2775 | 1005782 | 0,0028 | 2292 | 48,1 |
41 | Волгоградская область | 53410 | 28777 | 1,86 | 5882 | 2491036 | 0,0024 | 2061 | 58,4 |
42 | Вологодская область | 63886 | 35941 | 1,78 | 4566 | 1160445 | 0,0039 | 3743 | 34,3 |
43 | Воронежская область | 61788 | 30588 | 2,02 | 5765 | 2324205 | 0,0025 | 2531 | 55,9 |
44 | Забайкальский край | 66644 | 36504 | 1,83 | 3627 | 1059700 | 0,0034 | 3524 | 38,7 |
45 | Иркутская область | 75998 | 41146 | 1,85 | 7052 | 2391193 | 0,0029 | 3278 | 35,5 |
46 | Калининградская область | 66679 | 33459 | 1,99 | 3462 | 1012512 | 0,0034 | 3399 | 41,1 |
47 | Республика Калмыкия | 50177 | 23995 | 2,09 | 1647 | 271135 | 0,0061 | 5195 | 39,5 |
48 | Камчатский край | 130036 | 67111 | 1,94 | 1994 | 313016 | 0,0064 | 11010 | 34,8 |
50 | Кемеровская область | 64056 | 36711 | 1,74 | 3210 | 2657854 | 0,0012 | 1178 | 70,7 |
51 | Кировская область | 48091 | 27381 | 1,76 | 5455 | 1262402 | 0,0043 | 3366 | 29,5 |
53 | Костромская область | 46768 | 26833 | 1,74 | 2897 | 633385 | 0,0046 | 3402 | 30,3 |
55 | Курская область | 48868 | 29244 | 1,67 | 6992 | 1104008 | 0,0063 | 4923 | 43,5 |
56 | Ленинградская область | 83841 | 44560 | 1,88 | 5449 | 1875872 | 0,0029 | 3393 | 43,1 |
57 | Липецкая область | 59642 | 31038 | 1,92 | 3723 | 1139371 | 0,0033 | 3003 | 48,7 |
58 | Магаданская область | 124790 | 75208 | 1,66 | 1155 | 140149 | 0,0082 | 13973 | 50,1 |
59 | Республика Дагестан | 48968 | 21748 | 2,25 | 2588 | 3110858 | 0,0008 | 630 | 81,2 |
61 | Республика Марий Эл | 56147 | 25950 | 2,16 | 1620 | 679417 | 0,0024 | 2279 | 33,4 |
62 | Республика Мордовия | 48486 | 26395 | 1,84 | 2845 | 790197 | 0,0036 | 2951 | 66,0 |
63 | Москва | 142966 | 70916 | 2,02 | 13859 | 12678079 | 0,0011 | 2103 | 37,0 |
64 | Московская область | 96074 | 48208 | 1,99 | 7972 | 7690863 | 0,001 | 1404 | 45,7 |
65 | Мурманская область | 101564 | 54292 | 1,87 | 3094 | 741404 | 0,0042 | 5836 | 35,8 |
66 | Нижегородская область | 66868 | 33285 | 2,01 | 9385 | 3202946 | 0,0029 | 3042 | 49,9 |
67 | Новгородская область | 58760 | 30997 | 1,9 | 2735 | 596508 | 0,0046 | 4170 | 32,5 |
68 | Новосибирская область | 63243 | 35217 | 1,8 | 9183 | 2798170 | 0,0033 | 3287 | 35,2 |
69 | Омская область | 54807 | 29524 | 1,86 | 5816 | 1926665 | 0,003 | 2633 | 32,9 |
70 | Орловская область | 51867 | 25558 | 2,03 | 2257 | 733498 | 0,0031 | 2491 | 38,8 |
72 | Пензенская область | 62324 | 27752 | 2,25 | 2711 | 1305563 | 0,0021 | 1994 | 56,2 |
74 | Приморский край | 78003 | 43936 | 1,78 | 5125 | 1895868 | 0,0027 | 3096 | 37,4 |
75 | Псковская область | 58338 | 26251 | 2,22 | 2931 | 626115 | 0,0047 | 4161 | 40,1 |
76 | Ростовская область | 54583 | 29930 | 1,82 | 11731 | 4197821 | 0,0028 | 2349 | 51,6 |
77 | Самарская область | 59291 | 32658 | 1,82 | 8238 | 3179532 | 0,0026 | 2395 | 44,3 |
79 | Саратовская область | 66125 | 27134 | 2,44 | 2182 | 2421895 | 0,0009 | 1021 | 59,8 |
80 | Свердловская область | 73137 | 37226 | 1,96 | 9285 | 4310681 | 0,0022 | 2337 | 34,7 |
81 | Ставропольский край | 56221 | 26526 | 2,12 | 9007 | 2803573 | 0,0032 | 2817 | 61,8 |
82 | Тамбовская область | 45699 | 26294 | 1,74 | 3903 | 1006748 | 0,0039 | 2916 | 56,9 |
84 | Тульская область | 57298 | 34176 | 1,68 | 6016 | 1466127 | 0,0041 | 3667 | 52,9 |
85 | Республика Тува (Тыва) | 71439 | 29823 | 2,4 | 875 | 327383 | 0,0027 | 2896 | 85,3 |
86 | Тюменская область | 157465 | 52667 | 2,99 | 11607 | 3756536 | 0,0031 | 6246 | 51,3 |
88 | Ульяновская область | 54975 | 27848 | 1,97 | 2963 | 1229824 | 0,0024 | 2130 | 39,0 |
89 | Челябинская область | 63636 | 33676 | 1,89 | 7490 | 3466369 | 0,0022 | 2091 | 34,3 |
90 | Чеченская республика | 53701 | 23668 | 2,27 | 2266 | 1478726 | 0,0015 | 1294 | 96,1 |
91 | Чувашская республика - Чувашия | 39331 | 26599 | 1,48 | 3744 | 1217818 | 0,0031 | 1919 | 37,2 |
92 | Республика Саха (Якутия) | 110021 | 59847 | 1,84 | 3345 | 971996 | 0,0034 | 5413 | 33,2 |
93 | Еврейская автономная область | 76829 | 37120 | 2,07 | 1051 | 158305 | 0,0066 | 7703 | 56,4 |
94 | Сахалинская область | 135222 | 67143 | 2,01 | 2934 | 488257 | 0,006 | 11080 | 35,7 |
95 | Чукотский автономный округ | 151598 | 86351 | 1,76 | 473 | 50288 | 0,0094 | 18957 | 46,7 |
96 | Белгородская область | 60276 | 32569 | 1,85 | 6696 | 1549151 | 0,0043 | 3928 | 51,7 |
97 | Калужская область | 61812 | 36263 | 1,7 | 3891 | 1002575 | 0,0039 | 3617 | 36,3 |
98 | Курганская область | 50777 | 26738 | 1,9 | 2711 | 827166 | 0,0033 | 2603 | 36,1 |
99 | Ивановская область | 57448 | 25230 | 2,28 | 2725 | 997135 | 0,0027 | 2581 | 36,2 |
100 | Смоленская область | 46824 | 27904 | 1,68 | 3632 | 934889 | 0,0039 | 3012 | 39,9 |
101 | Тверская область | 63272 | 30531 | 2,07 | 4278 | 1260379 | 0,0034 | 3150 | 35,4 |
103 | Рязанская область | 58778 | 30795 | 1,91 | 4331 | 1108847 | 0,0039 | 3287 | 47,8 |
105 | Оренбургская область | 57598 | 29682 | 1,94 | 4261 | 1956835 | 0,0022 | 1997 | 38,4 |
106 | Томская область | 73244 | 36391 | 2,01 | 2983 | 1079271 | 0,0028 | 3076 | 32,7 |
107 | Ярославская область | 52501 | 32081 | 1,64 | 4405 | 1253389 | 0,0035 | 2702 | 29,7 |
109 | Республика Крым | 56422 | 27685 | 2,04 | 4651 | 1912622 | 0,0024 | 2073 | 63,3 |
110 | Севастополь | 64097 | 32743 | 1,96 | 1718 | 449138 | 0,0038 | 3676 | 56,4 |
Название | Id | Region | MeD | MeP | Ineq | DecCnt | Population | DecDens | IncomeDens | ER |
---|---|---|---|---|---|---|---|---|---|---|
Id | rho=-0.00, pval=0.965 | rho=0.02, pval=0.826 | rho=-0.07, pval=0.561 | rho=0.04, pval=0.705 | rho=0.01, pval=0.914 | rho=0.11, pval=0.329 | rho=0.05, pval=0.681 | rho=-0.02, pval=0.881 | ||
Region | ||||||||||
MeD | rho=0.87, pval=0.000 | rho=0.13, pval=0.255 | rho=0.09, pval=0.400 | rho=0.03, pval=0.757 | rho=0.08, pval=0.469 | rho=0.47, pval=0.000 | rho=-0.26, pval=0.017 | |||
MeP | rho=-0.32, pval=0.003 | rho=0.32, pval=0.003 | rho=0.15, pval=0.172 | rho=0.20, pval=0.066 | rho=0.52, pval=0.000 | rho=-0.40, pval=0.000 | ||||
Ineq | rho=-0.36, pval=0.001 | rho=-0.13, pval=0.250 | rho=-0.33, pval=0.003 | rho=-0.18, pval=0.098 | rho=0.29, pval=0.009 | |||||
DecCnt | rho=0.85, pval=0.000 | rho=-0.14, pval=0.210 | rho=-0.04, pval=0.699 | rho=-0.16, pval=0.147 | ||||||
Population | rho=-0.58, pval=0.000 | rho=-0.45, pval=0.000 | rho=0.06, pval=0.614 | |||||||
DecDens | rho=0.87, pval=0.000 | rho=-0.31, pval=0.005 | ||||||||
IncomeDens | rho=-0.41, pval=0.000 | |||||||||
ER |
Мы не может проводить серьезный анализ, поскольку выборка слишком мала. Однако есть желание проверить, что данные нас не удивляют. Если бы удивляли, может быть, это означало наличие ошибок в наших вычислениях.
Мы посчитали коэффициенты ранговой корреляции Спирмена для всех колонок, кроме названия региона. В каждой ячейке помещены два числа: ранговый коэффициент корреляции Спирмена(rho) и pvalue этой оценки. Данные помещены в следующую таблицу:
Название | Id | Region | MeD | MeP | Ineq | DecCnt | Population | DecDens | IncomeDens | ER |
---|---|---|---|---|---|---|---|---|---|---|
Id | rho=-0.00, pval=0.965 | rho=0.02, pval=0.826 | rho=-0.07, pval=0.561 | rho=0.04, pval=0.705 | rho=0.01, pval=0.914 | rho=0.11, pval=0.329 | rho=0.05, pval=0.681 | rho=-0.02, pval=0.881 | ||
Region | ||||||||||
MeD | rho=0.87, pval=0.000 | rho=0.13, pval=0.255 | rho=0.09, pval=0.400 | rho=0.03, pval=0.757 | rho=0.08, pval=0.469 | rho=0.47, pval=0.000 | rho=-0.26, pval=0.017 | |||
MeP | rho=-0.32, pval=0.003 | rho=0.32, pval=0.003 | rho=0.15, pval=0.172 | rho=0.20, pval=0.066 | rho=0.52, pval=0.000 | rho=-0.40, pval=0.000 | ||||
Ineq | rho=-0.36, pval=0.001 | rho=-0.13, pval=0.250 | rho=-0.33, pval=0.003 | rho=-0.18, pval=0.098 | rho=0.29, pval=0.009 | |||||
DecCnt | rho=0.85, pval=0.000 | rho=-0.14, pval=0.210 | rho=-0.04, pval=0.699 | rho=-0.16, pval=0.147 | ||||||
Population | rho=-0.58, pval=0.000 | rho=-0.45, pval=0.000 | rho=0.06, pval=0.614 | |||||||
DecDens | rho=0.87, pval=0.000 | rho=-0.31, pval=0.005 | ||||||||
IncomeDens | rho=-0.41, pval=0.000 | |||||||||
ER |
В первой строке находится коэффициент корреляции для идентификатора региона. Видно, что все значения ожидаемо находятся на "мусорном" уровне (меньше 0.1).
Мы видим, что корреляция между медианной зарплатой в регионе (MeP) и медианным доходом чиновника(MeD) очень сильная - rho=0.87, pval=0.000. Это свидетельствует о простом факте: чиновники из бедных регионов получают меньше, чем чиновники из богатых. Кажется, это не должно удивлять. Если смотреть на данные глазами, можно увидеть, что, чтобы получить медианный доход чиновника в регионе, нужно примерно умножить медианную зарплату обычного гражданина на 2, т.е. значении в колонке Ineq лежит в пределах от 1.48 до 2.99.
Интересно еще посмотреть на список регионов, где разница между доходами чиновников и обычных граждан очень высока (для сортировки нажмите на заголовок колонки Ineq). Самый большой разрыв у Тюменской области, Ингушетии, Саратовской области, Тувы, Алтай, Карачаево-Черкессии. Если смотреть за предыдущие годы, Саратовской области в этом топе не было. Объяснение этому нет, наверно, стоит изучить эту проблему.
Далее мы посмотрим самые большие значения корреляции. Учитываем, что все значения меньше 0.20 уже можно признать очень слабыми.
Spearman(DecCnt, Population) = 0.86 - чем больше населения, тем больше деклараций чиновников - это понятный результат.
Spearman(DecDens, IncomeDens) = 0.87 - чем больше деклараций, тем больше сумма всех доходов этих деклараций - это понятный результат.
Spearman(Population, DecDens) = -0.58 - чем больше регион, тем меньше плотность чиновников на регион.
Spearman(Population, IncomeDens) = -0.45 - чем больше регион, тем меньше люди в среднем платят за чиновников.
Spearman(MeD, IncomeDens) = 0.47 - объясняется тем, что числитель IncomeDens - это сумма доходов.
Spearman(MeP, ER) = -0.40 - чем выше доход населения, тем меньше они голосуют за Единую Россию.
Spearman(Ineq, MeP) = -0.32 - чем больше дисбаланс между доходами чиновников и народа, тем ниже средние зарплаты народа.
Spearman(Ineq, ER) = 0.29 - чем выше поддержка Единой России, тем больше дисбаланс между доходами чиновников и народа.
Утверждение Spearman(Ineq, ER)=0.29 звучит интересно и актуально, но оно уже очень слабо поддерживается данными, поскольку уровень 0.29 не считается сильным. С другой стороны, это, конечно, не мусор. Хотя вполне возможно, здесь нет прямой связи между Ineq и ER, и, например, эта связь возникает из-за более сильного утверждения, что Spearman(MeP, ER)=-0.40