Перепись 2021. Национальный состав РФ: база данных (выпуск №4.1)
Jan 08, 2023 23:43
Между двумя альтернативами - продолжать подготавливать трудоемкий, но полноценный четвертый выпуск публикаций итогов Всероссийской переписи населения - 2021 еще невесть сколько дней, либо же поделиться ценными наработками уже сейчас - выбрал второе. В том числе из-за того, что праздники заканчиваются, ну и во избежание двойной работы, в рамках экономии времени коллег по цеху. Кстати, вот они (и прочие интересовавшиеся темой):
Сегодняшний magnum opus - в полуавтоматическом, но больше ручном, режиме переработанная росстатовская база данных о национальном составе России в разрезе субъектов, с дополнительной разбивкой на городское и сельское население (оригинал - том 5, таблица 1). Итоговый файл доступен для чтения и скачивания по ссылке:
Внутри: - Исходные данные ВПН-2021 (общее, городское, сельское население 85 субъектов и РФ в целом). Всем национальностям в официальной трактовке Росстата, субэтносам (помечены звездочкой - их численность учтена в составе "материнского" этноса) и сводным строчкам для удобства присвоил ID, расставив их по языковой классификации; - Проценты от от указавших нац. принадлежность (даже если это пункт "нет национальности"), от корректных ответов (без "других" и "нет национальности"), а также расчет процентов с пропорциональным распределением не указавших отдельно по городу и селу; - Исходные данные и процентовка по ВПН-2010, объединенная с данными переписи Крыма-2014 (и перебросом Новой Москвы между регионами для сопоставимости). Без субэтносов, но с теми же ID и порядком регионов; - Модели пересчета национального состава на 2021 путем пропорционального распределения не указавших и некорректно указавших - по субъектам и по субъектам с учетом городской/сельской местности (то есть по 168 отдельным составляющим - максимальная доступная на данный момент детальность); - Аналогичный пересчет не указавших для 2010/2014, а также бонус - данные из таблицы 5.2 о структуре пункта "другие ответы" в 2021 в целом по России (по субъектам данных нет).
И напоследок, чтобы пост не был совсем уж сухим - карта, которую в любом случае нужно было бы сделать, просто потому что:
UPD. Концепция поменялась, нарекаю данный пост выпуском номер 4.1, дальнейшие материалы буду выкладывать также порционно.