Т.Б. Скрипкина
Новосибирский государственный университет экономики и управления «НИНХ», Новосибирск, Российская Федерация t.b.skripkina@nsuem.ru
Ключевые слова: импутация статистических данных, восстановление пропусков данных, муниципальная статистика, метод K ближайших соседей, критерий согласия Пирсона, imputation of statistical data, restoration of data omissions, municipal statistics, K nearest neighbor method, Pearson's consent criterion
Страницы: 277-286
Аннотация
Рассмотрена ключевая проблема проведения статистического анализа на массиве данных муниципальной статистики: наличие существенного количества пропущенных данных. Приведено понятие и виды импутации данных. Обосновано применение метода K ближайших соседей для проведения импутации на этапе использования данных официальной статистики, содержащихся в Базе данных показателей муниципальных образований. Предложен авторский алгоритм восстановления пропусков в массиве данных показателей муниципальной статистики с использованием системы STATISTICA . Верификация результатов импутации проведена путем сравнения распределений исходных и восстановленных данных на основе критерия согласия Пирсона .
Наш сайт использует куки. Продолжая им пользоваться, вы соглашаетесь на обработку персональных данных в соответствии с политикой конфиденциальности. Подробнее