
Введение
Страна представляет собой сложную систему с множеством параметров, которые позволяют оценить её текущее состояние. Анализируя показатели за прошлые годы, можно выявить тенденции и попытаться спрогнозировать развитие событий в будущем.
Для анализа я выбрала данные, отражающие ключевые экономические и социальные показатели страны. Эти данные были взяты из открытых статистических источников.
Моя работа направлена на создание простого подхода, который позволяет на основе исторических данных предсказывать возможные экономические кризисы.
Мне было интересно проанализировать именно эти данные, потому что они отражают реальные процессы, происходящие в экономике страны. Эти показатели позволяют увидеть взаимосвязь между различными сферами — производством, инфляцией, уровнем безработицы и другими экономическими факторами.
Кроме того, анализ таких данных имеет практическую ценность: он помогает лучше понимать, какие признаки могут предвосхищать кризисные явления, и, следовательно, использовать эти знания для более точного прогнозирования и принятия решений в будущем.
Типы графиков
Для визуализации данных я использовала следующие типы графиков:
1. Линейный график 2. Матрица 3. Столбчатая диаграмма 4. Гистограмма
С их помощью проводится элементарный анализ временных рядов, который решает две задачи:
А) выявить наличие периодических (сезонных) и трендовых компонентов в исследуемом ряду; Б) изучить, как изменение одного показателя во времени связано с изменением другого, то есть проследить возможное влияние одного временного ряда на другой.
Для этого были выбраны в первую очередь линейные графики, так как они:
1. хорошо передают форму и направление изменений показателя во времени; 2. позволяют визуально обнаружить тренды, всплески, аномалии и возможные циклы; 3. удобны для наложения нескольких рядов на один график и сравнения их поведения.
Визуализация
При выборе палитры я вдохновилась образом ночных неоновых улиц США. Все графики выполнены в розово-голубой гамме. Это те два цвета, которым светятся американские улицы ночью.
Импорт датасета
График 1. Уровень безработицы в США
Важно понять, какие именно закономерности в данных помогают описать состояние экономики и предсказывать кризисы. Поэтому был построен график предсказанных вероятностей рецессий, где на одной оси времени показаны фактические рецессии и оценка модели: он демонстрирует, насколько хорошо модель улавливает кризисные периоды.
График 1
Код для графика уровня безработицы в США
График 2. Разложение уровня безработицы на сезонную, трендовую и шумовую
Чтобы увидеть, из чего состоит динамика ключевого показателя, например безработицы, был выполнен следующий график. Он позволяет отдельно увидеть долгосрочное ухудшение или улучшение ситуации, регулярные циклы и случайные колебания.
График 2
Код для графика разложения уровня безработицы на сезонную, трендовую и шумовую
График 3. Распределение уровня безработицы
График 3
Код для графика распределения уровня безработицы
Наиболее частая величина безработицы в США — 6%.
График 4. Матрица корреляций экономических показателей
График 4
Код для матрицы корреляций экономических показателей
С помощью этого графика я выявила, как связаны ВВП, инфляция, безработица, денежная масса и другие показатели, чтобы выбрать информативные признаки для модели кризисов.
График 5. Распределение безработицы по кварталам года
График 5
Код для распределения безработицы по кварталам года
Самая большая безработица бывает во втором квартале (с марта по июнь).
График 6. Автокорреляционные функции инфляции и ВВП
График 6
Код для графика автокорреляционных функций инфляции и ВВП
График 7. Влияние безработицы на ВВП и наоборот в зависимости от периода времени
График 7
График 8. Аномальные величины инфляции в США (по годам)
Чтобы понять, в какие моменты экономика выходит за рамки своего «нормального» режима, необходимо выделить экстремальные всплески, которые часто совпадают с кризисами и служат сигналами раннего предупреждения.
График 8
Код для графика аномальных величин инфляции в США
График 9. Предсказанные вероятности рецессий
График 9
1. Код для графика предсказанных вероятностей рецессий
2. Код для графика предсказанных вероятностей рецессий
Обучаю модель предсказания рецессии с помощью алгоритма случайного леса.
Изучающий и объясняющий форматы визуализации
Среди графиков были представлены изучающие и объясняющие форматы визуализации.
К изучающим относятся графики, с помощью которых мы стремимся понять характер наших данных, и какие между ними есть взаимосвязи. К этому формату относятся графики 2, 3, 4, 6, 7, 8, 9.
Объясняющие — помогают донести идею или результат широким массам. К ним относятся графики 1 и 5.
Статистические методы
Анализ временных рядов был проведен с помощью: А) Обычной и частотной автокорреляционной функции. Б) Парных скользящих корреляции между ВВП и уровнем безработицы. В) Статистического анализа аномалий
Также данные временные ряды я рассмотрела как панельные данные и провела классический статистический анализ, где были построены:
А) гистограммы распределения уровня безработицы Б) матрица корреляций макроэкономических показателей
Вывод
В ходе работы был проведён базовый анализ макроэкономических временных рядов и выделены трендовые, сезонные и корреляционные зависимости между показателями. На их основе была построена простая модель, которая по историческим данным способна приближённо оценивать вероятность рецессий и демонстрирует совпадение повышенных вероятностей с фактическими кризисными периодами.