Original size 1140x1600

Анализ данных по продовольственной инфляции

PROTECT STATUS: not protected
The project is taking part in the competition

Описание проекта

В качестве темы для проекта я выбрала продовольственную инфляцию. Выбор был обусловлен тем, что продовольственная инфляция — одна из тех вещей, которые мы постоянно замечаем в жизни. Мне стало интересно посмотреть, как этот процесс выглядит в данных и насколько он отличается в разных странах и промежутках времени.

В качестве основы для анализа я использовала датасет Food Price Inflation, опубликованный на платформе Kaggle (https://www.kaggle.com/datasets/umitka/food-price-inflation). Он охватывает большой временной промежуток и содержит данные по продовольственной инфляции в разных странах. При работе с датасетом я постепенно начала замечать, насколько неравномерно распределены изменения цен и как сильно на них влияют внешние события.

Во время анализа мне хотелось не просто построить графики, а попытаться понять, что стоит за ними: в какие периоды инфляция становится особенно нестабильной, где скачки цен происходят чаще всего и как глобальные кризисы отражаются на продовольственном рынке. Эти наблюдения стали основой для выбора визуализаций проекта.

Для визуализации я использовала пять различных графиков, наиболее наглядно демонстрирующих выбранные данные:

1. Линейный график 2. Горизонтальная столбчатая диаграмма 3. Гистограмма 4. Набор линейных графиков по периодам 5. Кольцевая диаграмма

Меня очень привлекают иллюстрации, так как мое направление косвенно связанно с ними и поэтому я решила попробовать визуализировать парочку сюжетов, отражающих смысл проекта через нейросеть.

Иллюстрации сгенерированы через нейросеть recraft.ai (https://recraft.ai/). Одна из иллюстраций стала обложкой к проекту.

0

1. prompt: A person standing in a supermarket comparing prices, price tags turning into floating numbers and graphs, calm but thoughtful mood, modern illustration, soft lighting.

2. prompt: A grocery store scene where food prices are shown as rising line charts above shelves, modern flat illustration, clean data-visualization style, muted colors with one bright accent, economic theme, minimalistic composition.

Цветовая палитра

При выборе цветовой палитры мне хотелось сохранить ощущение аналитичности, но при этом сделать визуализации ассоциирующимися с едой и темой питания в целом. Я остановилась на сочетании тёмных базовых оттенков и яркого акцентного цвета, который помогает выделять ключевые элементы на графиках.

Original size 1600x2400

Для подбора оттенков я использовала сервис Adobe Color (https://color.adobe.com/ru/). Во всех визуализациях применяется шрифт IBMPflexSans.

Использованные статистические методы

В ходе анализа данных были применены методы описательной и разведочной статистики:

Описательная статистика — использовалась для расчёта средних и медианных значений индекса продовольственной инфляции во времени. Это позволило оценить общий глобальный тренд инфляции, а также сравнить чувствительность средней и медианной динамики к экстремальным значениям.

Анализ временных рядов — применялся для изучения динамики продовольственной инфляции по годам. Линейные графики позволили выявить долгосрочные тенденции, структурные сдвиги и периоды резкого изменения показателя.

Логарифмическое масштабирование — использовалось при визуализации временных рядов и показателей разброса с целью корректного отображения данных, характеризующихся высокой вариативностью и наличием экстремальных значений.

Анализ волатильности — проведён на основе расчёта стандартного отклонения индекса продовольственной инфляции по странам. Это позволило выявить государства с наибольшей нестабильностью цен на продовольствие за рассматриваемый период.

Сравнительный анализ стран — реализован с помощью ранжирования стран по показателю волатильности и медианному уровню инфляции, что позволило выделить группы стран с различными инфляционными профилями.

Анализ распределений — выполнен с использованием гистограмм и сглаженных кривых плотности (KDE) для оценки формы распределения продовольственной инфляции на примере отдельной страны. Это позволило проанализировать асимметрию распределения, концентрацию значений и наличие «длинных хвостов».

Периодизационный анализ — применялся для сравнения динамики медианного уровня продовольственной инфляции в различные макроэкономические периоды: до пандемии COVID-19, в период пандемии и после неё. Такой подход позволил оценить влияние внешнего шока на поведение показателя.

Классификационный анализ — использовался для группировки стран по уровню медианной продовольственной инфляции (низкая, умеренная и высокая), что позволило проанализировать структуру мирового распределения стран по инфляционным категориям.

Структурный анализ — реализован с помощью круговой диаграммы, отражающей доли стран в каждой инфляционной категории, что позволило наглядно представить глобальную структуру продовольственной инфляции.

График № 1: Динамика продовольственной инфляции во времени

0

Динамика продовольственной инфляции во времени // код

На графике хорошо заметно, что продовольственная инфляция развивается неравномерно: периоды относительной стабильности сменяются резкими скачками. В некоторые годы рост цен происходит плавно, однако в отдельные моменты линия резко уходит вверх, что указывает на кризисные периоды и усиление экономической нестабильности.

График № 2: Сравнение стран по уровню колебаний

0

Сравнение стран по уровню колебаний // код

Этот график показывает, насколько сильно различается ситуация между странами. Видно, что в одних государствах продовольственная инфляция меняется относительно спокойно, тогда как в других наблюдаются частые и резкие колебания. Различие показывает влияние внутренних экономических условий и внешних факторов.

График № 3: Распределение продовольственной инфляции в России

0

Распределение продовольственной инфляции в России // код

График показывает, что большая часть значений продовольственной инфляции в России сосредоточена в умеренном диапазоне. При этом распределение имеет смещение в сторону более высоких значений, что указывает на периодическое возникновение сильных скачков цен. Сглаженная кривая подчёркивает, что высокая инфляция встречается реже, но остаётся важной частью общей динамики.

График № 4: До и после пандемии COVID-19

0

До и после пандемии COVID-19 // код

При сравнении данных до и после начала пандемии становится заметно, что после 2020 года разброс значений увеличивается. Высокие уровни продовольственной инфляции начинают появляться чаще, а сама динамика становится менее предсказуемой, что хорошо отражает влияние глобального кризиса на продовольственные рынки.

График № 5: Доли стран по уровню продовольственной инфляции

0

Доли стран по уровню продовольственной инфляции // код

График показывает, что большинство стран в период 2001–2025 годов относятся к группе с низкой продовольственной инфляцией. При этом почти треть стран находится в зоне умеренного роста цен, а высокая инфляция характерна лишь для небольшого числа государств. Это доказывает неравномерность продовольственной инфляции в мире и наличие отдельных стран с повышенными рисками.

Заключение

В процессе работы с данными стало очевидно, что продовольственная инфляция — это не линейный и не универсальный процесс. Даже при общем росте цен каждая страна проходит этот путь по-своему: где-то изменения происходят относительно плавно, а где-то наблюдаются резкие, непредсказуемые скачки. Особенно наглядно это проявляется в периоды глобальных потрясений. Анализ данных после начала пандемии COVID-19 показывает, что нестабильность цен усилилась, а высокие значения инфляции стали встречаться чаще. Это показывает, насколько чувствительной оказывается продовольственная система к кризисам и сбоям в мировой экономике.

Для меня этот проект стал способом посмотреть на привычную тему под другим углом. Визуализация помогла не просто увидеть цифры, а связать их с реальными процессами и событиями. В итоге можно сделать вывод, что даже знакомые экономические показатели могут раскрыться по-новому, если внимательно изучить их динамику и контекст.

Описание применения генеративной модели и инструментов

1. Kaggle — Поиска и загрузка датасета.

2. Google Colab — Весь процесс работы: обработка данных и визуализация.

3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. seaborn — использовалась для построения гистограммы и сглаженной кривой распределения (KDE)

4. Adobe Color — Выбор цветовой палитры

5. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.

6. Recraft.ai — Генерация обложки и иллюстраций.