Original size 2480x3500

Измерения качества воздуха в городах Индии

PROTECT STATUS: not protected
The project is taking part in the competition

Для анализа я выбрала тему: «Как меняется качество воздуха в крупных городах и от чего оно зависит».

big
Original size 1024x1024

Описание проекта:

Для проекта был выбран датасет с измерениями качества воздуха в городах Индии, опубликованный на платформе Kaggle. Данные собирались на основе показаний экологических станций и содержат ежедневные измерения загрязняющих веществ.

Качество воздуха напрямую влияет на здоровье людей, уровень смертности и качество жизни. Индия — одна из стран с наиболее острыми проблемами загрязнения воздуха, поэтому данные: имеют высокую социальную значимость, отражают реальные экологические процессы, позволяют анализировать различия между городами и сезонами. Стоит отметить, что с недавних пор Индия стала моим личным интересом — поэтому я не могла упустить возможность изучить ее с еще одной стороны.

big
Original size 1024x1024

Я использовала один датасет, который хорошо отражает информацию, нужную мне для исследования.

Это набор данных , в котором каждая строка датасета соответствует одному дню наблюдений в конкретном городе. Датасет включает в себя 4 группы признаков: географические и временные данные, загрязняющие вещества, летучие органические соединения (VOC), интегральные показатели. Датасет представляет собой комплексный источник информации о состоянии атмосферного воздуха и позволяет провести глубокий, наглядный значимый анализ.

Набор данных был найден на интернет-ресурсе Kaggle.

Типы графиков: - линейные графики — анализ изменений во времени - столбчатые диаграммы — сравнение городов - гистограммы — распределение загрязнения - boxplot — выявление выбросов - тепловая карта — корреляция загрязнителей

Этапы работы

1 этап работы: загрузка и первичный анализ, очистка данных: экологические данные часто содержат пропуски, а медиана снижает влияние аномальных значений

2 этап: стилизация визуализации: идея визуального стиля - тёмные насыщенные цвета - ассоциация с дымом и смогом - минимализм без визуального шума источники вдохновения: - экологические отчёты WHO - инфографика The Guardian - Datawrapper environmental reports

График 1 — линейный график, изменение AQI во времени

график/пример кода

Данный линейный график отображает изменение индекса качества воздуха (AQI) во времени для выбранного города (например, Дели). По оси X отложена дата наблюдения, по оси Y — значение AQI. Этот график используется для анализа временной динамики загрязнения воздуха и позволяет: - выявить долгосрочные тренды (улучшается или ухудшается ситуация со временем); - обнаружить сезонность (повторяющиеся пики загрязнения); - увидеть экстремальные значения AQI, соответствующие периодам сильного смога.

График 2 — столбчатая диаграмма, средний AQI по городам

график/пример кода.

Столбчатая диаграмма отражает среднее значение AQI для каждого города за весь период наблюдений. Каждый столбец соответствует отдельному городу. Этот график используется для сравнительного анализа между городами и позволяет: - определить, в каких городах воздух в среднем наиболее загрязнён; - выявить географические различия в качестве воздуха; - сформировать рейтинг городов по уровню загрязнения. Столбчатая диаграмма наглядно подходит для сравнения агрегированных показателей между категориями (городами) и легко интерпретируется.

График 3 — Гистограмма, распределение PM2.5

график/пример кода

Гистограмма отображает распределение значений концентрации PM2.5 — одного из наиболее опасных загрязняющих веществ. По оси X — концентрация PM2.5, по оси Y — количество наблюдений. Этот график позволяет: - понять, какие значения PM2.5 встречаются чаще всего; - оценить, насколько часто фиксируются опасные уровни загрязнения; - определить, является ли распределение симметричным или имеет длинный «хвост» экстремальных значений. Гистограмма помогает перейти от отдельных измерений к пониманию общей картины загрязнения воздуха и показывает, является ли высокий уровень PM2.5 редким или типичным явлением.

График 4 — Boxplot, AQI по категориям качества

график/пример кода

Boxplot визуализирует распределение значений AQI внутри каждой категории качества воздуха (Good, Moderate, Poor, Very Poor, Severe). Этот график позволяет: - сравнить диапазоны значений AQI между категориями; - выявить перекрытия и выбросы; - оценить, насколько корректно категории отражают реальные числовые значения. Этот график особенно полезный для анализа экологических данных с выбросами.

График 5 — Тепловая карта корреляций

график/пример кода

Тепловая карта отражает корреляции между концентрациями загрязняющих веществ и AQI. Цвет ячеек показывает силу и направление связи. Этот график помогает: - определить, какие загрязнители сильнее всего связаны с ростом AQI; - выявить взаимосвязи между разными веществами; - сделать выводы о ключевых факторах ухудшения качества воздуха.

Выводы:

Original size 1024x1024

В рамках данного проекта было проведено исследование изменений качества воздуха в крупных городах Индии и факторов, влияющих на его формирование. Для анализа использовались ежедневные данные измерений загрязняющих веществ, собранные экологическими станциями мониторинга и представленные в открытом доступе на платформе Kaggle. В результате проведённого анализа можно сделать вывод, что качество воздуха в крупных городах Индии формируется под влиянием совокупности факторов, среди которых ключевую роль играют концентрации мелкодисперсных частиц, сезонные изменения и локальные особенности городской среды. Проблема загрязнения воздуха носит системный характер и требует комплексного подхода как на уровне отдельных городов, так и на уровне государственной политики. Социальная значимость данной темы, а также личный исследовательский интерес к Индии, позволили рассмотреть проблему качества воздуха не только с технической точки зрения анализа данных, но и в более широком контексте влияния окружающей среды на качество жизни и здоровье населения.

Использованные нейросети: 1. Chat GPT — для подбора визуализаций под временные ряды и для оптимизации Pandas-кода; 2. Krea— для генерации изображений.