Original size 1140x1600

Анализ данных и визуализация коэффициента бедности в Азии

PROTECT STATUS: not protected
The project is taking part in the competition

Обоснование выбора темы: Анализ бедности в Азии по данным Всемирного банка

Курс — программирование для креативных индустрий

1. Высокая социально-экономическая и политическая актуальность темы.

Азия — самый густонаселенный и экономически динамичный регион мира, где проживает около 60% мирового населения. Контраст между экономическими «тиграми» (Сингапур, Южная Корея) и странами с высоким уровнем бедности (Афганистан, Йемен) делает его идеальной лабораторией для сравнительного анализа.

2. Огромный потенциал для глубокого и разнообразного анализа данных.

На основе этих данных можно провести многоуровневый анализ, выходящий далеко за рамки простой описательной статистики: пространственный (географический) анализ, сравнительный анализ и исторический.

Результаты такого анализа могут представлять интерес для международных организаций (ООН, МВФ), неправительственных организаций и политиков, разрабатывающих программы социальной поддержки и экономического развития.

3. Беспрецедентное качество и надежность источника данных

Выбор платформы по борьбе с бедностью и неравенством Всемирного банка (PIP) — это выбор золотого стандарта в области глобальной статистики. Всемирный банк является ведущим международным финансовым институтом, чьи данные по бедности считаются официальными и наиболее цитируемыми в академических исследованиях и отчетах ООН. |

Обоснование интереса к анализу данных о бедности в Азии

Я глубоко заинтересована в азиатских культурах, поэтому мне было важно изучить, как они устроены изнутри — не только через призму искусства, философии или традиций, но и через объективные социально-экономические показатели. Выбор данных о бедности в Азии от Всемирного банка для меня стал осознанным мостом между личным увлечением и строгим научным анализом. Мое увлечение культурой всегда было связано с вопросом: «Как живут обычные люди, которые создают и поддерживают эти традиции?». Уровень бедности — это прямой индикатор качества жизни, доступности образования, здравоохранения и социальных лифтов. Анализ этих данных помогает мне глубже понять, как устроены эти страны.

Мною было использовано 4 вида графиков: горизонтальная столбчатая диаграмма, гистограмма с оценкой плотности ядра, диаграмма рассеяния с линией тренда, боксплот с точками данных

Эти графики выбраны, чтобы последовательно ответить на ключевые вопросы анализа: 1. Где ситуация хуже всего? (горизонтальные столбцы), 2. Как в целом распределена бедность? (гистограмма), 3. Есть ли связь между переменными? (диаграмма рассеяния), 4. Каков разброс данных и есть ли аномалии? (боксплот). Вместе они дают полную картину.

Этап 1: Загрузка и диагностика данных

Original size 1920x1080

Этап 2: Создание визуализаций

Original size 1920x1080

Этап 3: Статистический анализ

Original size 1920x1080

В работе мною была задействована нейросеть Deepseek для выявления максимально подходящих к теме и виду данных статистических методов. Я уточнила у нейросети какие виды графиков лучше всего подойдут и в каком порядке мне следует исследовать предоставленную таблицу.

Ключевые статистические методы

1. Описательная статистика — я рассчитала основные показатели: среднее значение (общая картина), медиану (устойчивый к выбросам центр распределения), стандартное отклонение (разброс данных) и процентили (10-й, 25-й, 50-й, 75-й, 90-й) для детального понимания структуры распределения.

2. Корреляционный анализ — с помощью коэффициента корреляции Пирсона я измерила силу и направление линейной связи между двумя ключевыми переменными: порогом дохода (day value) и уровнем бедности (percentage day).

3. Регрессионный анализ — построив линейную регрессионную модель, я смогла не только визуализировать тренд на диаграмме рассеяния, но и получить математическое уравнение, описывающее зависимость между переменными.

4. Анализ распределения — для исследования формы и особенностей распределения данных использовались гистограмма, оценка плотности ядра (KDE) и боксплот (box plot), который наглядно показывает медиану, квартили и выявляет статистические выбросы.

Горизонтальная столбчатая диаграмма

Original size 1867x1317

Гистограмма с оценкой плотности ядра

Original size 2035x1548

Диаграмма рассеяния с линией тренда

Original size 1892x1422

Box Plot

Original size 2053x1454