
Обоснование выбора темы: Анализ бедности в Азии по данным Всемирного банка
Курс — программирование для креативных индустрий
1. Высокая социально-экономическая и политическая актуальность темы.
Азия — самый густонаселенный и экономически динамичный регион мира, где проживает около 60% мирового населения. Контраст между экономическими «тиграми» (Сингапур, Южная Корея) и странами с высоким уровнем бедности (Афганистан, Йемен) делает его идеальной лабораторией для сравнительного анализа.
2. Огромный потенциал для глубокого и разнообразного анализа данных.
На основе этих данных можно провести многоуровневый анализ, выходящий далеко за рамки простой описательной статистики: пространственный (географический) анализ, сравнительный анализ и исторический.
Результаты такого анализа могут представлять интерес для международных организаций (ООН, МВФ), неправительственных организаций и политиков, разрабатывающих программы социальной поддержки и экономического развития.
3. Беспрецедентное качество и надежность источника данных
Выбор платформы по борьбе с бедностью и неравенством Всемирного банка (PIP) — это выбор золотого стандарта в области глобальной статистики. Всемирный банк является ведущим международным финансовым институтом, чьи данные по бедности считаются официальными и наиболее цитируемыми в академических исследованиях и отчетах ООН. |
Обоснование интереса к анализу данных о бедности в Азии
Я глубоко заинтересована в азиатских культурах, поэтому мне было важно изучить, как они устроены изнутри — не только через призму искусства, философии или традиций, но и через объективные социально-экономические показатели. Выбор данных о бедности в Азии от Всемирного банка для меня стал осознанным мостом между личным увлечением и строгим научным анализом. Мое увлечение культурой всегда было связано с вопросом: «Как живут обычные люди, которые создают и поддерживают эти традиции?». Уровень бедности — это прямой индикатор качества жизни, доступности образования, здравоохранения и социальных лифтов. Анализ этих данных помогает мне глубже понять, как устроены эти страны.
Мною было использовано 4 вида графиков: горизонтальная столбчатая диаграмма, гистограмма с оценкой плотности ядра, диаграмма рассеяния с линией тренда, боксплот с точками данных
Эти графики выбраны, чтобы последовательно ответить на ключевые вопросы анализа: 1. Где ситуация хуже всего? (горизонтальные столбцы), 2. Как в целом распределена бедность? (гистограмма), 3. Есть ли связь между переменными? (диаграмма рассеяния), 4. Каков разброс данных и есть ли аномалии? (боксплот). Вместе они дают полную картину.
Этап 1: Загрузка и диагностика данных
Этап 2: Создание визуализаций
Этап 3: Статистический анализ
В работе мною была задействована нейросеть Deepseek для выявления максимально подходящих к теме и виду данных статистических методов. Я уточнила у нейросети какие виды графиков лучше всего подойдут и в каком порядке мне следует исследовать предоставленную таблицу.
Ключевые статистические методы
1. Описательная статистика — я рассчитала основные показатели: среднее значение (общая картина), медиану (устойчивый к выбросам центр распределения), стандартное отклонение (разброс данных) и процентили (10-й, 25-й, 50-й, 75-й, 90-й) для детального понимания структуры распределения.
2. Корреляционный анализ — с помощью коэффициента корреляции Пирсона я измерила силу и направление линейной связи между двумя ключевыми переменными: порогом дохода (day value) и уровнем бедности (percentage day).
3. Регрессионный анализ — построив линейную регрессионную модель, я смогла не только визуализировать тренд на диаграмме рассеяния, но и получить математическое уравнение, описывающее зависимость между переменными.
4. Анализ распределения — для исследования формы и особенностей распределения данных использовались гистограмма, оценка плотности ядра (KDE) и боксплот (box plot), который наглядно показывает медиану, квартили и выявляет статистические выбросы.
Горизонтальная столбчатая диаграмма
Гистограмма с оценкой плотности ядра
Диаграмма рассеяния с линией тренда
Box Plot