
Концепция
В рамках проекта по визуализации данных я анализировала датасет «Титаник», который содержит информацию о пассажирах, включая их класс, пол, возраст, порт посадки, стоимость билета и факт выживания. Этот набор данных часто используется для изучения факторов, влияющих на выживаемость во время кораблекрушения. Я взяла его с платформы Kaggle.
Цель проекта — наглядно показать, как различные факторы — класс обслуживания, пол, возраст и место посадки — связаны с шансами на выживание и другими характеристиками пассажиров. Такой анализ помогает понять социальную структуру на борту и то, как неравенство проявилось в экстремальной ситуации.
Я выбрала спокойную и чёткую цветовую палитру, вдохновлённую морской тематикой и кораблем «Титаник».
Типы диаграмм
Горизонтальная столбчатая диаграмма — Выживаемость по классам билетов. Круговая диаграмма — Распределение пассажиров по полу. Линейный график — Стоимость билетов по портам. Столбчатая диаграмма — Распределение пассажиров по возрасту.
Круговая диаграмма


Круговая диаграмма показывает соотношение мужчин и женщин на борту. Мужчин было подавляющее большинство — 64,4%, а женщин — 35,6%. Эта общая демографическая картина важна для дальнейшего анализа, потому что, как известно, при эвакуации приоритет отдавался женщинам и детям. Поэтому общий низкий процент выживших в целом по кораблю нужно рассматривать именно с учётом этого гендерного дисбаланса и правил спасательной операции.
Горизонтально столбчатая диаграмма

Здесь на горизонтальной столбчатой диаграмме видно, какой процент пассажиров каждого класса выжил. Картина очень ясная: у пассажиров первого класса (люкс) был самый высокий шанс — выжило 42,1%. У второго класса шансы уже заметно ниже — 31,4%, а у третьего класса — самые низкие, всего 16,8%. График наглядно показывает прямую зависимость: чем выше класс (а значит, и стоимость билета, и расположение кают ближе к шлюпкам), тем больше шансов спастись. Это яркое свидетельство социального неравенства на борту.
Линейный график

На этой гистограмме показано, сколько пассажиров было в каждом возрастном диапазоне. Видно, что на борту было много молодых людей в возрасте 20-35 лет, а также значительное количество детей и подростков. Пожилых людей было меньше. Этот график даёт общее представление о возрастном составе, который, наряду с полом и классом, был ключевым фактором при посадке в шлюпки по принципу «сначала женщины и дети».
Столбчатая диаграмма

Этот график показывает среднюю стоимость билета для пассажиров, севших в трёх разных портах: Саутгемптоне, Шербуре и Квинстауне. Видно, что из Шербура средняя цена билета была самой высокой — $27.4. В Саутгемптоне, откуда село больше всего людей, средняя цена была $12.4, а в Квинстауне — самая низкая. Можно сделать вывод, что в Шербур садились в целом более обеспеченные пассажиры (вероятно, больше первого класса), что может быть связано с его расположением во Франции и маршрутом следования богатых путешественников.
Вывод
Анализ наглядно подтверждает известные исторические факты о катастрофе «Титаника». Шанс на спасение в первую очередь определялся социально-экономическим статусом (классом билета), затем — полом (из-за правил эвакуации) и, вероятно, возрастом. Пассажиры первого класса, заплатившие больше всех и имевшие лучший доступ к палубам, выживали чаще. Женщины, несмотря на то, что их было меньше на борту, в процентном соотношении выживали значительно чаще мужчин. Порты посадки косвенно отражали благосостояние пассажиров. Визуализации помогают увидеть эту грустную статистику не как сухие цифры, а как понятную человеческую историю о неравенстве, которое проявилось даже в момент общей трагедии.
Для проверки кода использовался Gemini