
Концепция
ля анализа данных и визуализации я выбрала датасет пассажиров «Титаника». Эта тема показалась мне интересной. События катастрофы «Титаника» хорошо известны, и анализ данных позволяет взглянуть на них под научным углом. Можно изучить, какие факторы реально влияли на выживание пассажиров, а не только опираться на рассказы и фильмы.
Меня всегда интересовало, как данные и статистика могут показывать скрытые закономерности в исторических событиях. Этот проект дает возможность соединить историю и науку о данных, что делает работу более увлекательной.

цветовая палитра

мудборд
Анализ данных
Перед началом работы я сохранила все нужные библиотеки:
Pandas — для работы с данными Matplotlib. pyplot — для визуализации данных
График 1


График 2
График 3
График 4
Выводы на основе графиков:
Женщины имели значительно более высокую вероятность выживания, чем мужчины.Мужчины выживали реже, что соответствует известным историческим фактам о приоритете спасения женщин и детей.
Пассажиры 1-го класса выживали чаще всего. Пассажиры 2-го класса имели среднюю выживаемость, а 3-го класса — наименьшую. Это показывает, что социально-экономический статус влиял на шанс выживания.
Большинство пассажиров были молодыми взрослыми (от 20 до 40 лет). Присутствуют и дети, и пожилые пассажиры, но их меньше.
Дети (до 18 лет) выживали чаще, чем взрослые, что соответствует принципу «женщины и дети вперед».Молодые взрослые и взрослые имели среднюю вероятность выживания. Пожилые пассажиры выживали реже всех.