
Описание проекта
В своём проекте я проанализировала данные о поступлениях и исходах животных в муниципальных приютах США. Для исследования были использованы открытые датасеты Austin Animal Center и Long Beach Animal Shelter, размещённые на платформе Kaggle и представленные в формате CSV. Эти данные содержат подробную информацию о каждом животном: дату поступления, вид, возраст, пол, а также итоговый исход — усыновление, возврат владельцу, передача в другой приют и другие варианты.
Работа с данными и построение визуализаций проводились в среде Google Colab. В рамках проекта я создала серию графиков в едином стиле, чтобы наглядно проанализировать основные тенденции. Целью исследования было понять, какие виды животных чаще всего попадают в приюты, а также как меняются показатели поступлений и исходов с течением времени.
Выбор темы
Я выбрала для анализа данные о животных в приютах, потому что мне всегда было интересно понять, как меняется их количество и судьба с течением времени. Хотелось на реальных данных посмотреть, в какие годы поступало больше всего животных, какие исходы были наиболее частыми и как распределяются животные по типу и возрасту. Так из интереса к теме защиты животных получился настоящий data science проект.
Вид графиков
Для анализа я использовала следующие графики:
1. Линейный график — для изучения динамики поступления животных в приют по годам и выявления периодов роста и спада. 2. Столбчатая диаграмма — для анализа распределения животных по типу (собаки, кошки и другие) и определения наиболее распространённых категорий. 3. Круговая диаграмма — для оценки долей различных исходов животных (усыновление, возврат владельцу, передача в другой приют и др.) и общей эффективности работы приютов. 4. Коробчатая диаграмма — для сравнения распределения возраста животных при поступлении в приют в зависимости от типа животного.
Используемые статистические методы
В работе я использовала простые статистические методы. Сначала посмотрела на основные цифры: количество поступивших животных, распределение по возрасту и типу. Потом сгруппировала данные по годам и исходам, чтобы узнать, в какие периоды в приюты попадало больше животных и какие исходы встречались чаще всего. Частотный анализ помог понять, какие типы животных и исходы встречаются чаще. А чтобы увидеть динамику поступлений и исходов с течением времени, я построила линейный график, где по годам отложено количество животных и распределение исходов. Эти методы позволили перевести данные о животных в понятные цифры и графики.
Референсы визуального стиля
Собака породы корги
За основу визуального стиля я взяла цветовую палитру из мягких пастельных оттенков. Светлый бежевый создаёт ощущение тепла и спокойствия, а персиковый добавляет мягкий контраст и дружелюбие. Тёмно-коричневый используется для акцентов и линий, создавая баланс и читаемость. Холодный зелёно-серый придаёт визуализации глубину и спокойствие, а нежно-розовый добавляет легкость и мягкость. Эта палитра позволяет графикам и диаграммам выглядеть дружелюбно и эстетично, превращая сухие цифры в визуально приятные истории. Цвета сочетаются между собой и создают атмосферу спокойствия и заботы, что особенно подходит для темы животных в приютах.
Палитра, созданная в Coolors
Палитра, созданная в Coolors
Графики
График № 1 — динамика поступлений
Чтобы проанализировать, как менялось количество поступлений животных в приют по годам, я сгруппировала данные по колонке intake_year и подсчитала количество записей для каждого года с помощью groupby и size (). Такая диаграмма позволила мне наглядно увидеть динамику поступлений: когда было больше всего животных, а когда нагрузка на приюты снижалась. Это помогает понять долгосрочные тренды и планировать ресурсы для ухода за животными.
Линейный график
Код к графику № 1
График № 2 — распределение животных по типу
Чтобы понять, какие типы животных чаще всего поступают в приют, я сгруппировала данные по колонке animal_type. С помощью sns.countplot () построила столбчатую диаграмму, которая наглядно показывает количество собак, кошек и других животных. Это позволяет сразу увидеть, какие виды животных преобладают в приюте, а какие встречаются редко.
Столбчатая диаграмма
Код к графику № 2
График № 3 — Доля исходов животных в приютах
Чтобы проанализировать, как распределяются исходы животных в приютах, я сначала подсчитала количество записей для каждого типа исхода с помощью value_counts (). Затем построила круговую диаграмму (plt.pie), где каждая доля показывает процент животных с конкретным исходом — например, усыновление, возвращение владельцу или передача в другой приют. Такая визуализация позволяет сразу увидеть, какие исходы преобладают, и наглядно понять общую картину работы приютов.
Круговая диаграмма
Код к графику № 3
График № 4 — Распределение возраста животных при поступлении
Чтобы проанализировать распределение возраста животных при поступлении, я разделил данные по типу животного — собаки и кошки. Для этого использовала соответствующую категориальную колонку и значения возраста в годах. Затем я визуализировала данные с помощью коробчатой диаграммы, которая позволяет отразить медианный возраст, межквартильный размах, общий разброс значений и выбросы. Такой подход помог наглядно сравнить возрастные характеристики собак и кошек при поступлении и увидеть, что у собак возрастной диапазон шире, а медианный возраст выше, чем у кошек.
Коробчатая диаграмма
Код к графику № 4
Вывод
Анализ графиков показал, что наибольшее число поступлений животных в приюты пришлось на 2014–2017 годы, с пиком в 2015–2016 годах. Основную долю животных составляют собаки и кошки, причём собак поступает больше. В приюты чаще всего попадают молодые животные, особенно кошки, тогда как у собак возрастной разброс шире. Большинство исходов положительные — животные находят новый дом или передаются в другие приюты, а случаи эвтаназии и смерти встречаются редко.
Применение генеративной модели
Улучшение кода, вопросы по работе функций: Chat GPT
Блокнот с кодом и датасет
Источники
Coolors — The super fast color palettes generator! : [веб-сайт]. — URL: https://coolors.co/ (дата обращения: 22.12.2025).