Original size 1240x1750

Визуализация данных о кошках

The project is taking part in the competition
big
Original size 2996x810

ПОЧЕМУ ИМЕННО ЭТИ ДАННЫЕ?

Кошки — понятная и близкая тема. Почти у каждого есть домашний питомец или знакомые с кошками, поэтому сразу возникает интерес: какая порода самая популярная, какие кошки живут дольше, какие обычно тяжелее, а какие окрасы встречаются чаще. Хотелось не просто посмотреть цифры, а наглядно показать эти различия.

ВЫБОР ДАННЫХ

Типы графиков

В проекте используются столбчатые диаграммы, тепловая карта, круговая диаграмма и treemap. Каждый тип выбран под конкретную задачу: сравнение средних значений, анализ долей, выявление взаимосвязей и демонстрация структуры распределений.

Для проекта был использован датасет, содержащий информацию о кошках: порода, возраст, вес, пол, окрас и другие характеристики. Данные были выбраны как удобный пример для анализа биологических и демографических признаков в рамках одной популяции, где можно проследить связи между параметрами.

ВИЗУАЛИЗАЦИЯ ДАННЫХ

big
Original size 2750x572

Для всех графиков выбран единый визуальный стиль: тёплая оранжево-бежевая палитра, закруглённые формы и минималистичное оформление без лишних сеток и рамок. Также использовался декоративный элемент (иконка лапки) для поддержания характера темы и ее дружелюбности.

Original size 1714x774

Цветовая палитра

Original size 2864x491

Также сначала датасет был очищен от пустых значений, чтобы графики были корректными. Далее данные группировались по породам, полу и окрасу, высчитывались средние значения и количество кошек.

Original size 989x962

Интереснее всего было узнать, какие породы самые популярные, исходя из количества их в датасете. Круговая диаграмма демонстрирует долю самых распространённых пород и объединяет все остальные в категорию «Other», что позволяет не перегружать визуализацию.

Original size 950x678

Данный тип графика был выбран для визуализации самых частых окрасов котов, так как он хорошо подходит для отображения иерархий и относительных размеров категорий, позволяя быстро оценить, какие данные встречаются чаще всего.

Original size 1189x790

Горизонтальная диаграмма отображает долю самцов и самок в десяти самых популярных породах. Формат выбран для удобного сравнения пропорций внутри каждой породы, а не абсолютных значений. Это подчёркивает баланс полов и их возможные перекосы.

Original size 1189x790

Было интересно узнать какие породы дольше всех живут, что могло бы помочь будущим хозяевам при выборе пушистого друга-долгожителя.

Была выбрана столбчатая диаграмма, которая показывает породы кошек, средний возраст которых выше среднего по датасету. Такой отбор позволяет сфокусироваться не на всех породах сразу, а только на тех, которые выделяются по продолжительности жизни. График помогает визуально сравнить средние значения и быстро определить лидеров.

Original size 1111x790

Тепловая карта показывает, в каких диапазонах возраста и веса наблюдается наибольшее количество кошек. Этот формат позволяет увидеть концентрации данных и выявить типичные сочетания параметров, которые сложно заметить в таблице, а также является фактором здоровья питомцев и выявляет связан ли набор веса у кошек с возрастом.

Original size 1189x790

Столбчатая диаграмма отражает средний вес топ-10 пород. Она используется для сравнения физических характеристик разных пород и подчёркивает разницу между более лёгкими и более тяжёлыми кошками. Таким образом, можно понять индивидуальные особенности пород и какова их норма веса.

ИТОГИ

post

Датасет позволил узнать, как распределяются основные характеристики кошек: возраст, вес и пол, и какие значения можно считать типичными для большинства кошек.

Анализ также показал различия между породами — по среднему весу и продолжительности жизни и популярности отдельных пород. Визуализация помогла быстро сравнить данные и превратить набор чисел в понятную картину, которая даёт общее представление о структуре и особенностях выборки.

ОПИСАНИЕ ПРИМЕНЕНИЯ ГЕНЕРАТИВНОЙ МОДЕЛИ

Для работы над визуализацией данных в этом проекте использовался ChatGPT (https://chatgpt.com) в качестве помощника для исправления ошибок в коде и решения некоторых стилистических задач.

Original size 2207x440