
1. Описание проекта
С приходом зимнего сезона для меня и моих подруг стала актуальна тема выбора зимней верхней одежды.
Заинтересовавшись этой темой, я решила проанализировать эволюцию зимней моды за последние несколько лет.
В процессе поиска датасета для проекта на Kaggle, я нашла датасет Winter_Fashoin Trends, в котором представлены данные о том, какие аспекты в зимней одежде наиболее важны для покупателей, какие цвета, стили пользуются популярностью, и на какой бренд стоит обратить внимание.
2. Выбор стиля
Чтобы все графики были в едином стиле, я выбрала для них цветовую палитру, вдохновленную самыми популярными зимними цветами: #C79CAF #D1BCB7 #C9A9AE #987476 #806961 #524741 #1B191C #25242A #55414A #684857

цветовая палитра для графиков
Для визуализации данных были использованы следующие графики:
Круговая диаграмма boxplot / Ящик с усами Столбчатая диаграмма Тепловая карта Линейный график
График 1. Самый продаваемый тип зимней одежды
В первом графике проанализировала, какой тип верхней одежды люди чаще всего покупают с приходом зимнего сезона.

Я взяла из датасета данные по каждому типу одежды (столбец Category) и с помощью метода value_counts () посчитала, сколько раз встречается каждая категория. Это позволило получить частоты покупок для каждого вида верхней одежды.
Для визуализации я выбрала круговую диаграмму, так как она наглядно показывает долю каждой категории в общем количестве покупок. В коде я создала объект category_counts, передала его в функцию plt.pie () и указала подписи с названиями категорий через параметр labels. Цвета секторов я задала вручную с помощью заранее подобранной зимней палитры, чтобы сохранить единый стиль всех графиков в проекте. Параметр autopct="%1.1f%%» позволил автоматически вывести процентную долю каждого типа одежды на диаграмме, а startangle=90 и pctdistance=0.8 сделали подписи более читабельными. С помощью plt.axis («equal») я зафиксировала соотношения осей, чтобы круг не искажался.
График 1
В результате диаграмма показала, какие виды верхней одежды занимают наибольшую долю в покупках, а какие встречаются реже. По графику видно, что основными фаворитами покупателей являются шарфы, тёплая одежда и перчатки, тогда как ботинки, худи, кардиганы представлены в меньшей доле. Это позволяет сделать вывод, что зимой люди предпочитают более тёплую и практичную верхнюю одежду, а менее распространённые категории выступают скорее как дополнительные или нишевые варианты. Что касается обуви, люди покупают её не на один сезон.
График 2. Бренды и их ценовое позиционирование
Во втором графике я решила сравнить ценовое позиционирование разных брендов и понять, какие из них ближе к масс-маркету, а какие относятся к более премиальному сегменту.

Для этого из датасета я взяла столбцы Brand и Price (USD). Сначала я выделила список брендов с помощью df[«Brand»].unique (), а затем для каждого бренда сформировала выборку его цен: data = [df[df[«Brand»] == b][«Price (USD)»] for b in brands].
Для визуализации я использовала boxplot, так как этот тип диаграммы позволяет одновременно увидеть и среднюю тенденцию, и разброс цен. В функции plt.boxplot () я передала список цен по брендам (data) и задала подписи оси X через параметр labels=brands. Чтобы график стилистически совпадал с остальными, я снова применила заранее выбранную зимнюю палитру: с помощью цикла for patch, color in zip (box[«boxes»], colors) я перекрасила каждый «ящик» в свой цвет (patch.set_facecolor (color)). Подписи осей (plt.xlabel («Brand»), plt.ylabel («Price (USD)»)) и заголовок Brand × Price: Mass-market vs Premium объясняют смысл графика, а plt.xticks (rotation=45) поворачивает названия брендов, чтобы их было удобно читать.
График 2
Премиум-сегмент:
Gucci, Prada и Uniqlo имеют самые высокие медианные цены: их «ящики» расположены выше остальных, а верхние «усы» и выбросы уходят к 750–800 USD. Adidas тоже близок к премиуму: медиана у него заметно выше средней по выборке, а диапазон цен смещён в верхнюю часть графика.
Масс-маркет:
Nike, North Face, H& M и Levi’s демонстрируют более низкие медианные цены и меньший разброс: их «ящики» находятся в нижней и средней части шкалы, без экстремально дорогих выбросов. Mango и Zara занимают промежуточное положение: их медиана ближе к масс-маркету, но встречаются и более высокие цены, поэтому их можно отнести к верхнему диапазону масс-маркета или «доступному премиуму».
Таким образом, диаграмма помогает быстро сравнить бренды между собой и понять, в каком ценовом диапазоне они в основном представлены.
График 3. Бренд с наибольшим количеством ассортимента
На третьем этапе проекта я сосредоточилась на анализе ассортимента брендов, представленных в датасете.

Для визуализации я выбрала столбчатую диаграмму, так как она наиболее наглядно показывает сравнение количественных показателей между категориями (брендами).
График был построен с использованием библиотеки matplotlib. Чтобы сохранить единый визуальный стиль проекта, я применила свою цветовую палитру.
Каждый столбец на диаграмме соответствует отдельному бренду, а его высота отражает количество представленных товаров. Ось X содержит названия брендов, а ось Y — число продуктов.
График 3
На основе построенного графика можно сделать несколько выводов:
- Mango и The North Face имеют наибольшее количество позиций;
- бренды Prada и Uniqlo также занимают значимую долю, сочетая относительно широкий ассортимент с узнаваемым стилем;
- такие бренды, как Levi’s и Adidas, представлены меньшим количеством товаров, что может указывать либо на более узкую специализацию, либо на фокус на других сезонах;
- массовые бренды доминируют по количеству товаров, что отражает высокий спрос на доступную и практичную зимнюю одежду.
График 4. Рейтинги по стилям
На следующем этапе проекта я решила проанализировать, какие стили зимней одежды наиболее популярны внутри разных категорий товаров. Такой анализ позволяет глубже понять предпочтения покупателей и выявить удачные сочетания категории и стиля, которые пользуются наибольшим спросом.

Я выбрала тепловую диаграмму (heatmap), так как она позволяет наглядно сравнить средние значения популярности по двум ключевым параметрам.
С помощью метода pivot_table я преобразовала исходные данные. В качестве индекса была указана колонка «Category» (категория одежды), в качестве столбцов — «Style» (стиль), а значениями ячеек стало среднее арифметическое (aggfunc="mean») показателя «Popularity_Score» для каждой уникальной пары «Категория-Стиль». Таким образом, я получила сводную таблицу (pivot), идеально подходящую для построения тепловой карты.
График 4
В результате я получила тепловую карту, которая демонстрирует, какие стили наиболее популярны в каждой категории товаров.
Например, мы видим, что в категориях верхней одежды (таких как Coat или Jacket) особенно востребован уличный стиль (Streetwear), а в аксессуарах (Gloves, Scarf) преобладает классический или Casual стиль.
Этот анализ позволяет выявить успешные сочетания категорий и стилей, что может быть полезно для покупателей и для ритейлеров при формировании ассортимента.
График 5. Тренды по годам
На пятом этапе проекта я отследила, как менялась популярность различных категорий зимней одежды с течением времени. Это позволяет выявить сезонные тренды, понять, какие товары набирают или теряют актуальность.

Для этого я построила линейный график, сравнивающий динамику популярности двух ключевых категорий — Jacket (куртки) и Thermal (термобельё) — с 2023 по 2025 год.
Я загрузила тот же датасет и создала колонку Year, извлекая год из поля Season с помощью регулярного выражения. Это позволило агрегировать данные по годам.
С помощью groupby я сгруппировала данные по году и категории, рассчитав средний балл популярности для каждой группы. Затем с помощью unstack () преобразовала таблицу в удобный для построения графика вид.
Для построения графика использовала метод plot () с параметром marker="o», чтобы отметить каждое значение точки на линии. Цветовая палитра соответствует общей стилистике проекта:
#C79CAF для курток (Jacket) #987476 для термобелья (Thermal)
График 5
Можно сделать вывод, что куртки сохраняют стабильно высокую популярность на протяжении всего периода, с небольшим пиком в конце 2024 года.
Термобельё (Thermal) демонстрирует более выраженную сезонную динамику: его популярность растёт в холодные периоды (конец 2023 — начало 2024, а также конец 2024 — начало 2025).
График даёт понять, что куртки являются базовой, всесезонной категорией, в то время как термобельё подвержено более явным колебаниям спроса, связанным с погодными условиями.
Выводы
Таким образом, в рамках проекта я провела детальный данных ассортимента зимней одежды от самых популярных брендов.
На основе проведённого анализа данных я сделала следующие выводы:
Динамика популярности категорий зависит от сезонности - Куртки (Jacket) — стабильно высокий спрос в течение всего холодного периода, что подтверждает их статус базового элемента зимнего гардероба. - Термобельё (Thermal) — популярность заметно возрастает в пиковые зимние месяцы, что указывает на его функциональную и сезонную востребованность.
Бренды с наибольшим ассортиментом не всегда самые популярные по оценкам Несмотря на широкое присутствие масс-маркет брендов, их средние оценки популярности могут уступать менее представленным, но более специализированным маркам (например, The North Face).
Блокнот с кодом: https://disk.yandex.ru/d/4lenJN2peGq8JA
Использованные ресурсы
1. Нейросеть deepseek и chat gpt — для консультации по поводу возможностей тех или иных библиотек, датасетов и возможностей питона, а также помощи с написанием текста. 2. Google Collab — работа с датасетом, создание графиков. 3. Kaggle — источник датасета.