Original size 736x920

Анализ трендов зимней одежды

PROTECT STATUS: not protected
The project is taking part in the competition

1. Описание проекта

С приходом зимнего сезона для меня и моих подруг стала актуальна тема выбора зимней верхней одежды.

Заинтересовавшись этой темой, я решила проанализировать эволюцию зимней моды за последние несколько лет.

В процессе поиска датасета для проекта на Kaggle, я нашла датасет Winter_Fashoin Trends, в котором представлены данные о том, какие аспекты в зимней одежде наиболее важны для покупателей, какие цвета, стили пользуются популярностью, и на какой бренд стоит обратить внимание.

2. Выбор стиля

Чтобы все графики были в едином стиле, я выбрала для них цветовую палитру, вдохновленную самыми популярными зимними цветами: #C79CAF #D1BCB7 #C9A9AE #987476 #806961 #524741 #1B191C #25242A #55414A #684857

big
Original size 1570x746

цветовая палитра для графиков

Для визуализации данных были использованы следующие графики:

Круговая диаграмма boxplot / Ящик с усами Столбчатая диаграмма Тепловая карта Линейный график

График 1. Самый продаваемый тип зимней одежды

В первом графике проанализировала, какой тип верхней одежды люди чаще всего покупают с приходом зимнего сезона.

post

Я взяла из датасета данные по каждому типу одежды (столбец Category) и с помощью метода value_counts () посчитала, сколько раз встречается каждая категория. Это позволило получить частоты покупок для каждого вида верхней одежды.

Для визуализации я выбрала круговую диаграмму, так как она наглядно показывает долю каждой категории в общем количестве покупок. В коде я создала объект category_counts, передала его в функцию plt.pie () и указала подписи с названиями категорий через параметр labels. Цвета секторов я задала вручную с помощью заранее подобранной зимней палитры, чтобы сохранить единый стиль всех графиков в проекте. Параметр autopct="%1.1f%%» позволил автоматически вывести процентную долю каждого типа одежды на диаграмме, а startangle=90 и pctdistance=0.8 сделали подписи более читабельными. С помощью plt.axis («equal») я зафиксировала соотношения осей, чтобы круг не искажался.

Original size 3708x3136

График 1

В результате диаграмма показала, какие виды верхней одежды занимают наибольшую долю в покупках, а какие встречаются реже. По графику видно, что основными фаворитами покупателей являются шарфы, тёплая одежда и перчатки, тогда как ботинки, худи, кардиганы представлены в меньшей доле. Это позволяет сделать вывод, что зимой люди предпочитают более тёплую и практичную верхнюю одежду, а менее распространённые категории выступают скорее как дополнительные или нишевые варианты. Что касается обуви, люди покупают её не на один сезон.

График 2. Бренды и их ценовое позиционирование

Во втором графике я решила сравнить ценовое позиционирование разных брендов и понять, какие из них ближе к масс-маркету, а какие относятся к более премиальному сегменту.

post

Для этого из датасета я взяла столбцы Brand и Price (USD). Сначала я выделила список брендов с помощью df[«Brand»].unique (), а затем для каждого бренда сформировала выборку его цен: data = [df[df[«Brand»] == b][«Price (USD)»] for b in brands].

Для визуализации я использовала boxplot, так как этот тип диаграммы позволяет одновременно увидеть и среднюю тенденцию, и разброс цен. В функции plt.boxplot () я передала список цен по брендам (data) и задала подписи оси X через параметр labels=brands. Чтобы график стилистически совпадал с остальными, я снова применила заранее выбранную зимнюю палитру: с помощью цикла for patch, color in zip (box[«boxes»], colors) я перекрасила каждый «ящик» в свой цвет (patch.set_facecolor (color)). Подписи осей (plt.xlabel («Brand»), plt.ylabel («Price (USD)»)) и заголовок Brand × Price: Mass-market vs Premium объясняют смысл графика, а plt.xticks (rotation=45) поворачивает названия брендов, чтобы их было удобно читать.

Original size 992x587

График 2

Премиум-сегмент:

Gucci, Prada и Uniqlo имеют самые высокие медианные цены: их «ящики» расположены выше остальных, а верхние «усы» и выбросы уходят к 750–800 USD. Adidas тоже близок к премиуму: медиана у него заметно выше средней по выборке, а диапазон цен смещён в верхнюю часть графика.

Масс-маркет:

Nike, North Face, H& M и Levi’s демонстрируют более низкие медианные цены и меньший разброс: их «ящики» находятся в нижней и средней части шкалы, без экстремально дорогих выбросов. Mango и Zara занимают промежуточное положение: их медиана ближе к масс-маркету, но встречаются и более высокие цены, поэтому их можно отнести к верхнему диапазону масс-маркета или «доступному премиуму».

Таким образом, диаграмма помогает быстро сравнить бренды между собой и понять, в каком ценовом диапазоне они в основном представлены.

График 3. Бренд с наибольшим количеством ассортимента

На третьем этапе проекта я сосредоточилась на анализе ассортимента брендов, представленных в датасете.

post

Для визуализации я выбрала столбчатую диаграмму, так как она наиболее наглядно показывает сравнение количественных показателей между категориями (брендами).

График был построен с использованием библиотеки matplotlib. Чтобы сохранить единый визуальный стиль проекта, я применила свою цветовую палитру.

Каждый столбец на диаграмме соответствует отдельному бренду, а его высота отражает количество представленных товаров. Ось X содержит названия брендов, а ось Y — число продуктов.

Original size 984x663

График 3

На основе построенного графика можно сделать несколько выводов:

- Mango и The North Face имеют наибольшее количество позиций;

- бренды Prada и Uniqlo также занимают значимую долю, сочетая относительно широкий ассортимент с узнаваемым стилем;

- такие бренды, как Levi’s и Adidas, представлены меньшим количеством товаров, что может указывать либо на более узкую специализацию, либо на фокус на других сезонах;

- массовые бренды доминируют по количеству товаров, что отражает высокий спрос на доступную и практичную зимнюю одежду.

График 4. Рейтинги по стилям

На следующем этапе проекта я решила проанализировать, какие стили зимней одежды наиболее популярны внутри разных категорий товаров. Такой анализ позволяет глубже понять предпочтения покупателей и выявить удачные сочетания категории и стиля, которые пользуются наибольшим спросом.

post

Я выбрала тепловую диаграмму (heatmap), так как она позволяет наглядно сравнить средние значения популярности по двум ключевым параметрам.

С помощью метода pivot_table я преобразовала исходные данные. В качестве индекса была указана колонка «Category» (категория одежды), в качестве столбцов — «Style» (стиль), а значениями ячеек стало среднее арифметическое (aggfunc="mean») показателя «Popularity_Score» для каждой уникальной пары «Категория-Стиль». Таким образом, я получила сводную таблицу (pivot), идеально подходящую для построения тепловой карты.

Original size 933x592

График 4

В результате я получила тепловую карту, которая демонстрирует, какие стили наиболее популярны в каждой категории товаров.

Например, мы видим, что в категориях верхней одежды (таких как Coat или Jacket) особенно востребован уличный стиль (Streetwear), а в аксессуарах (Gloves, Scarf) преобладает классический или Casual стиль.

Этот анализ позволяет выявить успешные сочетания категорий и стилей, что может быть полезно для покупателей и для ритейлеров при формировании ассортимента.

График 5. Тренды по годам

На пятом этапе проекта я отследила, как менялась популярность различных категорий зимней одежды с течением времени. Это позволяет выявить сезонные тренды, понять, какие товары набирают или теряют актуальность.

post

Для этого я построила линейный график, сравнивающий динамику популярности двух ключевых категорий — Jacket (куртки) и Thermal (термобельё) — с 2023 по 2025 год.

Я загрузила тот же датасет и создала колонку Year, извлекая год из поля Season с помощью регулярного выражения. Это позволило агрегировать данные по годам.

С помощью groupby я сгруппировала данные по году и категории, рассчитав средний балл популярности для каждой группы. Затем с помощью unstack () преобразовала таблицу в удобный для построения графика вид.

Для построения графика использовала метод plot () с параметром marker="o», чтобы отметить каждое значение точки на линии. Цветовая палитра соответствует общей стилистике проекта:

#C79CAF для курток (Jacket) #987476 для термобелья (Thermal)

Original size 793x486

График 5

Можно сделать вывод, что куртки сохраняют стабильно высокую популярность на протяжении всего периода, с небольшим пиком в конце 2024 года.

Термобельё (Thermal) демонстрирует более выраженную сезонную динамику: его популярность растёт в холодные периоды (конец 2023 — начало 2024, а также конец 2024 — начало 2025).

График даёт понять, что куртки являются базовой, всесезонной категорией, в то время как термобельё подвержено более явным колебаниям спроса, связанным с погодными условиями.

Выводы

Таким образом, в рамках проекта я провела детальный данных ассортимента зимней одежды от самых популярных брендов.

На основе проведённого анализа данных я сделала следующие выводы:

Динамика популярности категорий зависит от сезонности - Куртки (Jacket) — стабильно высокий спрос в течение всего холодного периода, что подтверждает их статус базового элемента зимнего гардероба. - Термобельё (Thermal) — популярность заметно возрастает в пиковые зимние месяцы, что указывает на его функциональную и сезонную востребованность.

Бренды с наибольшим ассортиментом не всегда самые популярные по оценкам Несмотря на широкое присутствие масс-маркет брендов, их средние оценки популярности могут уступать менее представленным, но более специализированным маркам (например, The North Face).

Блокнот с кодом: https://disk.yandex.ru/d/4lenJN2peGq8JA

Использованные ресурсы

1. Нейросеть deepseek и chat gpt — для консультации по поводу возможностей тех или иных библиотек, датасетов и возможностей питона, а также помощи с написанием текста. 2. Google Collab — работа с датасетом, создание графиков. 3. Kaggle — источник датасета.