Original size 847x1120

Анализ покупательского поведения

PROTECT STATUS: not protected
The project is taking part in the competition

Вступление

В этом исследовании я использовала данные о покупательском поведении. Мне интересна эта тема, поскольку для меня проблема перепотребления и консюмеризма в последнее время очень актуальна и заметна. Я считаю, что этот вопрос важно изучать с целью уменьшения вреда, наносимого окружающему миру и человеку из-за чрезмерного покупательства и потребления.

Данные я выбрала на сайте Kaggle. Основаны на анализе Американского рынка товаров категории Одежда.

big
Original size 700x699

Из видов графиков я выбрала гистограмму, столбчатую диаграмму, скрипичный график, сегментированную столбчатую диаграмму и круговую диаграмму. Гистограмма визуализирует распределение числовых данных, на ней показывается частота попадания данных в определенные интервалы. Столбчатые диаграммы легче и быстрее всего воспринимаются, даже если на них не указаны точные цифры и проценты. Скрипичный график используется, чтобы показать плотность распределения. В сегментированной диаграмме можно визуализировать процентное содержание одного параметра в другом. Круговая диаграмма позволяет сравнить параметры внутри категории.

Описание

Для визуализаций я задала черный фон (0B0F14) и яркие оттенки самих графиков: синий (4EA1FF), зеленый (7EE081), оранжевый (FFB020). Шрифт группы sans-serif, так как такие шрифты больше всего подходят для чтения на экране и лаконичной подписи к графикам.

Original size 1988x1542

Часть кода, в которой настраивается общий стиль диаграмм.

График 1. Анализ распределения суммы покупки.

0

При анализе этих параметров датасета было выявлено, что распределение суммы покупки получилось практически равномерное среди всех интервалов (один интервал примерно равен 3 USD).

График 2. Категории по суммарной выручке.

0

Эта диаграмма показывает, что больше всего выручки принесли предметы категории Clothing (Одежда), 44,7% от общего объема. На графике также указана числовая сумма, которая в этой категории составляет более 100 000 USD.

В это же время, меньшее количество денег принесли продажи товаров категории Outwear (Верхняя одежда), всего 7,9%, что равняется менее 20 000 USD.

График 3. Сравнение суммы покупки с подпиской и без подписки.

0

Скрипичная диаграмма показала сравнение распределения суммы покупок с подпиской и без. Можно заметить, что в некоторых интервалах, 20-40 и 90-100 USD, количество покупок без подписки превысило количество с подпиской. Однако, в других интервалах и при общем взгляде на диаграммы, разница между распределением в двух категориях не так заметна.

График 4. Доли скидки и промокода.

0

Судя по этому графику, можно выявить полную обратную зависимость параметра Скидки и Промокода. То есть, при наличии скидки промокод не использовался в 100% случаев, а при ее отсутствии промокод был применен в 100% случаев. Это может быть связано со строгой политикой продающей компании по поводу использования промокодов и скидок при покупке.

График 5. Зависимость цвета одежды от сезона покупки.

0

Самый интересный график — зависимость цвета вещей от сезона покупки. Судя по нему, между сезонами получилось неожиданно схожее распределение популярности цветов. При этом также примерно равнозначен каждый цвет в каждом сезоне. Можно заметить, что летом яркие цвета даже менее популярны, чем в остальных сезонах.

Вывод

Анализ потребительского поведения позволил лучше понять, на что, каким образом, и сколько рассматриваемая аудитория тратит деньги, покупая одежду. Рассмотрены параметры, которые влияют на то, сколько денег тратит покупатель и что может повлиять на сумму, которую он тратит (подписки, скидки, промокоды). Категории товаров были распределены по количеству денег, которые тратились на них, и сравнены между собой. Также проанализирована связь времени года и цвета одежды, которую покупают больше всего. На удивление, анализ показал очень схожие графики для всех четырех сезонов, а также не было выявлено заметно превалирующих цветов ни между, ни внутри каждой диаграммы.

Анализируя такие данные, можно сделать выводы, которые можно использовать в маркетинге, продажах и сфере моды. С их помощью можно создавать более успешные схемы продаж и рекламу, а также предсказывать будущие тренды и реагировать на появление новых.

Использование нейросетей: Chat GPT — для оптимизации и улучшения кода, подбора статистических методов анализа.

Обложка: https://pin.it/2hJX0ZMtU