
Вступление
В этом исследовании я использовала данные о покупательском поведении. Мне интересна эта тема, поскольку для меня проблема перепотребления и консюмеризма в последнее время очень актуальна и заметна. Я считаю, что этот вопрос важно изучать с целью уменьшения вреда, наносимого окружающему миру и человеку из-за чрезмерного покупательства и потребления.
Данные я выбрала на сайте Kaggle. Основаны на анализе Американского рынка товаров категории Одежда.

Из видов графиков я выбрала гистограмму, столбчатую диаграмму, скрипичный график, сегментированную столбчатую диаграмму и круговую диаграмму. Гистограмма визуализирует распределение числовых данных, на ней показывается частота попадания данных в определенные интервалы. Столбчатые диаграммы легче и быстрее всего воспринимаются, даже если на них не указаны точные цифры и проценты. Скрипичный график используется, чтобы показать плотность распределения. В сегментированной диаграмме можно визуализировать процентное содержание одного параметра в другом. Круговая диаграмма позволяет сравнить параметры внутри категории.


Описание
Для визуализаций я задала черный фон (0B0F14) и яркие оттенки самих графиков: синий (4EA1FF), зеленый (7EE081), оранжевый (FFB020). Шрифт группы sans-serif, так как такие шрифты больше всего подходят для чтения на экране и лаконичной подписи к графикам.
Часть кода, в которой настраивается общий стиль диаграмм.
График 1. Анализ распределения суммы покупки.
При анализе этих параметров датасета было выявлено, что распределение суммы покупки получилось практически равномерное среди всех интервалов (один интервал примерно равен 3 USD).
График 2. Категории по суммарной выручке.
Эта диаграмма показывает, что больше всего выручки принесли предметы категории Clothing (Одежда), 44,7% от общего объема. На графике также указана числовая сумма, которая в этой категории составляет более 100 000 USD.
В это же время, меньшее количество денег принесли продажи товаров категории Outwear (Верхняя одежда), всего 7,9%, что равняется менее 20 000 USD.
График 3. Сравнение суммы покупки с подпиской и без подписки.
Скрипичная диаграмма показала сравнение распределения суммы покупок с подпиской и без. Можно заметить, что в некоторых интервалах, 20-40 и 90-100 USD, количество покупок без подписки превысило количество с подпиской. Однако, в других интервалах и при общем взгляде на диаграммы, разница между распределением в двух категориях не так заметна.
График 4. Доли скидки и промокода.
Судя по этому графику, можно выявить полную обратную зависимость параметра Скидки и Промокода. То есть, при наличии скидки промокод не использовался в 100% случаев, а при ее отсутствии промокод был применен в 100% случаев. Это может быть связано со строгой политикой продающей компании по поводу использования промокодов и скидок при покупке.
График 5. Зависимость цвета одежды от сезона покупки.
Самый интересный график — зависимость цвета вещей от сезона покупки. Судя по нему, между сезонами получилось неожиданно схожее распределение популярности цветов. При этом также примерно равнозначен каждый цвет в каждом сезоне. Можно заметить, что летом яркие цвета даже менее популярны, чем в остальных сезонах.
Вывод
Анализ потребительского поведения позволил лучше понять, на что, каким образом, и сколько рассматриваемая аудитория тратит деньги, покупая одежду. Рассмотрены параметры, которые влияют на то, сколько денег тратит покупатель и что может повлиять на сумму, которую он тратит (подписки, скидки, промокоды). Категории товаров были распределены по количеству денег, которые тратились на них, и сравнены между собой. Также проанализирована связь времени года и цвета одежды, которую покупают больше всего. На удивление, анализ показал очень схожие графики для всех четырех сезонов, а также не было выявлено заметно превалирующих цветов ни между, ни внутри каждой диаграммы.
Анализируя такие данные, можно сделать выводы, которые можно использовать в маркетинге, продажах и сфере моды. С их помощью можно создавать более успешные схемы продаж и рекламу, а также предсказывать будущие тренды и реагировать на появление новых.
Использование нейросетей: Chat GPT — для оптимизации и улучшения кода, подбора статистических методов анализа.
Обложка: https://pin.it/2hJX0ZMtU