Original size 1140x1600

Выбираем автомобиль. Структурный анализ.

PROTECT STATUS: not protected
The project is taking part in the competition
big
Original size 1302x198

Скоро мне предстоит сдача экзамена на получение прав и большая часть моих мыслей посвящена волнению из-за этого события.

Чтобы прибавить себе уверенности, я решила провести анализ, который бы помог мне определиться с выбором и покупкой собственного автомобиля.

При анализе я использовала два датасета: AutoScout24 Car Listings Dataset и BMW SALES (2010-2024). Первый датасет содержит разнообразную информацию об объявлениях о продаже автомобилей, опубликованных на сайте AutoScout24. Второй датасет включает в себя данные о продажах различных моделей марки BMW с 2010 по 2024 гг.

big
Original size 1302x198

Анализ данных задан определенной структурой «от большего к меньшему», которая позволяет сузить большое количество автомобилей разных видов до нескольких определенных моделей, тем самым облегчая выбор.

Для визуализации анализа использовались диаграммы и графики, наиболее наглядно демонстрирующие суть заданной мною структуры:

01 Гистограмма— подразделение большого пласта информации на определенные разделы.

02 Горизонтальная столбчатая диаграмма — выявление дополнительной информации в определенном ранее разделе.

03 Точечный график — углубление в ассортимент выбранного бренда по ключевому техническому параметру.

04 Линейный график — анализ жизненного цикла и рыночного успеха конкретной модели во времени

05 Круговая диаграмма — сравнение по социальному рейтингу

post

При создании цветовой палитры я ориентировалась на логотип любимой марки — BMW. Строгая палитра цветов также отражает серьезность темы, не отвлекая зрителя, позволяя полностью сконцентрироваться на обрабатываемых данных.

Иронично, что в самом проекте я пришла к углубленному сравнению данных именно марки BMW, хотя и не предполагала такого исхода событий при выборе цветовой палитры.

big
Original size 1302x415

цвета: 0F1216, 2A3441, 5B7C99, E9EEF5

Используемый шрифт: Monospac821 WGL4 BT.

Придает техничности и строгости.

Original size 1302x187
Original size 1302x198
0

Поскольку данный анализ был направлен на облегчение покупки моей собственной машины, я выбрала среднее арифмитическое значение цен на машины марки Audi как опорную точку для определения верхней границы ценового сегмента:

audi_avg_price = df_used[df_used['make'] == 'Audi']['price'].mean ()
df_target = df_used[df_used['price'] <= audi_avg_price].copy ()

Определила самый частотный ценовой диапазон, чтобы показать, где концентрируется большинство предложений:

max_idx = np.argmax (counts)

Вывод: большинство предложений сконцентрировано в узком ценовом диапазоне. Это «зона комфорта» рынка, где спрос и предложение сбалансированы, а отклонения от этого диапазона (дешёвые/дорогие авто) являются исключениями.

Original size 1302x198
0

При создании данного графика использовались четкие ограничения в ценовом диапазоне, определенные предыдущей диаграммой:

df_mid = df[(df['price'] >= 24753) & (df['price'] <= 26056)]

Я выбрала диапазон с наибольшим количеством предложений, однако структура позволяет пользователю выбирать сегменты и по другим принципам.

Чтобы идентификацировать наиболее представленных бренды и иметь возможность их ранжирования по рыночному присутствию использовался метод распределения частот:

top_10 = df_mid['make'].value_counts ().head (10)

Вывод: Хоть данный сегмент и характеризуется равным присутствием как премиальных, так и массовых брендов автомобилей, BMW демонстрирует абсолютное доминирование в сегменте — машины данной марки чаще всего попадаются в объявлениях.

Original size 1302x198
0

После определения доминирующей марки на рынке объявлений, следует выбор модели данной марки. Я отбирала модели по критерию мощности (лошадиные силы), другие пользователи могут выбрать значимые для них критерии.

Используя метод группировки данных по критерию, удалось создать рейтинг, понятно отображающий самую мощную модель марки BMW:

top_models = bmw.groupby ('model')['power_hp'].mean ().nlargest (10)

Вывод: точечная диаграмма показала наглядное разделение между моделями BMW и их мощностями, явно отделяя спорткары (М5, М8) от внедорожников (ХМ) или купе (M6, M8).

Original size 1302x198
0

Данный этап структуру подразумевает анализ выбранной модели по различным критериям. Я выбрала анализ динамики продаж, так как модель М5 является нишевой и ее успех на рынке не гарантирован.

Здесь важно было выделить экстремумы, отражающие пики продаж:

max_year = m5_sales.idxmax () max_sales = m5_sales.max ()

Original size 1302x198
0

Для сравнения были сформированы две независимые подгруппы одной модели:

bmw_m5 = df[df['make'] == 'BMW') & df['model'].str.contains ('M5', na=False))].copy ()

Основой для сравнения стало использование выборочного среднего в качестве точечной оценки для генерального среднего процента рекомендаций по каждой модели:

model_stats = bmw_m5_clean.groupby ('model')['rec_pct'].mean ()

Вывод: владельцы флагманской спортивной модели M5 несколько чаще готовы рекомендовать свою машину, чем владельцы более комфортабельной модели M550. Обе модели получают выше 45% рекомендаций, что является очень хорошим показателем для автомобилей премиум-сегмента.

Original size 1302x198

В результате проделанной работы мне удалось создать удобную структуру отбора нужной марки и модели автомобиля по определенным критериям. Использование различных типов визуализаций позволяло выявлять нужные отличия, которые необходимы для подразделения единой категории на несколько сегментов.

В широком рынке автомобилей легко потеряться, поэтому использование заранее продуманной структуры может облегчить выбор, позволяя человеку полагаться не только на свое собственное мнение, но и на четкие аналитические данные.

Original size 1302x198

Для генерации обложки я использовала ChatGPT. Промт: A cinematic urban photograph of two modern BMW sedans parked nose-to-nose on a quiet street. One car in deep metallic blue, the other in light silver/grey. Front three-quarter view, low angle, emphasizing the kidney grilles, sharp LED headlights, and clean modern body lines. Background: a textured city wall split between yellow painted brick and red brick with large industrial windows. Soft natural daylight, muted colors, realistic reflections, slightly vintage film look, shallow depth of field. Minimalist composition, no people, calm atmosphere, high detail, realistic photography.

Original size 1302x198