Original size 1024x1536

Анализ самых распространенных ароматов парфюма

PROTECT STATUS: not protected
The project is taking part in the competition

Введение

Подавляющее большинство ароматов на рынке парфюмерии строится из ароматических нот, формирующих верхний, средний и базовый аккорды. Анализ этих данных поможет больше узнать о предпочтениях людей при выборе ароматов, а также культурных трендах в этой области. Может быть, эти данные даже получится использовать для создания или подбора своего, «сигнатурного» аромата.

Цель исследования — определить, какие ноты встречаются чаще всего в современных ароматах и объяснить причины их популярности

big
Original size 1902x821

Палитра, собранная с помощью сайта https://gradients.app

Классификация

Сгруппируем ноты по:

>уровню пирамиды (верхние, средние, базовые),

>семействам (цитрусовые, цветочные, древесные, восточные, мускусные и др.),

>частоте упоминаний.

Как основу анализа я выбрала таблицу с категориями парфюма по основным нотам, стране происхождения, брендом и т. д. на сайте Kaggle. Мне было просто интересно проанализировать ароматы парфюма, потому что ассоциация работы с приятными образами натуральных ароматов показалась мне хорошей идеей. Также я посчитала, что на основе растительных компонентов для различных духов получится сделать приятную цветовую палитру.

В качестве визуализации я представляю графики в виде: круговой и столбчатой диаграммы и линейный график.

Топ 20 самых популярных нот

Original size 1189x590

Главный вопрос этого исследования — какие же ноты можно назвать самыми распространенными.

Рассмотрим все три типа нот по пирамиде ароматов.

Верхние ноты Чаще всего: Бергамот Лимон Апельсин

Причины популярности: >универсальны для мужских, женских и унисекс ароматов; >хорошо сочетаются с большинством семейств.

Средние ноты (сердце аромата) Наиболее частые: Роза Жасмин Ландыш

Причины: >цветочные ноты традиционно ассоциируются с парфюмерией; >обладают широкой палитрой оттенков — от свежих до пудровых; Роза и жасмин — лидеры среди «сердечных» нот.

Базовые ноты (шлейф и стойкость) Самые распространённые: Мускус Амбра Сандал

Причины: >создают ощущение тепла и глубины; >синтетические аналоги стабильны и безопасны; Мускус и сандал— самые универсальные базовые ноты.

0

Самые популярные ноты относительно пирамиды ароматов

Original size 989x490

Этот график еще лучше показывает распределение популярных нот относительно пирамиды.

Для его оформления я решила взять бежевый цвет фона. Бежевый фон (#F8DCB6) имитирует «парфюмерную бумагу» или светлый блокнот, что, мне кажется, подходит для донесения информации еще лучше. Цвета нот и категорий взяты из собранной палитры. Они помогают различать категории и бренды, создают контраст.

Original size 857x764

Количество топ 10 самых используемых нот

По этой таблице можно наглядно отследить количество упоминаний ингредиентов в составах самых разных ароматов. Упоминания мускуса превосходят второй по популярности бергамот почти на 2500. Ноты с меньшим количеством упоминаний отмечены в таблице бежевым цветом, так как не сильно различаются по количеству.

Original size 888x777

Диаграмма популярных брендов

Original size 716x661

Неожиданно было увидеть в топе производителей Zara и Avon, так как эти не эти бренды в первую очередь ассоциируются с парфюмом. С другой стороны это оправдано, ведь массмаркет может позволить выпускать большое количество разнообразных ароматов, чтобы привлечь как можно больше покупателей. Хотя стоит отметить, что разница с другими производителями не так уж велика.

Original size 780x509

Топ нот по количеству упоминаний

Original size 1189x590

Этот график иллюстрирует, опять же, количество упоминаний, но тут нагляднее можно проследить разницу в количестве между теми нотами, которые в топе и теми, что в конце списка.

Original size 784x291

Итого по количеству упоминаний лидируют:

1.Бергамот 2.Роза 3.Жасмин 4.Ваниль 5.Мускус 6.Сандаловое дерево 7.Пачули 8.Амбра 9.Лимон 10.Кедр

Статистические методы

Подсчёт частоты — основной метод для оценки популярности нот или брендов. Для категориальных данных это ключевая метрика «встречаемости».

Разделение по полу и году выпуска позволяет сравнивать подгруппы. Ноты в строках часто записаны как списки через запятую. Это превращает их в отдельные строки для подсчёта частоты.

Нормализация размеров для визуализации: на диаграмме рассеяния используем линейную нормализацию размеров точек: Это статистически корректный способ показать относительные значения без перегрузки графика.

Сравнение распределений по полу или году позволяет выявить тенденции, например, какие ноты чаще встречаются в мужских или женских ароматах.

Заключение

Анализ показывает, что парфюмерный рынок опирается на ограниченный, но универсальный набор нот, обеспечивающих узнаваемость, стабильность и коммерческий успех ароматов.

Доминирование бергамота, розы, жасмина, ванили и мускуса связано с их:

>высокой потребительской привлекательностью, >технологической доступностью, >культурной узнаваемостью в парфюмерной традиции.

Эти ноты формируют основу современной парфюмерии, вокруг которого строятся как массовые, так и нишевые композиции.

Обложка сгенерирована в ChatGPT5