Original size 1140x1600

Данные повседневности

PROTECT STATUS: not protected
The project is taking part in the competition

В этом проекте мне хотелось поработать с темой, которая не воспринимается как абстрактная статистика, а напрямую связана с повседневной жизнью.

Описание проекта

big
Original size 700x335

Качество жизни — это то, с чем мы сталкиваемся каждый день, даже если не всегда осознанно: работа, усталость, уровень стресса, ощущение удовлетворённости собой и тем, как проходит день.

Интерес к этой теме появился у меня в тот момент, когда я обратила внимание на то, что даже при, казалось бы, стабильном и понятном ритме жизни ощущение удовлетворённости может сильно меняться. Бывают периоды, когда при одинаковой нагрузке хватает энергии и мотивации, а иногда появляется постоянная усталость, несмотря на внешне похожие условия. Мне стало интересно, можно ли увидеть такие различия в данных и какие показатели чаще всего с ними связаны.

Выбор данных для анализа

post

Для исследования я выбрала датасет Quality of Life Data с платформы Kaggle (https://www.kaggle.com/datasets/oluwatosinadewale/quality-of-life-data)

В датасете собрана информация о людях с разным образом жизни: уровень удовлетворённости жизнью, рабочая нагрузка, стресс, баланс между работой и личным временем, а также общее самочувствие.

Работая с данными, я хотела ответить на несколько простых, но важных вопросов: — кто из специалистов работает больше всех? — влияет ли рабочая нагрузка на общее самочувствие? — как влияет образ жизни и сон на продолжительность жизни?

Для анализа я использовала разные типы визуализаций: 1. Горизонтальная столбчатая диаграмма 2. Диаграмма рассеяния с линией линейного тренда 3. Тепловая карта корреляций 4. Линейный график

Визуализация

В качестве небольшого дополнения к работе мне также захотелось посмотреть на тему с более творческой стороны и понять, как нейросеть вообще представляет себе «идеальный» ритм жизни. Мне было интересно, какие образы она создаст, если задать баланс между работой, отдыхом и личным временем не в виде чисел, а в виде визуального настроения. Для этого я создала несколько иллюстраций в нейросети recraft.ai (https://recraft.ai/), стараясь передать ощущение спокойного повседневного ритма. Одна из получившихся иллюстраций в итоге стала обложкой проекта.

Promt: A warm and balanced illustration of an ideal life rhythm, showing harmony between work, rest and personal time, soft natural light, calm everyday scenes flowing into each other, modern and minimal style, gentle color palette, feeling of comfort, stability and inner balance.

0

Цветовая палитра

Цветовую палитру для проекта я подбирала отдельно, уделяя внимание тому, чтобы она поддерживала общее настроение темы. Мне было важно, чтобы цвета выглядели спокойными и ненавязчивыми, ассоциировались с повседневной жизнью, балансом и ощущением комфорта.

Для подбора и систематизации цветовой палитры я использовала Adobe Color. (https://color.adobe.com/ru/)

Основные используемые цвета:

#F5F5F5 #2F2F2F #D7897F #F9B95C #96C7B3 #6398A9 #D7897F

Original size 1600x2400
Original size 1175x228

Шрифт для проекта — Pacifico, так как он полностью отражает мою тему.

Профессии с наибольшей рабочей нагрузкой

0

График показывает среднее количество рабочих часов в день для разных профессий. Самая высокая нагрузка наблюдается у предпринимателей и менеджеров. Ниже в рейтинге находятся специалисты из сферы здравоохранения, водители и рабочие профессии. Наименьшее среднее количество рабочих часов среди представленных групп у артистов и преподавателей.

Связь рабочей нагрузки и продолжительности жизни

0

Точечный график иллюстрирует зависимость между количеством рабочих часов в день и возрастом смерти. Каждая точка соответствует отдельному наблюдению и окрашена в зависимости от профессии. Чёрная линия тренда показывает общую тенденцию снижения продолжительности жизни при увеличении рабочей нагрузки.

Корреляции показателей образа жизни и продолжительности жизни

0

Тепловая карта отражает взаимосвязи между работой, отдыхом, сном, спортом и возрастом смерти. Наиболее заметна отрицательная корреляция между количеством работы и отдыхом, а также между работой и возрастом смерти. Положительная связь наблюдается между отдыхом, спортом и продолжительностью жизни.

Возраст смерти в зависимости от продолжительности сна

0

Линейный график показывает, как средний возраст смерти меняется при разной продолжительности сна. Максимальные значения наблюдаются при сне около 7–8 часов в сутки. При меньшем и большем количестве сна средний возраст смерти снижается.

Original size 1175x228

Использованные статистические методы

В ходе анализа взаимосвязей между образом жизни, профессиональной деятельностью и продолжительностью жизни были применены следующие статистические методы и приёмы анализа данных:

• Агрегирование и описательная статистика — использовались для расчёта средних значений продолжительности рабочего дня по типам профессий. Это позволило количественно сравнить рабочую нагрузку между различными профессиональными группами.

• Ранжирование и сравнительный анализ категорий — применялись при упорядочивании профессий по уровню средней занятости, что дало возможность выделить профессии с наибольшей и наименьшей рабочей нагрузкой.

• Выборочная визуализация данных — использовалась при анализе связи между рабочими часами и возрастом смерти. Ограничение выборки и равномерное подвыборочное представление позволили снизить визуальную перегруженность и сохранить репрезентативность данных.

• Корреляционно-регрессионный анализ — применялся для оценки линейной зависимости между средней продолжительностью рабочего дня и возрастом смерти. Линейная регрессия позволила выявить общий направленный тренд взаимосвязи показателей.

• Корреляционный анализ многомерных данных — использовался для изучения взаимосвязей между ключевыми характеристиками образа жизни (работа, отдых, сон, физическая активность) и продолжительностью жизни. Расчёт коэффициентов корреляции позволил оценить силу и направление этих связей.

• Анализ распределений по интервалам — реализован через группировку значений продолжительности сна по фиксированным диапазонам. Это позволило исследовать нелинейную зависимость между количеством сна и средним возрастом смерти.

• Визуальный анализ взаимосвязей — применён с использованием столбчатых диаграмм, диаграмм рассеяния, тепловой карты корреляций и линейных графиков, что обеспечило наглядную интерпретацию выявленных статистических закономерностей.

Вывод

Анализ визуализаций показывает, что рабочая нагрузка является одним из ключевых факторов, влияющих на качество и продолжительность жизни. Рейтинг профессий демонстрирует, что группы с наибольшим количеством рабочих часов в день в среднем имеют более низкие показатели возраста смерти. Это наблюдение подтверждается точечным графиком, где линия тренда указывает на устойчивую отрицательную связь между продолжительностью рабочего дня и возрастом смерти. Корреляционная матрица дополнительно показывает, что увеличение времени, затрачиваемого на работу, связано с сокращением времени отдыха и сна, а также с более низкими показателями продолжительности жизни. В то же время отдых, физическая активность и сон демонстрируют положительную связь с возрастом смерти, что подчёркивает их роль как компенсирующих факторов. Линейный график сна показывает, что наивысшие значения среднего возраста смерти наблюдаются при продолжительности сна около 7–8 часов. При меньшем и большем количестве сна этот показатель снижается, что указывает на существование оптимального диапазона восстановления.

Original size 1920x1080

В совокупности все графики подтверждают, что наиболее благоприятные показатели качества жизни формируются при умеренной рабочей нагрузке и сбалансированном распределении времени между работой, отдыхом и восстановлением.

Применение генеративной модели и вспомогательных инструментов

1. Kaggle — Платформа была использована для поиска и загрузки датасета.

2. Google Colab — Весь процесс работы: обработка данных и визуализация.

3. Библиотеки Python kagglehub — для автоматического скачивания датасета matplotlib.font_manager — для подключения кастомного шрифта pandas — использовалась для загрузки датасета, очистки, преобразования и анализа табличных данных. matplotlib — основной инструмент для построения визуализаций в проекте. numpy — применялась для работы с числовыми данными и расчёта вспомогательных величин при построении графиков.

4. Цветовая палитра (Adobe Color)

5. recraft.ai (https://www.recraft.ai/projects) — Использовала для генерации обложки и иллюстраций.

6. ChatGPT — Нейросеть применялась для генерации и оптимизации кода, настройки визуального стиля графиков и корректировки функций анализа.

7. Tenor — Использовался для выбора GIF