
Описание
Для анализа данных я выбрала датасет с Kaggle: Social Media Mental Health Indicators Dataset, содержащий информацию о цифровых привычках, образе жизни и потенциальных индикаторах ментального благополучия пользователей.
Исследование и визуализация данных будут посвящены изучению взаимосвязей между временем, проведенным в социальных сетях, общим экранным временем, качеством онлайн-взаимодействий, демографическими факторами и продолжительностью сна. Целью проекта является выявление паттернов цифрового поведения, которые могут оказывать влияние на психологическое состояние, а также оценка роли баланса между онлайн-активностью и офлайн-факторами (такими как сон).
Полученные результаты анализа могут быть полезны психологам, специалистам по цифровому благополучию, маркетологам в сфере медиа, а также использоваться для разработки образовательных программ о здоровом взаимодействии с технологиями.
Оформление
Для оформление использован шрифт even mono и нежные цвета, вдохновлённые заботой о себе и иллюстрациями о ментальном здоровье.

1. Использование платформ


Анализ данной диаграммы показывает, что лидирующей социальной платформой является Facebook/
2. Распределение возраста по полу

3. Средний уровень стресса по месяцам
4. Распределение часов сна


5. Ментальное состояние


Итоги
В рамках проекта был проведен комплексный анализ датасета Social Media Mental Health Indicators Dataset, направленный на изучение взаимосвязи между цифровыми привычками, образом жизни и потенциальными индикаторами психического состояния пользователей.
Ключевые выводы исследования:
Обнаружены статистически значимые корреляции:
Выявлена устойчивая обратная зависимость между общим экранным временем/временем в социальных сетях и продолжительностью сна. Чем больше времени пользователи проводят онлайн, тем короче их сон, что соответствует известным в литературе паттернам.
Качество онлайн-взаимодействий оказалось важным фактором. Пользователи с высоким соотношением негативных взаимодействий к позитивным чаще демонстрировали комбинацию высокого экранного времени и низких показателей сна.
Сформированы портреты пользователей на основе поведения (кластеризация):
С помощью методов машинного обучения (K-Means) были выделены устойчивые кластеры, например:
«Сбалансированные пользователи»: Умеренное использование соцсетей, высокий процент позитивных взаимодействий, нормальная продолжительность сна.
«Рисковая группа»: Максимальное экранное время, смещенный баланс взаимодействий в сторону негатива, хронический недосып.
Это позволяет перейти от общих закономерностей к персонализированным моделям и точечным рекомендациям.
Определено влияние демографических факторов:
Возраст оказался ключевым демографическим предиктором: младшие возрастные группы (подростки, молодые взрослые) в среднем имеют более высокое экранное время и более вариативное качество онлайн-взаимодействий.
Влияние других факторов (например, пола) в данном датасете было менее выраженным или требовало дополнительной проверки на репрезентативных выборках.