
В рамках проекта был выбран датасет на платформе Kaggle Depression and Anxiety Data. В нем есть данные опросов по психическому здоровью с информацией о депрессии, тревожности, возрастных и демографических факторах. Я выбрала этот датасет, потому что тема психического здоровья актуальна в наше время. В последние годы повысился рост тревожности, депрессии и других психических расстройств среди молодёжи, что напрямую влияет на их учёбу, социальные связи и общее качество жизни.
Для анализа данных по психическим расстройствам я использовала несколько видов графиков, каждый из которых выбран исходя из того, какую информацию он лучше всего визуализирует.
Столбчатая диаграмма показывает доли участников по уровням депрессии и тревожности, что наглядно демонстрирует распределение данных и позволяет сразу увидеть количество участников по уровням. Также она используется для сравнения количества мужчин и женщин с наличием депрессии и для распределения людей с наличием суицидальных мыслей.
Линейный график отображает зависимость уровня тревожности и депрессии от возраста.
График рассеяния (scatter plot) демонстрирует корреляцию между тревожностью и депрессией. Он позволяет увидеть, как изменение одного показателя связано с другим. Также я использовала его для визуализации связи между психическим и физическим состояниями.
Box plot показывает распределение уровней сонливости и то, как на этот показатель влияет уровень депрессии и тревожности.
Также были использованы pie chart для визуализации процента людей, получающих лечение и линейная диаграмма для сравнения уровня депрессии и наличия диагноза.
Цветовая палитра
Депрессия: оттенки синего/голубого цвета ассоциируются со спокойствием и «глубиной эмоций», что подходит для анализа депрессивных состояний.

Тревожность: яркие и насыщенные оттенки красного/розового цвета, которые привлекают внимание и символизируют напряжение и эмоциональную активность.

Также на мысль про ассоциации с цветами меня натолкнули персонажи мультика «Головоломка» Печаль и Тревожность
Стиль графиков
Сначала я кастомизировала стиль, добавив вышеуказанные цвета, черный фон и шрифт Commons Pro Mono
Анализ данных
1. Распределение уровней депрессии и тревожности
Большинство участников имеют лёгкий или умеренный уровень депрессии, тяжёлые формы встречаются реже.
Тревожность распределена более равномерно, чем депрессия, но также присутствует группа с высокими значениями.
2. Диаграмма рассеяния: депрессия и тревожность
Диаграмма рассеяния показывает взаимосвязь между уровнем депрессии и тревожности. Каждая точка соответствует одному участнику. Видно, что при увеличении показателя депрессии часто растёт и показатель тревожности, что указывает на взаимосвязь между этими состояниями.
3. Влияние возраста на депрессию и тревожность
График показывает, что уровень депрессии заметно меняется в зависимости от возраста участников. В более младших возрастных группах средние значения ниже, что может быть связано с меньшей учебной и социальной нагрузкой. По мере увеличения возраста средний уровень растет. Это можно объяснить повышением стресса, ответственностью, сложностью учебы и страхом будущего. При этом в старших возрастных группах рост показателей замедляется или стабилизируется, что может говорить о частичной адаптации к стрессовым факторам. .
Уровень тревожности как и уровень депрессии меняется с возрастом. Обычно более молодые участники имеют более высокие показатели тревожности, тогда как у взрослых и пожилых эти показатели ниже. Это может быть связано с тем, что с возрастом люди приобретают больше опыта в управлении стрессом и эмоциональными состояниями, а подростки чаще сталкивается с неопределенностью и социальной нагрузкой, что повышает уровень тревожности.
4. Распределение депрессии по полу
Диаграмма показывает, что в среднем женщины имеют более высокий уровень депрессии, чем мужчины. Такое различие может быть связано с сочетанием биологических, социальных и психологических факторов. Женщины чаще испытывают гормональные колебания, сильнее реагируют на стресс и эмоциональные нагрузки, а также чаще обращаются за помощью и более честно отражают своё состояние в опросах.
5. Суицидальные мысли
С ростом уровня депрессии вероятность возникновения суицидальных мыслей увеличивается. График показывает, что участники с более тяжёлой депрессией чаще имеют суицидальные мысли, что подтверждает важность ранней диагностики заболевания и своевременного лечения.
6. Связь психического и физического состояний (BMI)
График показывает, что у людей с разными индексами массы тела (BMI) встречаются все уровни депрессии. Однако среди участников с умеренной и тяжёлой депрессией чаще наблюдается повышенный BMI. Это говорит о частичной взаимосвязи физического и психического состояния. Избыточный или пониженный вес может сопровождаться повышенной депрессией. В целом можно сказать, что эти факторы не очень сильно связаны.
7. Сравнение наличия диагноза и симптомов
На графике все выглядит так, будто у серьезного уровня депрессии гораздо меньше процент диагнозов, чем у среднего, поэтому я посчитала количество опрошенных людей по уровням.
Тут мы видим, что людей со средним уровнем было опрошено больше всего, из-за этого график именно такой. Людей с тяжелой депрессией тут всего 12, а с минимальной вообще 0.
Если не обращать внимание на соотношение уровней (так как количество опрошенных неравное), можно сделать вывод, что у людей с тяжелой депрессией почти равное соотношение наличия диагноза и симптомов, что говорит о том, что доля участников с официальным диагнозом депрессии увеличивается с ростом уровня депрессии. Чем выраженнее симптомы, тем выше вероятность, что человек получил медицинский диагноз. График подтверждает связь между субъективной оценкой тяжести депрессии и наличием официального диагноза.
8. Сонливость и депрессия/тревожность
Графики показывают, что дневная сонливость напрямую связана с психическим состоянием. У людей с более высоким уровнем депрессии баллы по шкале сонливости выше и распределение более хаотичное. Это показывает, что депрессия усиливает утомляемость и желание спать днём.
То же самое с тревожностью. Чем выше уровень тревожности, тем выше дневная сонливость, хотя эффект выражен менее ярко, чем при депрессии. Это подтверждает, что психическое состояние сильно влияет на физическое проявление усталости и сонливость.
9. Получают ли участники лечение
Так как депрессия является более серьезным заболеванием, я рассмотрела, какая доля опрошенных получает лечение. Значительная часть участников не получает лечение, что может указывать на недостаток доступа к медицинской помощи или недостаточное выявление депрессии. Это подтверждает важность раннего выявления заболевания и поддержки психического здоровья.
Применение генеративных моделей
Для совершенствования кодов и для помощи с их написанием использовался ChatGPT
Для генерации обложки использовалась нейросеть Leonardo AI