Original size 1024x1536

Artificia intelegence, final project

data visualization

The project is taking part in the competition

Финальный проект (андан, МСК, П)

Статистика употребления алкоголя по регионам

Я выбрал эту тему, так как проблема потребления и злоупотребления алкоголя всегда являлась актуальной.

Для своего проекта я использовал открытую базу данных «World Health Organiztion»

Этапы работы

В проекте используется датасет содержащий данные о потребление алкоголя на душу населения (15+) (в литрах чистого алкоголя)

- Есть ли статистически значимая прямая связь между регионом проживания и граммами употребления алкоголя? - Есть ли статистически важные различия в регионах по потребления грамм алкоголя? - Статистически устойчив ли рост потребления по регионам?

Сначала я загрузил данные через библиотеки Pandas. Проверил работоспособность структур данных и удалил пропущенные значения и тп. В общем привел код и данные в порядок. И потом агрегировал данные по регионам и годам.

С этим мне отчасти помогал искусственный интеллект СhatGPT. (Пример промпта: «Нужно исправить ошибку в коде (далее ошибка)»)

Части кода:

import pandas as pd import matplotlib.pyplot as plt

df = pd.read_csv («alcohol_consumption.csv») df.head ()

df.info () df.describe () df.describe ()

Графики: «Потребление алкоголя в мире», «Потребление алкоголя по регионам», «Потребление алкоголя по регионам во времени», «Потребление алкоголя по странам».

Статистические гипотезы подтверждаются, но не полностью, заметен спад употребления алкоголя и отличия по регионам, но закономерность в употреблении не выявлена

В ходе работы использовалась генеративная модель ChatGPT (OpenAI) для: - помощи в структурировании анализа - формулировки исследовательских вопросов - пояснения методов обработки данных

Модель использовалась как вспомогательный инструмент.

HWO statistics

Google Collab IPYNB

Artyom Solovev

data visualization