
Почему я выбрала эти данные?
Я решила исследовать вселенную Покемонов, потому что за, казалось бы, простой игрой скрывается сложная математическая модель. Датасет содержит информацию о 800 персонажах: их типы, поколения и боевые характеристики.
Это достаточно большой объем данных, чтобы вручную в нём было не разобраться, но идеальный для того, чтобы с помощью Python найти скрытые закономерности игрового баланса. Мне было интересно узнать: действительно ли разработчики делают новых персонажей сильнее старых, или баланс сохраняется?
Как я обрабатывала данные
Я не стала просто строить графики по готовой таблице, а сначала доработала данные. В исходном файле были разрозненные характеристики (Атака, Защита, Скорость), но не было понятно, кто же сильнее в целом. Поэтому с помощью Pandas я создала новую колонку Total, программно сложив все показатели. Это позволило мне оценивать покемонов комплексно.

Кроме того, я уделила внимание визуализации: через код настроила кастомную цветовую палитру и темную тему, чтобы графики выглядели современно и читаемо, а не стандартно.

График 1 — Кого в игре больше?
Начав анализ, я посмотрела на распределение стихий. Оказалось, что в игре огромный перекос: Водных (Water) и Обычных (Normal) покемонов больше всего. А вот Летающие или Феи — большая редкость. Это объясняет механику игры: редкие типы ценятся выше именно из-за их малого количества в данных.
График 2 — Математика баланса
Гистограмма атаки отлично показывает, как разработчики удерживают баланс. Мы видим форму классического «колокола»: подавляющее большинство персонажей — крепкие «среднячки». Совсем слабые или экстремально сильные встречаются редко. Если бы график был ровным, игра была бы скучной, а так — сохраняется интрига.
График 3 — Атака против Защиты
Мне было интересно, есть ли прямая связь: если ты сильно бьешь, значит ли это, что у тебя крепкая броня? График разброса (Scatter plot) показывает, что прямой зависимости нет — «облако» точек размыто.
Однако, обратите внимание на желтые точки в правом верхнем углу. Это Легендарные покемоны. Данные четко показывают их элитный статус: они единственные, кто имеет запредельные показатели и атаки, и защиты одновременно.
График 4 — Эволюция поколений
Используя ту самую вычисленную мной колонку Total, я сравнила разные поколения игры. Был риск увидеть «инфляцию силы» — когда новые персонажи делают старых бесполезными. Но график «ящик с усами» доказывает обратное: медианная сила (линия внутри ящика) почти не меняется от поколения к поколению.
Разработчики строго следят за тем, чтобы старые герои оставались актуальными.
Итоги
В ходе работы мне удалось превратить «сухую» таблицу в наглядное исследование. Использование Python позволило не только визуализировать данные, но и создать новые метрики для анализа.
У меня получилось доказать, что игровой баланс держится на строгом математическом распределении.
Описание применения генеративной модели
В работе над проектом искусственный интеллект использовался в качестве ассистента для оптимизации рутинных задач. Вся логика исследования, выбор данных и интерпретация выводов выполнены автором самостоятельно.
Сферы применения:
1. Код и синтаксис: Использовался ChatGPT (версия GPT-4o / GPT-4) для поиска команд библиотеки Seaborn (настройка цветовой палитры и темной темы), и отладки ошибок.
2. Визуализация: Обложка презентации сгенерирована в NanoBananaPRO по авторскому промпту для соответствия стилистике проекта.
Примеры промптов:
> «Как изменить стандартную цветовую палитру в графике seaborn на темную тему с неоновыми цветами (бирюзовый #00FFDD и розовый)? Напиши параметры rcParams.»
> «Vertical poster, Pixel art style Pokemon battle, glitch effect, Pikachu standing in front of a giant computer screen with python code, dark mode, neon cyan and magenta lighting, retro gaming console atmosphere, detailed pixels, black background»