Original size 2918x4095

Исследование персонажей Pokémon

PROTECT STATUS: not protected
The project is taking part in the competition

Для выполнения проекта была выбрана тема, основанная на данных о покемонах. Этот набор данных является одним из самых популярных и хорошо структурированных открытых датасетов, что делает его удобным для анализа и визуализации. Кроме того, мир покемонов содержит множество различных характеристик, что позволяет исследовать связи между параметрами и создавать разнообразные графики. Такой формат данных предоставляет широкие возможности для изучающего анализа и наглядного представления результатов.

post

На данном этапе был подключён датасет с помощью библиотеки Pandas. Данные загружаются напрямую по ссылке в формате CSV и сохраняются в таблицу (DataFrame), с которой далее проводится весь анализ и построение графиков. Команда df.head () используется для первичной проверки структуры данных: она позволяет убедиться, что таблица корректно загрузилась, а также посмотреть названия столбцов и типы значений. Эти данные в дальнейшем служат основой для всех вычислений, группировок и визуализаций в проекте.

big
Original size 1220x727
post

Для построения данного графика использовалась информация из таблицы покемонов, где у каждого существа указан его основной тип. На первом этапе данные были сгруппированы по столбцу Type 1, после чего было подсчитано количество покемонов каждого типа. Это позволило определить, какие типы встречаются наиболее часто и какие — являются более редкими. После группировки результаты были отсортированы по убыванию, чтобы самые распространённые типы находились в начале диаграммы. Такой порядок делает визуализацию легче для восприятия и помогает сразу увидеть основные закономерности. Дополнительно для графика была добавлена цветовая палитра, чтобы каждый столбец отображался своим собственным цветом. Это было сделано для улучшения читаемости и визуальной привлекательности: разноцветные столбцы позволяют быстрее различать категории и делают диаграмму более выразительной. Для обработки данных использовалась библиотека pandas, а для визуализации — matplotlib.

После рассмотрения средних значений атаки разных типов покемонов возникла необходимость взглянуть глубже на индивидуальные параметры отдельных персонажей. Столбчатая диаграмма показывает общую картину по типам, но не отражает, насколько широким может быть разброс характеристик у каждого покемона.

Поэтому следующим шагом становится анализ связи между отдельными параметрами — атакой и защитой. Такой подход позволяет увидеть, существуют ли закономерности внутри всей выборки и насколько равномерно распределены характеристики.

Original size 695x552
post

Для создания данного графика использовались числовые характеристики покемонов — Attack и Defense. Эти параметры были выбраны потому, что они хорошо отражают боевой стиль существа: одни покемоны делают упор на силу удара, другие — на защиту. Чтобы построить график, из таблицы были взяты два столбца, и каждая точка на диаграмме стала отдельным покемоном. Такой формат позволяет увидеть общее распределение характеристик и понять, существуют ли связи между атакой и защитой. Scatter plot был выбран потому, что он показывает индивидуальные значения, а не сглаженные средние. Визуально можно заметить, что большинство покемонов находятся в среднем диапазоне, а редкие выбросы — вероятно, легендарные — выделяются точками далеко от основной массы. Из библиотек использовался pandas для выделения нужных столбцов и matplotlib для построения самой диаграммы.

Рассмотрев взаимосвязь между атакой и защитой, можно заметить, что отдельные покемоны распределяются довольно хаотично, образуя широкий спектр комбинаций характеристик. Однако такой график не позволяет определить, насколько каждая характеристика зависит от принадлежности покемона к определённому типу.

Чтобы получить более структурированное понимание, следующий этап анализа заключается в переходе от сравнения индивидуальных параметров к рассмотрению средних характеристик внутри групп. Поэтому далее внимание уделяется средней атаке покемонов различных типов.

Original size 878x705
post

Для построения графика была рассчитана средняя величина характеристики Attack для каждого типа покемонов. Такой подход позволяет сравнить боевой потенциал разных типов и увидеть, какие из них обладают наиболее высоким атакующим потенциалом. Перед построением визуализации данные были сгруппированы по столбцу Type 1, после чего для каждого типа была вычислена средняя атака. Это простой, но информативный способ оценить общие различия между типами. Для улучшения восприятия график был дополнительно стилизован. Вместо стандартного одного цвета была использована градиентная палитра, где каждый столбец окрашен своим оттенком. Это не только делает визуализацию более привлекательной, но и облегчает различение категорий. Горизонтальная ориентация диаграммы выбрана для лучшей читаемости длинных подписей типов. Итоговый график позволяет быстро определить, что типы Dragon, Fighting и Ground обладают наиболее высокой средней атакой, а Fairy и Electric — ниже остальных.

После оценки средних значений атаки среди типов становится понятно, какие группы обладают более выраженным наступательным потенциалом. Однако средние показатели не отражают того, как отдельные параметры взаимодействуют друг с другом.

Для более глубокого понимания структуры боевых характеристик полезно посмотреть, как атакующий потенциал сочетается с другим важным параметром — скоростью. Это позволяет увидеть, существуют ли взаимосвязи между агрессивностью покемона и его мобильностью. Поэтому следующим шагом становится анализ зависимости скорости от атаки.

Original size 849x628
post

Для анализа возможной связи между двумя ключевыми характеристиками покемонов — Attack и Speed — была построена точечная диаграмма. Такой вид графика подходит для того, чтобы визуально определить, существует ли взаимосвязь между двумя числовыми параметрами. Каждая точка на графике представляет отдельного покемона. Чтобы визуализация была более разнообразной и наглядной, точкам были присвоены разные цвета, выбранные случайным образом из заранее заданной палитры. Это делает распределение значений более живым и облегчает визуальный анализ плотности данных. Перед построением диаграммы из таблицы были выбраны только числовые столбцы Attack и Speed. Далее значения были нанесены на координатную плоскость. График показывает широкий разброс значений, что характерно для разнообразия покемонов. Можно заметить, что высокой атаке часто сопутствует средняя или высокая скорость, однако чёткой линейной зависимости не прослеживается. Такое распределение отражает баланс характеристик, заложенный в игровой механике.

Исследование связи между атакой и скоростью демонстрирует, как отдельные боевые параметры сочетаются на уровне каждого покемона. Однако подобная визуализация не показывает различий между типами и не отражает общую живучесть представителей разных групп.

Чтобы дополнить картину баланса характеристик, важно рассмотреть ещё один ключевой показатель — здоровье (HP). Анализ средней величины HP по типам позволяет понять, какие группы обладают повышенной выносливостью, а какие — более уязвимы. По этой причине следующим графиком является сравнение среднего уровня HP среди различных типов покемонов.

Original size 644x663
post

Для данного графика были сгруппированы покемоны по типам и рассчитано среднее значение показателя HP для каждого типа. Это позволило сравнить, какие типы в среднем обладают большим запасом здоровья, а какие — меньшим. Круговая (пончиковая) диаграмма была выбрана для того, чтобы наглядно показать вклад каждого типа в общей структуре средних значений HP. Цветовое разделение помогает визуально отличать типы между собой, а процентные подписи упрощают сравнение даже при небольших различиях между значениями.

Полученные визуализации помогают лучше понять различия между типами покемонов и увидеть общие закономерности в их характеристиках. Такой анализ делает данные более наглядными и может пригодиться для сравнения персонажей, изучения игровых механик или создания собственных идей на основе этих характеристик.

Использованные ресурсы: Нейросеть GPT 5.2 — для решения ошибок и консультации по поводу возможностей тех или иных библиотек.