Original size 832x1248

Анализ данных о покемонах

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

В проекте проанализирован датасет, содержащий информацию о покемонах нескольких поколений (сезонов). За эти сезоны появилось больше тысячи покемонов с совершенно разными характеристиками и параметрами, и мне было любопытно узнать, какие закономерности и интересные факты можно выявить, анализируя их всех.

Для работы был взят датасет с сайта Kaggle, содержащий подробную информацию о каждом покемоне.

Анализ данных и их визуализация были представлены с помощью диаграмм рассеивания, текстовых данных, линейного графика, линейчатой и круговой диаграммы.

big
Original size 1366x325

Основой для визуального стиля проекта стала одна из коллекционных карточек с покемоном Венузавром — финальной эволюцией одного из стартовых покемонов первого поколения, с которого и началось развитие вселенной Покемонов.

С помощью Adobe Color была сформирована палитра из 5 цветов.

big
Original size 600x475

Фрагмент карточки и палитра из Adobe Color

Для работы мною был выбран шрифт SevenExEight Pixel, так как в оригинальных играх тоже был использован пиксельных шрифт.

Начальный код для установки шрифта был создан с помощью ChatGPT и отредактирован мной после.

Промпт: Напиши код, чтобы поменять шрифт всех созданных графиков на SevenExEight Pixel.

Original size 1800x700

Подготовка к работе: загрузка датасета, установка шрифта.

Визуализация данных

В первую очередь, мне было интересно соотнести покемонов по сумме их статистик: здоровья, атаки, защиты, скорости. Цветом были выделены особенно сильные покемоны.

Такой тип графика был выбран потому, что есть много покемонов с одинаковой суммой характеристик, и поэтому линейчатые диаграммы не были особенно содержательны. В данном случае используется изучающий анализ данных.

0

Диаграмма рассеивания, иллюстрирующая соотношение покемонов с разной суммой статистик.

Используя индекс (порядковый номер) покемонов получилось заметить то, что в каждом поколении есть примерно одинаковое количество очень сильных покемонов — получилось как раз девять столбиков, редкие покемоны стоят ближе к концу списка.

Помимо того, чем выше поколение, тем больше в нём сильных покемонов: если в первом таких покемонов всего 3, то в девятом поколении больше десяти!

Также из тысячи покемонов выделился лишь единственный, сумма характеристик которого пересекла число 700. Найдём его с помощью объясняющего анализа.

0

Ищем самого сильного покемона среди всех: первое изображение — его данные, второе — код для поиска.

post

Самый сильный покемон — Аркеус!

Сумма его статистик: 720

Дальше, мне захотелось узнать, какой покемон является самым большим среди всех. И тут нашёлся явный лидер, оторвавшийся от второго места на целые пять метров в длину!

0

Самые большие покемоны

Original size 1366x376

Этернатус — самый большой покемон!

Продолжая тему силы покемонов, каждый покемон обладает определённым типом, или же стихией, которая определяет вид его атак. Некоторые покемоны имеют не одну, а две стихии, что позволяет им изучать больше видов атак.

На самом деле, покемоны с двойным типом встречаются не так редко, что можно доказать приведённой статистикой, через объясняющий анализ:

0

Круговая диаграмма, в которой показано, какая часть из всех покемонов обладает дополнительным типом (стихией).

Помимо того, у каждого из покемонов есть начальный показатель счастья при поимке. Разделим покемонов на поколения, чтобы посмотреть, как менялся средний показатель счастья через года.

Для деления покемонов на поколения использовался ChatGPT. Промпт: Напиши код, который позволил бы разделить покемонов в группы в зависимости от их показателя Generation

0

Линейный график, показывающий средний показатель начального счастья покемонов во всех поколениях (сезонах) по порядку.

post

Сделаем вывод, что максимальный средний показатель счастья был в первом поколении, а дальше он постепенно снижался, иногда слегка поднимаясь.

Начиная с шестого поколения, показатель счастья сильно упал, пока не достиг своего минимума в девятом сезоне.

Описание применения генеративной модели

Adobe Color Генерация цветовой палитры на основе загруженного изображения

ChatGPT Обращалась с целью создания тех фрагментов кода, которые не знала, как сделать сама. Далее самостоятельно обрабатывала эти фрагменты, выявляя ошибки и подставляя нужные мне переменные.

Ideogram Использовался для создания обложки. Промпт: Create an image of a pokemon eevee frolicking in a sunny field