Original size 1140x1600

Steam: анализ игр

PROTECT STATUS: not protected
The project is taking part in the competition

Концепция

Для анализа я решил использовать 2 датасета из Kaggle:

1. Steam Games Dataset 2. Game Recommendations on Steam

Хотелось получить актуальные данные, поэтому были выбраны свежие датасеты. Первый опубликован 8 месяцев назад, второй — год назад.

В первый датасет включена информация более 100 000 игр. Но в нем отсутствует информация о том, рекомендует ли игрок игру или же нет, поэтому был использован второй датасет, в котором включена эта информация.

Я учусь на профиле «Гейм-дизайн», поэтому мне интересно проанализировать один из самых популярных магазинов игр.

Что именно хочется узнать посредством анализа датасетов:

1. Самые популярные игры и жанры 2. Корреляция между стоимостью игры и отзывами 3. Объем игр, выпущенных под конкретные Операционные системы

Типы графиков:

1. Столбчатая диаграмма 2. Круговая диаграмма 3. Диаграмма рассеяния 4. Диаграмма с линиями

Стиль

big
Original size 1783x529

В качестве шрифта был выбран M PLUS Rounded 1c, так как мне понравилось как он выглядит на визуализациях. Акцентные цвета — белый и оливковый.

Анализ датасетов

big
Original size 1920x832

Для начала были импортированы Pandas и другие необходимые библиотеки.

Original size 1215x701
Original size 1920x832

«Оценка популярности» включает в себя объединение таких данных как общий рейтинг игры и количество отзывов от пользователей.

В изучающей визуализации все подробно описывается, но много визуального шума.

Original size 1175x655
Original size 1920x832

В объясняющей визуализации были убраны излишние «Название игры», «Оценка популярности», пунктирные линии, рамки, а также короткие линии после игр. Заголовок графика был сокращен.

Ключевой текст «Топ-10 самых популярных игр» теперь выделен жирным шрифтом.

Counter-Strike — наиболее популярная в Steam игра.

Original size 1432x616

Изучающая визуализация включала в себе слишком много жанров, а также излишнюю легенду в правой части.

Лишние элементы были убраны, чтобы сделать объясняющую визуализацию минималистичной.

Диаграмма показывает высокую популярность инди-игр.

Original size 1005x698
Original size 1687x724

Диаграмма рассеяния показывает, что низкая цена не гарантирует высокую оценку.

У более дорогих игр очень мало или почти нет отрицательных отзывов, но при этом их количество является не особо большим. Это плохо, так как Steam продвигает игры с большим количеством отзывов.

Диаграмма показывает, что залог успеха игры — качественное содержание и адекватная стоимость.

Original size 1178x698

Диаграмма с линиями показывает количество игр, которые были выпущены под определенные Операционные системы.

В изучающей визуализации есть информация, которую можно убрать, чтобы смотрящий на диаграмму человек был сфокусирован только на ключевой информации.

Original size 1141x674
Original size 1684x718

В объясняющей визуализации были убраны все лишние цифры, визуальные элементы и тексты, а заголовок переименован.

Названия Операционных систем теперь находятся в конце своих линий и имеют аналогичный цвет.

Windows продолжает доминировать на игровом рынке. Продукция компании Apple слишком дорогая, а их экосистема закрыта, поэтому у многих разработчиков нет доступных возможностей делать портирование под MacOS. Linux пользуется мало людей и разработчики не видят смысла в трате средств и времени на портирование.

Заключение

Игровая сфера очень разнообразная. Среди самых популярных игр в Steam есть AAA-проекты с миллионными бюджетами, так и инди-игры как Terraria.

Круговая диаграмма показывает популярность инди-игр, а диаграмма рассеяния важность сохранения баланса между качеством и содержанием.

Windows на данный момент остается наиболее популярной ОС для выпуска игр.

Описание применения генеративной модели

ИИ Gemini, встроенный в Google Colab, использовался для генерации графиков и улучшения кода.

Была использована именно эта модель, так как она устроила качеством и удобством.

Ссылка

Блокнот и датасеты