
Концепция
В этом проекте я анализирую, как менялась популярность жанров видеоигр с 1980 по 2023 год. В качестве данных я использовал датасет с информацией об играх, их жанрах, датах релиза, пользовательских оценках и показателях вовлечённости. Цель исследования — понять, какие жанры доминировали в разные периоды, как менялась их относительная доля и существует ли связь между популярностью и качеством игр.

Для анализа я использовал Python и библиотеку Pandas, а для визуализации — Matplotlib. Графики я стилизовал в игровой пиксельной эстетике, чтобы визуальный стиль соответствовал тематике данных. Цветовую палитру я сгенерировал с помощью искусственного интеллекта, а также использовал ИИ для решения проблемы с легендами на двух графиках.
Код
Загрузка библиотек и файла

Я подключаю Pandas для анализа данных, NumPy для вычислений и Matplotlib для построения графиков. Файл загружается через Google Colab, чтобы код было удобно запускать онлайн.
Глобальный стиль и палитра
Здесь я настраиваю единый визуальный стиль: тёмный фон, крупные шрифты и неоновые цвета. Палитру цветов я сгенерировал с помощью ИИ, чтобы она выглядела гармонично и соответствовала игровой эстетике.
Вспомогательные функции
В этом блоке я создаю функции для очистки данных: преобразование чисел с суффиксами K/M/B, безопасное чтение списков жанров, а также функции для добавления CRT-эффектов — сканлайнов и шума.
Очистка и подготовка данных
Я привожу даты к формату datetime, извлекаю год релиза, очищаю числовые столбцы и разбиваю список жанров так, чтобы каждая игра могла относиться к нескольким жанрам.
Агрегация данных
На этом этапе я выбираю самые популярные жанры и агрегирую данные по годам: считаю суммарную популярность и среднюю оценку.
Графики
График 1 — Линейный
Показывает, как менялась популярность топ-жанров по годам. Он позволяет увидеть долгосрочные тренды и пики интереса. Для этого графика я использовал ИИ, чтобы исправить проблему с легендой: обозначения жанров сливались с фоном, и ИИ помог подобрать решение с фоном и цветом текста.
График 2 — Столбчатый
Отражает суммарную популярность жанров за весь период. Удобен для прямого сравнения жанров между собой.
График 3 — Гистограмма
Показывает распределение пользовательских оценок внутри самого популярного жанра, что даёт представление о качестве игр.
График 4 — Точечный
Здесь я анализирую связь между популярностью и средней оценкой. Я использую логарифм популярности, потому что значения сильно различаются по масштабам, и без логарифма точки сливались бы в одну область.
График 5 — Stacked Area
Показывает долю жанров в общей популярности по годам. В этом графике я также использовал ИИ для решения аналогичной проблемы с легендой, которая уже возникала в самом первом графике.
Вывод
Анализ показал, что структура игровой индустрии со временем меняется: одни жанры теряют доминирование, другие — выходят на первый план. При этом высокая популярность не всегда означает высокую среднюю оценку, что говорит о различии между массовым интересом и качеством контента.
Описание применения генеративной модели
Ссылки