Original size 1240x1750

Анализ культурной аудитории музеев и ее динамики

PROTECT STATUS: not protected
The project is taking part in the competition

Описание

Проект исследует, как менялась культурная аудитория музеев на примере музеев Лос‑Анджелеса за несколько лет.

Цель — показать динамику посещаемости, зафиксировать провал в период пандемии и оценить, как аудитория восстанавливалась.

Выбор данных и источник

Для анализа я использовала датасет Los Angeles Museum Visitors, основанный на открытых данных города Лос‑Анджелеса и размещённый на платформе Kaggle. Датасет содержит помесячную посещаемость нескольких музеев (El Pueblo и других), а также позволяет агрегировать суммарную посещаемость по годам.

Выбор этих данных позволил мне проследить временную динамику культурной аудитории, заметить влияние COVID‑19 на посещаемость музеев и последующее восстановление.

Выбранные типы визуализаций и их обоснование

Линейный график ежемесячной посещаемости — показывает, как менялась суммарная посещаемость музеев Лос‑Анджелеса по месяцам. Такой формат лучше всего передаёт временную динамику: видны сезонные колебания, постепенный спад и резкий обрыв во время пандемии, а также первые шаги к восстановлению.

Столбчатая диаграмма годовой посещаемости — агрегирует данные по годам и даёт простой «годовой срез» культурной аудитории. Столбики позволяют без труда сравнивать масштаб посещаемости в разные годы и быстро увидеть, какие периоды были наиболее успешными, а какие стали провальными.

Столбчатая диаграмма изменений год к году — фокусируется не на абсолютных значениях, а на том, как менялась посещаемость от года к году. Такой формат подчёркивает направление и величину изменений: положительные столбики показывают рост аудитории, отрицательные — падение, особенно заметное в 2020 году.

Столбчатая диаграмма посещаемости музеев в 2019 году — сравнивает между собой отдельные музеи в выбранный доковидный год. Горизонтальное считывание столбиков удобно для ранжирования: видно, какие институции собирают основную часть аудитории и насколько сильно они опережают менее популярные пространства.

Круговая диаграмма долей музеев — показывает структуру общей посещаемости в 2019 году: пять крупнейших музеев и категория «Другие музеи». В отличие от столбчатой диаграммы, круговая визуализация акцентирует не абсолютные числа, а доли, позволяя одним взглядом оценить, какой участок «культурного пирога» занимают лидеры и насколько велика суммарная доля всех остальных.

Original size 3126x670

Визуальный стиль академический, контрастный. В качестве основной палитры использованы:

  1. Синий #2E86AB;
  2. Бордовый #A23B72;
  3. Нейтральный серый #888888; Для фона и сетки выбраны нейтральные цвета: #FAFAFA #E5E5E5

В качестве шрифта выбрала Inter, который хорошо подходит для инфографики и поддерживает кириллицу. Шрифт и цвета заданы кодом и формируют единый визуальный стиль. Шрифт подключается в среде Google Colab через ссылку на Google fonts и добавление его в менеджер шрифтов matplotlib, после чего он задаётся как основной для всех подписей и заголовков.

Original size 3126x414

Для обложки проекта я использовала Recraft, сформулировав абстрактный промпт: abstract minimalist illustration, people in museum, lonely women is standing near art object enjoying the moment, gentle light around the figure, no text

Использовала стиль Motion Blur, чтобы передать течение времени.

Обработка и визуализация данных

Original size 3126x328

Сначала я импортировала pandas, matplotlib.pyplot, matplotlib.rcParams и загрузила CSV‑файл с данными о посещаемости музеев Лос‑Анджелеса. Затем выделила столбец с датами, преобразовала его в формат datetime и добавила отдельный столбец с годом, а также вычислила суммарную посещаемость по всем музеям в новом столбце TotalVisitors. Такая предварительная обработка обеспечила корректность последующих группировок по месяцам и годам и сделала сравнения динамики культурной аудитории более точными и наглядными.

Original size 3126x328

Для построения линейного графика общей посещаемости музеев я использовала группировку по году: groupby ('Year')['TotalVisitors'].sum (). Полученный временной ряд стал основой для одного из ключевых графиков, на котором видна общая динамика культурной аудитории музеев Лос‑Анджелеса за несколько лет, включая провал во время пандемии и последующее восстановление.

0

Линейный график построен на основе помесячной суммарной посещаемости музеев: для каждой даты в столбце Month были сложены значения по всем музеям, и эта величина нанесена по оси Y, тогда как по оси X идут месяцы в хронологическом порядке. Таким образом, каждая точка линии соответствует общему числу посетителей музеев Лос‑Анджелеса в конкретный месяц.

Этот график позволяет увидеть более детальную динамику культурной аудитории: сезонные колебания, периоды роста и постепенного снижения интереса к музеям. Особенно заметен резкий обрыв линии в 2020 году, когда посещаемость падает почти до нуля, что визуально подчёркивает масштаб влияния пандемии на музейную жизнь города.

0

Столбчатая диаграмма показывает суммарную годовую посещаемость всех музеев Лос‑Анджелеса: для каждого года были просуммированы месячные значения TotalVisitors, и полученные числа использованы как высота столбцов. По оси X отложены годы, по оси Y — количество посетителей за год, поэтому сразу видно, как общий масштаб музейной аудитории менялся от года к году.

График наглядно фиксирует постепенное снижение посещаемости после 2014–2015 годов и особенно резкое падение в 2020–2021 годах, когда из‑за пандемии музеи почти перестали принимать посетителей. Это подчёркивает, насколько сильно внешние кризисы отражаются на культурной инфраструктуре города.

0

Столбчатая диаграмма построена на основе рассчитанного показателя год‑к‑году: для каждого года из общей годовой посещаемости музеев вычиталось значение предыдущего года, и эта разница записывалась в отдельный столбец. Положительные значения отображаются как столбики выше нулевой линии, отрицательные — ниже, поэтому по оси X видны годы, а по оси Y — изменение количества посетителей по сравнению с предыдущим годом.

Такая диаграмма не показывает абсолютные уровни посещаемости, а подчёркивает именно динамику: в какие годы аудитория росла, а в какие резко сокращалась. Особенно заметен глубокий отрицательный столбик для 2020 года, который наглядно фиксирует спад музейной посещаемости в период пандемии по сравнению с 2019 годом.

0

Столбчатая диаграмма построена на основе суммарной годовой посещаемости каждого музея за 2019 год: для каждой институции были просуммированы все месячные значения, а полученные числа использованы как высота столбцов. По оси X отложены названия музеев, по оси Y — количество посетителей за год, что позволяет напрямую сравнить масштаб их аудитории.

Эта диаграмма превращает таблицу с цифрами в простой визуальный рейтинг: сразу видно, что Avila Adobe сильно опережает остальные музеи по числу посетителей, а часть институций находится на значительно более низких уровнях. Такой формат подчёркивает, какие музеи играют ключевую роль в формировании общей культурной аудитории Лос‑Анджелеса, а какие остаются нишевыми.

0

Круговая диаграмма построена на основе уже рассчитанных суммарных значений посещаемости музеев за 2019 год: для каждого музея была подсчитана общая годовая аудитория, после чего выбраны пять самых посещаемых институций, а остальные объединены в категорию «Другие музеи». Эти шесть чисел были переданы в функцию plt.pie вместе с подписями музеев и долей «Другие музеи», что позволило представить структуру аудитории в виде одного наглядного круга.

Можно заметить какой музей забирает на себя большую часть потока, как распределяются посетители между остальными институциями и насколько велика суммарная доля «других» музеев. В моём случае более половины диаграммы занимает сегмент Avila Adobe, что визуально подчёркивает его ведущую роль в музейной аудитории Лос‑Анджелеса по сравнению с другими пространствами.

Вывод

В процессе работы с датасетом о посещаемости музеев Лос‑Анджелеса я построила несколько типов диаграмм, которые показывают динамику культурной аудитории во времени, различия между музеями и масштаб изменений за последние годы. Вместо одного «идеального» портрета я получила многослойную картину, где важны и общие тренды, и особенности отдельных музеев.

Если собрать вместе ключевые наблюдения из графиков, получается следующий образ культурной аудитории: Общая посещаемость музеев заметно меняется во времени: есть доковидный рост, резкий провал в период пандемии и постепенное восстановление в последующие годы. Существует группа крупных музеев, которые стабильно привлекают основную часть аудитории и сильно выделяются на фоне менее посещаемых институций. Структура посещаемости между музеями со временем меняется: одни институции усиливают свою роль, другие остаются на периферии культурной жизни города. Даже при общей положительной динамике восстановления после кризиса разрыв между лидерами и менее популярными музеями сохраняется.

Проект не отвечает на вопрос «как сделать так, чтобы музеи всегда росли по посещаемости», зато помогает увидеть, что у каждого музея своя история, и что даже при общем росте всё равно важно планировать культурную политику и учитывать интересы разных аудиторий.