Original size 1240x1750

Анализ данных о преступности несовершеннолетних в РФ (2009–2022 гг.)

PROTECT STATUS: not protected
The project is taking part in the competition

В качестве обложки проекта о несовершеннолетних преступниках в России была выбран снимок из серии «Разбитые коленки» современного фотографа Ирины Юльевой, которая документирует перформанс взросления.

Обоснование выбора темы

Я решила проанализировать статистику подростковой преступности, потому что мы обычно видим эту проблему фрагментарно — как череду тревожных и эмоциональных новостных сюжетов. Эти отдельные случаи формируют наше восприятие, в то время как общая картина — динамика по годам и реальное распределение по регионам — остается за кадром, ею мало кто интересуется.

А ведь именно в этой статистике скрываются самые полезные закономерности. Понимание не разрозненных «точек», а целостного поля — это основа для того, чтобы осмыслить, что на самом деле происходит с обществом, и чтобы в итоге предлагать по-настоящему эффективные и адресные меры.

Начало работы

В качестве основного источника данных был использован портал правовой статистики с открытыми данными о состоянии преступности, в форматах CSV и XML.

«Выявлено несовершеннолетних лиц, совершивших преступления». Данные охватывают период с 2009 по 2022 год. В анализ включены 87 субъектов, объединенных в 7 федеральных округов.

big
Original size 1758x290

Сперва я импортирую необходимые для работы библиотеки: Pandas, NymPy, Matplotlib, seaborn, ElementTree.

Я использую команду игнорирования предупреждений, которая оставляет только важную информацию — это особенно полезно при отображении графиков.

Подготовка визуальной среды

Далее я устанавливаю визуальную тему для всех будущих графиков, применяя встроенный темный фон matplotlib, и создаю собственную цветовую палитру. В этой палитре определены цвета для фона, текста, сетки и несколько выразительных акцентных оттенков — синий, красный, зеленый, оранжевый и другие, которые будут хорошо контрастировать на темном фоне. Намеренно были выбрали разные и контрастирующие между собой цвета, чтобы они не сливались между собой и не мешали восприятию графиков.

Original size 1758x574

Затем я настраиваю глобальные параметры отображения графиков. Я задаю единые цвета для фона фигур, осей, меток и текста, устанавливаю размер графиков по умолчанию и настраиваю вид сетки — ее цвет и прозрачность. Эти параметры применяются ко всем графикам автоматически для единообразия стиля. Я передаю созданную палитру в библиотеку seaborn, чтобы цветовые схемы в ее диаграммах также соответствовали выбранному темному стилю.

Original size 1752x660

Загрузка и обработка данных

Сначала я открываю XML-файл, нахожу в нём все показатели преступности и для каждого из них собираю построчные данные по регионам. Каждую запись я оформляю как словарь с названием показателя, числовым значением, периодами отчёта и именем региона.

Original size 1754x964

После сбора всех записей я преобразую их в DataFrame, чтобы удобнее работать с данными. Я привожу даты к единому формату, добавляю отдельные столбцы с годом и месяцем для временного анализа. Затем классифицирую регионы на три типа: общие данные по России, данные по федеральным округам и данные по конкретным субъектам Федерации.

Далее я разделяю данные на два набора — только по субъектам и только по федеральным округам, чтобы можно было анализировать их отдельно. В конце я вывожу сводную информацию: подтверждаю успешную загрузку, показываю общее число записей, период охвата данных и количество регионов каждого типа.

Original size 1766x854

Анализ данных

Original size 1287x587

Начну с анализа динамики уровня преступности по годам (с 2009 по 2022). Динамика определяется пиком преступности несовершеннолетних в 2010 году, когда показатель взлетел до 1,42 миллиона случаев — это почти шестикратный скачок за один год.

Линейный анализ чётко указывает на устойчивое снижение случаев рассматриваемой категории преступлений после аномального всплеска. Фактически, после кризисного пика более десяти лет наблюдается спад, хотя к 2022 году уровень так и не вернулся к относительно низким значениям 2009-го.

Original size 1186x687

Преступность несовершеннолетних в России имеет ярко выраженный региональный характер. Проблема сконцентрирована в нескольких регионах Урала и Сибии, где показатели превышают уровень чуть менее проблемных субъектов, таких как республики Северного Кавказа и Чукотский АО (все они входят в десятку регионов, наиболее подверженных преступности несовершеннолетних).

Высокий коэффициент вариации (83%) и значительный разрыв между средним значением и медианой подтверждают сильную дифференциацию между регионами.

Original size 1187x587

На основании данных о соотношении количества случаев преступности к плотности населения в федеральных округах за период с 2018 по 2022 год можно сделать следующий вывод: на протяжении всех пяти лет Сибирский федеральный округ демонстрирует самый высокий уровень относительной преступности среди всех округов, даже с учетом низкой плотности населения. Это подтверждается как ежегодными показателями, так и итоговым средним значением за период, которое превышает аналогичный показатель у идущего следом Приволжского ФО.

При этом наблюдается устойчивая положительная динамика в Сибири: значение показателя последовательно снижалось с 2018 по 2022 год, упав почти вдвое. Однако, несмотря на это значительное снижение, Сибирский ФО продолжает оставаться регионом с наиболее острой относительной интенсивностью преступности.

0

Вывод

Проведённый анализ данных выявил несколько ключевых закономерностей. Наблюдается значительное снижение уровня подростковой преступности в России: после пикового значения в 2010 году к 2022 году показатель сократился более чем вдвое. Распределение данных по регионам крайне неравномерно: топ-5 субъектов (Свердловская, Челябинская, Кемеровская области, Красноярский и Иркутский края) суммарно дают непропорционально высокий вклад, при этом в ряде республик Северного Кавказа значения минимальны. Статистический анализ подтвердил сильную правостороннюю асимметрию данных, что указывает на наличие немногочисленных, но крайне проблемных регионов, и высокую долю статистических выбросов.

Описание применения генеративной модели

Для работы я использовала DeepSeek-V3.2.

Промпты можно просмотреть по ссылке.

Ссылка на нейросеть.