Original size 1140x1600

Анализ данных по динамике Космических миссий

PROTECT STATUS: not protected

ВЫБОР ТЕМЫ

Я выбрал тему для анализа данных «Вся история космических запусков». Причины: 1. Много данных 2. Легко категоризировать по странам 3. Сразу выводится тема графиков и презентации — Темный фон, яркие цвета, как звезды на ночном небе. 4. Мне просто нравятся звезды и космос.

Данные взяты из сайта Kaggle, по поисковому запросу «Space Missions Launches».

https://www.kaggle.com/datasets/salmane/space-missions-launches

ГРАФИКИ

Я решил взять базовые диаграммы: - Линейная (общая динамика) - Столбчатая (Топ стран) - Круговая (Процент успеха) - Тепловая карта (Интенсивность запусков по странам)

Хочется показать разные графики,

big
Original size 643x450

Я решил сделать сначала общий стиль для всех графиков. У Gemini спросил как настроить стиль: «Подскажи пожалуйста, как лучше всего настроить стиль для графиков pandas на python? Стиль: Космос — темный фон, яркие как звезды цвета, выделяющиеся от фона.»

После чего получил рекомендации к цветам и их HEX коды.

Я попытался честно написать код сам или копируя его из веток обсуждения. Но когда я чтото изменял, все неизбежно ломалось. Пришлось обратиться к Gemini. Отправил весь код, что у меня есть и попросил найти ошибку.

«Помоги мне, пожалуйста, исправь мой код, мне нужно составить графики по различным типам данных: 1. Линейный график для общей динамики запусков 2. Топ 5 стран по количеству миссий 3. Круговой график по % соотношению Успешных миссий 4. Общее количество миссий с начала 21го века»

Получил готовый и рабочий код. Я не стал его менять и потенциально ломать просто потому что «нейросети».

Original size 1015x577

Группировка событий по годам для преобразования отдельных запусков в непрерывный тренд. Можно увидеть следующую динамику:

Первый пик (1960–1980-е): «Космическая гонка» времен Холодной войны. Высокая интенсивность обусловлена государственным соперничеством сверхдержав (СССР и США).

Спад (1990–2010): Период стагнации, связанный с развалом СССР и окончанием Космической гонки.

Второй пик (с 2015 года): Резкий экспоненциальный рост объясняется выходом на рынок частных компаний (SpaceX, Blue Origin) и развитием спутниковых группировок (Starlink).

Original size 1025x534

Подсчет абсолютной моды по категории Country и выделение топ-5 значений. Метод позволяет определить наиболее активные страны в космической программе.

Лидеры: Россия (как правопреемница СССР) и США занимают доминирующее положение, выполнив подавляющее большинство миссий. Их отрыв от остальных участников колоссален, почти в 2 раза.

Догоняющие: Китай уверенно занимает третью позицию.

Original size 636x660

Вычисление долей категорий (Success vs Failure) в общем объеме выборки для определения количества успехов.

Вывод о надежности: Несмотря на сложность технологий, процент успешных миссий (Success) доминирует (выше 80%).

Original size 1047x597

Построение матрицы сопряженности двух переменных (Страна и Год), где значением ячейки является частота событий. Это позволяет увидеть многомерные паттерны, невидимые на обычных графиках.

США: Виден переход от умеренной активности в начале 2000-х к «горячей» фазе в 2020-х (частные компании).

Китай: Наблюдается стабильное увеличение количества запусков с каждым годом, что подтверждает планомерную государственную стратегию экспансии.

Россия: Демонстрирует стабильную активность, но без резких всплесков роста в последние годы по сравнению с конкурентами.

ИТОГ

За время работы над этим проектом, я освоил базовые навыки по работе с данными, узнал об интересных и полезных сайтах с различными базами данных, и научился скачивать их через код.

Также я лучше освоил пользование нейросетей и лучше стал понимать их преимущества и недостатки. С помощью них я эффективнее и быстрее изучаю программирование, потому что могу задать вопрос по тебе напрямую.

Использованные нейросети: Copilot — подсказки при написании кода Gemini — проверка кода, решение ошибок, продумывание системы и плана действий