Недавнее соревнование исследовательских групп по обучению ИИ-модели для управления космическим кораблём принесло неожиданные результаты. Эксперимент показал, что эра автономного освоения космоса может начаться раньше, чем предполагалось. В качестве первого теста исследователи дали модели ChatGPT инструкцию: «Ты действуешь как автономный агент, управляющий догоняющим космическим аппаратом». К их удивлению, большая языковая модель (LLM) показала впечатляющие результаты, заняв второе место в конкурсе по автономной симуляции космического полёта.
Желание создавать автономные системы управления спутниками и навигации космических аппаратов давно существует. В будущем количество спутников будет таким огромным, что управление ими вручную станет невозможным. Также дальнее исследование космоса ограничено скоростью света, делая невозможным реальное время прямого управления. Для эффективного освоения космоса роботам необходимо принимать решения самостоятельно.
В сфере аэрокосмической отрасли для продвижения инноваций разработан проект Kerbal Space Program Differential Game Challenge – платформа на основе известной игры Kerbal Space Program. Она предоставляет сообществу возможность разрабатывать, тестировать и экспериментировать с автономными системами в приблизительно реалистичной среде. Соревнование включает несколько сценариев, например, задачу по преследованию и перехвату спутника, а также задачу по уклонению от обнаружения.
Международная группа исследователей в статье для журнала «Advances in Space Research» описала участника: коммерчески доступное ЛLM, похожее на ChatGPT и Llama. Выбор ЛLM обусловлен тем, что традиционные подходы к созданию автономных систем требуют многочисленных циклов обучения, обратной связи и доработки. Задача Kerbal Challenge предполагает максимальную реалистичность.
Благодаря обучению на массивах данных модели LLM обладают большой мощностью. В идеальном случае им нужно лишь небольшое уточнение подсказок и несколько попыток для точного понимания ситуации. Для управления космическим аппаратом исследователи разработали метод преобразования текущего состояния и цели аппарата в текст. Этот текст передавался модели LLM, которая выдавала рекомендации по ориентации и маневрированию. Специальный слой преобразовывал текстовый вывод LLM в функциональный код, управляющий симулируемым аппаратом.
Благодаря подсказкам и доработкам исследователи помогли ChatGPT успешно пройти многие тесты соревнования, заняв второе место. Первое место досталось другой модели.
Успех был достигнут до выхода последней версии ChatGPT – версии 4. Несмотря на это, предстоит ещё много работы, особенно в части предотвращения «галлюцинаций» (нежелательных бессмысленных выводов), которые могут быть опасными в реальности. Но результаты показывают потенциал даже готовых моделей LLM, которые, освоив большой объем человеческих знаний, могут применяться в неожиданных областях.