Лидеры отрасли призывают сохранять возможность следить за работой искусственного интеллекта.

Ведущие учёные из DeepMind, OpenAI, Meta*, Anthropic и ряда академических организаций опубликовали статью с предупреждением о том, что прозрачность работы искусственного интеллекта может вскоре утратиться.

В центре внимания — цепочки рассуждений, используемые в современных языковых и мультимодальных моделях. Эти промежуточные шаги ИИ позволяют следить за ходом его мыслей перед выдачей ответа. Особенно важны они при решении сложных задач, где требуется логика, планирование или работа с числами.

Источник изображения: img.freepik.com

Авторы статьи предупреждают: по мере развития возможностей ИИ и усложнения его структур способность отслеживать такие цепочки может уменьшиться. Модели могут начать скрывать внутренние шаги, оптимизируя поведение под внешние показатели.

Учёные призывают срочно закрепить мониторинг цепочек рассуждений как одну из ключевых мер безопасности. Предлагают разработчикам исследовать, какие свойства моделей делают их рассуждения видимыми для человека, как сохранять эту прозрачность при обучении более мощных систем и каким образом можно встроить CoT-мониторинг в процессы тестирования и сертификации.

Статья является редким примером союза соперничающих лидеров в сфере искусственного интеллекта.

В России признали компанию Meta, включающую Facebook и Instagram, экстремистской, и запретили её деятельность.

Техноблог

Лидеры отрасли призывают сохранять возможность следить за работой искусственного интеллекта.

Changan CS55 Plus представили с обновлённым дизайном и мощным бензиновым двигателем

Старт продаж кроссоверов Tenet T4, производство которых организовано на площадке бывшего завода Volkswagen

Tesla выпустила 100 000 электромобилей Model Y на берлинском заводе всего за шесть месяцев

АвтоВАЗ потерял часть прибыли от продаж Lada в 2025 году

Минцифры представило новый комплекс мер для защиты от кибермошенников

Ожидается выход Honor 500 и Honor 500 Pro: что известно о характеристиках

Обновлённый Honda Elysion бросает вызов Toyota Alphard: минивэн получил роскошные кресла и стоит от 2,82 млн рублей

BYD расширяет свой флот судов для международной доставки: восьмое судно получило название BYD Jinan

Предварительные продажи E5 Sportback: Audi представила модель без фирменной решетки

Volkswagen Teramont Pro 2025 стал доступнее на миллион рублей за полгода