Галлюцинации искусственного интеллекта принесли убытки в размере 67 миллиардов долларов. Платформа CTGT разработала метод борьбы с ними.

Компания CTGT, занимающаяся внедрением ИИ в сферы повышенного риска, представила существенное обновление своей платформы. Обновление, появившееся 27 июня, помогает устранять предвзятость, галлюцинации и другие недопустимые артефакты в работе моделей искусственного интеллекта, включая DeepSeek и другие open-source решения.

CTGT представила обновлённую платформу на конференции VentureBeat Transform 2025, прошедшей 24-25 июня в Сан-Франциско. На той же конференции компания стала победителем конкурса VentureBeat Innovation Showcase, опередив шесть других участников.

Тестирование выявило впечатляющие результаты: благодаря CTGT модель DeepSeek отвечает на 96% чувствительных вопросов, тогда как до внедрения платформы этот показатель составлял всего 32%. McKinsey сообщает, что в 2024 году глобальные потери из-за галлюцинаций в ИИ составили $67,4 миллиарда. Deloitte отмечает, что 47% корпоративных пользователей ИИ принимали важные решения на основе ложной информации от моделей. Новая версия ChatGPT 4.5 демонстрирует показатель галлюцинаций в 30%, что ещё хуже, чем у предыдущих версий. DeepSeek R1 имеет показатель галлюцинаций в 14,9%, значительная часть дезинформации в этой модели, вероятно, заложена преднамеренно китайским правительством.

Доверие к моделям ИИ становится критическим фактором в условиях, когда от их работы зависит многое. CTGT, запущенная в феврале с инвестициями в $7 миллионов от Gradient (ранний фонд ИИ Google), General Catalyst, Y Combinator, Liquid 2, Deepwater и ряда известных инвесторов, включая Франсуа Шолле (Google, создатель Keras), Майкла Сейбела (Y Combinator, соучредитель Twitch) и Пола Грэма (Y Combinator), первоначально концентрировалась на снижении вычислительных затрат при обучении и развёртывании моделей ИИ. Компания добилась значительного успеха, уменьшив вычислительные потребности на порядок за счёт исключения необходимости тонкой настройки, проектирования подсказок и обратного распространения ошибки.

Введение DeepSeek R1 привело к большому числу запросов от предприятий о помощи CTGT. Желали воспользоваться преимуществами низкой стоимости и скорости DeepSeek, но беспокоились о предвзятости. В ходе тестирования CTGT смогла выявить и устранить специфические особенности модели, вызывающие предвзятость, что позволило DeepSeek R1 функционировать без искажений. С тех пор аналогичные тесты были проведены на других open-source моделях, включая Llama, доказав способность CTGT выявлять и устранять предвзятость, галлюцинации и другие артефакты за минуты, без трудоёмкой и дорогостоящей тонкой настройки или переобучения. Теперь эта функциональность доступна всем предприятиям, использующим платформу CTGT.

Горлла подчеркнул, что надёжность моделей ИИ – серьёзное препятствие для получения компаниями отдачи от инвестиций в эту технологию. CTGT, имея опыт работы с крупными корпорациями, выпустила коммерческий продукт, доступный широкому кругу пользователей. Платформа CTGT использует инновационный математический метод для автоматического устранения галлюцинаций, цензуры и предвзятости на уровне модели в реальном времени. Компании, применяющие платформу CTGT, фиксируют повышение точности моделей, снижение вычислительных затрат и ускорение внедрения моделей до 500 раз.