Стартап LMArena привлек 150 млн долларов и стал «единорогом» в сфере оценки искусственного интеллекта

Стартап LMArena, изначально разработанный как исследовательский проект в UC Berkeley, сообщил о привлечении 150 миллионов долларов в рамках раунда финансирования серии A при оценке компании в 1,7 миллиарда долларов. Заметно, что лишь семь месяцев назад стартап привлек 100 миллионов долларов на стадии посева при оценке в 600 миллионов долларов. Следовательно, за столь короткий срок общий объем привлеченных инвестиций достиг 250 миллионов долларов.

LMArena завоевала репутацию благодаря краудсорсинговым оценкам эффективности ИИ-моделей. На сайте пользователи предоставляют текстовые запросы, которые передаются двум моделям, после чего выбирают наиболее качественный ответ. Огромный объем данных, полученный от более чем 5 миллионов пользователей ежемесячно из 150 стран и включающий 60 миллионов диалогов, служит основой для формирования рейтингов. Платформа проводит оценку моделей по разнообразным задачам, таким как обработка текста, веб-разработка, работа с изображениями, преобразование текста в изображение и другим параметрам.

В ходе тестирования рассматривались различные версии OpenAI GPT, Google Gemini, Anthropic Claude и Grok, а также специализированные модели, предназначенные для создания изображений, преобразования текстовой информации в визуальный контент или логических выводов.

Не пропустите:  Исследование показало, что полезные бактерии сохраняют жизнеспособность во время космических полетов.

Изначально компания представляла собой Chatbot Arena – открытую исследовательскую платформу, разработанную исследователями из Калифорнийского университета в Беркли, Анастасиосом Ангелопулосом и Вэй-Линь Чангом. На первых этапах ее существования финансирование осуществлялось за счет грантов и добровольных взносов.

Система оценки LMArena приобрела широкую известность среди разработчиков искусственного интеллекта. В апреле появилась статья, в которой конкуренты заявили, что сотрудничество LMArena с компаниями OpenAI, Google и Anthropic дало возможность влиять на итоги тестов. LMArena опровергает эти утверждения.

В сентябре компания начала предоставление платной услуги AI Evaluations, позволяющей предприятиям, лабораториям и разработчикам проводить оценку моделей с использованием краудсорсинга. К декабрю годовой доход LMArena достиг 30 миллионов долларов, всего за четыре месяца после начала работы сервиса.

Похожие статьи