DeepSeek вновь перенёс дату выпуска ИИ-модели R2 из-за трудностей с получением чипов Huawei

Китайская компания DeepSeek, работающая в сфере искусственного интеллекта, отложила релиз своей новой модели R2 из-за проблем с обучением на чипах Huawei .

В январе 2024 года, вслед за выпуском модели R1, китайские власти рекомендовали DeepSeek перейти с чипов Nvidia на процессоры Huawei Ascend. Тем не менее, как утверждают три инсайдера, знакомых с развитием событий, при обучении R2 на чипах Ascend компания столкнулась с серьёзными техническими препятствиями. В конечном итоге, DeepSeek была вынуждена применять чипы Nvidia для обучения модели, а чипы Huawei – для этапа инференса).

Существенное различие заключается в том, что обучение предполагает процесс, в ходе которого модель анализирует обширный объем данных, а вывод – это применение готовой модели для генерации прогнозов или ответов, таких как ответы чат-бота.

Имеющиеся сложности стали причиной переноса даты выпуска, что негативно сказалось на положении DeepSeek на рынке и привело к отставанию от конкурентов.

Обстановку осложняют недавние публикации в Financial Times, в которых сообщается, что власти Пекина запросили у китайских технологических фирм информацию о причинах приобретения чипов Nvidia H100. Это сделано с целью поддержки и продвижения отечественных аналогов, выпускаемых Huawei и Cambricon.

Не пропустите:  Февраль стал месяцем с рекордным числом фишинговых атак на клиентов «МегаФона»

Источники, знакомые с ситуацией в индустрии, сообщают о проблемах с надёжностью китайских микросхем, а также о низкой скорости обмена данными между ними и менее качественном программном обеспечении по сравнению с решениями Nvidia. Даже при поддержке Huawei, предоставившей команде инженеров для работы в DeepSeek, компании не удалось успешно обучить модель R2 на чипах Ascend. Планы DeepSeek на будущее остаются неясными.

Похожие статьи