Nvidia Rubin: новая платформа для ИИ с 88 ядрами, памятью HBM4 и кремниевой фотоникой

На выставке CES 2026 компания Nvidia официально объявила о выпуске Rubin – новой флагманской платформы для искусственного интеллекта. Она заменит Blackwell и предложит значительно повышенную производительность.

Платформа Rubin включает в себя шесть микросхем. В их число входят:

  • GPU Rubin (336 миллиардов транзисторов);
  • CPU Vera (227 миллиардов транзисторов);
  • Шина NVLink 6;
  • Spectrum-X представляет собой технологию Ethernet, основанную на кремниевой фотонике, обеспечивающую пропускную способность 102,4 Тбит/с);
  • Сетевые адаптеры ConnectX-9 (1,6 ТБ/с) и процессоры DPU BlueField-4.

GPU Rubin представляет собой специализированный чип, предназначенный для решения задач искусственного интеллекта и состоящий из двух кристаллов. Его производительность достигает 50 PFLOPS при выполнении этапа вывода модели (инференс) и 35 PFLOPS в процессе обучения (формат NVFP4). Это обеспечивает скорость, в пять раз превышающую показатели Blackwell при инференсе, и в 3,5 раза – при обучении. Для реализации таких вычислительных возможностей каждый GPU Rubin оборудован восемью стеками памяти HBM4, обеспечивающими общий объём в 288 ГБ и пропускную способность до 22 ТБ/с.

Не пропустите:  Разработчик ChatGPT OpenAI достиг оценки в 500 миллиардов долларов

CPU Vera разработан на базе уникальной архитектуры Arm под кодовым названием Olympus. Центральный процессор содержит 88 ядер и поддерживает 176 потоков благодаря технологии Spatial Multi-Threading. Производительность CPU Vera при обработке данных и компрессии вдвое выше, чем у CPU Grace.

В качестве ключевого элемента дата-центров будет использоваться суперчип Вера Рубин, который включает в себя один центральный процессор Вера и два графических процессора Рубин. Стойка NVL72 Вера Рубин обладает общей вычислительной мощностью 3,6 экзафлопса и оборудована 54 ТБ оперативной памяти LPDDR5x и 20,7 ТБ памяти HBM4.

По словам Nvidia, использование Rubin позволит уменьшить затраты на генерацию токенов (инференс) в десять раз, а для обучения сложных моделей потребуется в четыре раза меньше графических процессоров по сравнению с решением на базе Blackwell GB200.

Ожидается, что первые пользователи смогут приобрести Nvidia Rubin к концу 2026 года, а массовое производство этой разработки начнется в первом квартале того же года.

Похожие статьи