Общая информация о GeForce RTX 5090
Прошло более двух лет с момента выхода видеокарты GeForce RTX 4090, которая по-прежнему очень мощна. Сегодня протестируем новую флагманскую GeForce RTX 5090 — самую быструю модель нового поколения видеокарт на графических процессорах архитектуры Blackwell. Новую линейку Nvidia анонсировали на выставке CES 2025, и именно эта модель является сегодня самым мощным решением. Компания начала выпуск новой серии с флагмана, после чего вышли GeForce RTX 5080, GeForce RTX 5070 Ti и GeForce RTX 5070, которые уже были рассмотрены. Мы максимально подробно описали все возможности новой архитектуры в материале по GeForce RTX 5080, его можно найти по ссылке в врезке.
В новой архитектуре графического процессора внесли множество изменений, не все из которых сразу будут доступны. Помимо усовершенствования исполнительных блоков (CUDA-ядер, RT-ядер и тензорных ядер), модернизирована и технология DLSS: теперь с помощью многокадровой генерации обеспечена еще более высокая частота кадров и улучшенное качество изображения.
Но куда интереснее перспективные методы нейронного рендеринга от компании, предлагающие применение возможностей нейросетей для дорисовки картинки, повышающей качество и производительность. Компания Microsoft уже давно занимается подобными разработками и вот-вот добавит возможность применения нейросетей в шейдерах DirectX. Это должно стать толчком к началу их использования в играх и другом программном обеспечении.
Графическая архитектура Blackwell внесла улучшения в ключевые компоненты GPU: CUDA-ядра оптимизированы для эффективного функционирования нейронных шейдеров, RT-ядра способны обрабатывать больше пересечений лучей и примитивов, а также оптимизированы для мегагеометрии. Тензорные ядра ускорены для задач искусственного интеллекта с использованием FP4 и INT4, управляющий блок улучшен для нейрорендеринга и других функций. Также были усовершенствованы видеокодеры и декодеры. Blackwell — первые графические процессоры с поддержкой PCI-Express 5.0 и GDDR7 памяти, что увеличило скорость передачи данных.
Несмотря на то, что GeForce RTX 5090 вышел на рынок давно, производство новинки до сих пор не может обеспечить достаточных объёмов. Ограниченные поставки в магазины ведут к очень высоким ценам на всю линейку, особенно на топовое решение. Проблемы с доступностью и ценообразованием наблюдаются практически для всех новых GPU разных производителей: Intel Arc B580 недоступна по рекомендованной цене в $249, а вся линейка GeForce RTX 50, да и Radeon RX 9070 (XT), страдает от этих же проблем. Если в 2021 году дефицит видеокарт объяснялся майнингом криптовалют на GPU, то сейчас причина другая — развитие искусственного интеллекта, который забрал часть производственных мощностей под свои нужды, а мощные игровые GPU также покупаются для ИИ-нагрузок. У Nvidia большая часть рекордных прибылей приходится на решения для центров обработки данных и ИИ, а игровые видеокарты… пусть тоже будут, но могут подождать.
Современные производственные процессы обладают ограниченным объемом выпуска и пользуются спросом у множества компаний, занимающихся выпуском чипов, но не имеющих собственных заводов.
Производственные мощности TSMC заняты Apple, Nvidia, AMD, Qualcomm и другими компаниями, производящими процессоры различного назначения. Если у Nvidia есть определенная квота на производство, то ей выгоднее тратить ее на выпуск продукции для вычислительных задач, а не графических процессоров для игровых ПК.
То же самое касается GB202, на котором основана GeForce RTX 5090. Его можно применять и в вычислительных задачах, и в игровых ПК. Небольшие компании в сфере ИИ покупают игровые видеокарты и используют их в неграфических целях, что ухудшает положение на рынке игровых видеокарт.
Цены на вторичном рынке все еще выше рекомендованных для большинства GPU. В ближайшие несколько месяцев ситуация не меняется: индустрия ИИ развивается стремительно, а производство более дорогих процессоров для центров обработки данных является важным делом для многих компаний.
Цен на топовую новинку (относительно) не радуют — она раза в полтора, а то и два выше рекомендуемой, да и найти GeForce RTX 5090 в продаже непросто. Но рассмотрим флагманскую видеокарту для высоких разрешений и максимальных графических настроек, включая сложную трассировку лучей. Игровая производительность GeForce RTX 5090 максимальна, она справится с любыми современными играми в 4K при самых высоких настройках с трассировкой лучей. DLSS 4 обеспечивает дополнительное улучшение плавности и комфорта, что позволяет использовать и 8K-мониторы. GeForce RTX 5090 — это первая потребительская игровая видеокарта для настольных ПК с 32 ГБ быстрой GDDR7-памяти с высокой пропускной способностью порядка 1,8 ТБ/с, что полезно в играх, редактировании видеоданных, разработке приложений искусственного интеллекта и в сложном рендеринге.
Архитектура графической обработки Blackwell не сильно отличается от предшествующей Ada Lovelace. Ada Lovelace в свою очередь во многом напоминает архитектуру Ampere, и все три имеют много общего. Для лучшего понимания материала рекомендуется ознакомиться с нашими предыдущими публикациями по теме.
- [03.02.25] Обзор видеоускорителя Nvidia GeForce RTX 5080 (16 ГБ)
- [26.10.22] Обзор видеоускорителя Nvidia GeForce RTX 4090 (24 ГБ)
- [10.10.22] Обзор видеокарт Nvidia GeForce RTX 4090 и GeForce RTX 4080.
Графический ускоритель GeForce RTX 5090 | |
---|---|
Кодовое имя чипа | GB202 |
Технология производства | 5 нм (TSMC 4N) |
Количество транзисторов | 92,2 млрд |
Площадь ядра | 750 мм² |
Архитектура | Унифицированная система с большим числом процессоров, предназначенных для обработки любых типов данных: вершин, пикселей и других. |
Аппаратная поддержка DirectX | ДиректХ 12 Ультиматив, поддерживающий уровень возможностей Feature Level 12_2. |
Шина памяти | Процессор содержит 16 отдельных 32-битных контроллеров памяти, работающих с памятью стандарта GDDR7. |
Частота графического процессора | до 2407 МГц |
Вычислительные блоки | Из 192 потоковых мультипроцессоров функционируют 170, включая 21760 из 24756 CUDA-ядер для расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64. |
Тензорные блоки | 680 из 768 тензорных ядер предназначены для матричных вычислений с типами данных INT4, INT8, FP4, FP8, FP16, FP32, BF16 и TF32. |
Блоки трассировки лучей | 170 из 192 ядра RT использованы для расчёта пересечений лучей с треугольниками и ограничивающими объёмами BVH. |
Блоки текстурирования | 680 блоков текстурной адресации и фильтрации, поддерживающих компоненты FP16/FP32, а также трилинейную и анизотропную фильтрацию для всех форматов текстур. |
Блоки растровых операций (ROP) | Двадцать два из двадцати четырёх широких блока ROP имеют размер 176 (из 192) пикселей и поддерживают различные режимы сглаживания, в том числе программируемые, а также форматы буфера кадра FP16/FP32. |
Поддержка мониторов | HDMI 2.1b и DisplayPort 2.1b |
Спецификации видеокарты GeForce RTX 5090 | |
---|---|
Частота ядра | 2017/2407 МГц |
Количество универсальных процессоров | 21760 |
Количество текстурных блоков | 680 |
Количество блоков блендинга | 176 |
Эффективная частота памяти | 28 ГГц |
Тип памяти | GDDR7 |
Шина памяти | 512 бит |
Объем памяти | 32 ГБ |
Пропускная способность памяти | 1792 ГБ/с |
Вычислительная производительность (FP32) | до 104,8 терафлопс |
Теоретическая максимальная скорость закраски | 424 гигапикселей/с |
Теоретическая скорость выборки текстур | 1637 гигатекселей/с |
Шина | PCI Express 5.0 x16 |
Разъемы | по выбору производителя |
Энергопотребление | до 575 Вт |
Дополнительное питание | один 16-контактный разъем |
Количество слотов в системном корпусе. | по выбору производителя |
Рекомендуемая цена | $1999 |
Название флагмана соответствует давно принятому принципу наименования решений компании — GeForce RTX 5090 является последователем GeForce RTX 4090 и получила своё наименование как вершина нового поколения. Выше неё в линейке ничего нет, а снизу — заметно более медленная GeForce RTX 5080. В модели графический процессор GB202 вдвое больше следующего за ним GB203, на котором основаны GeForce RTX 5080 и GeForce RTX 5070 Ti. Причем в GeForce RTX 5090 используется даже не полная версия чипа, многие исполнительные блоки в этой версии GPU отключены, что оставляет запас для GeForce RTX 5090 Ti/Super/Titan. Правда, рыночной необходимости в этом не видно, как не было её в случае GeForce RTX 4090.
Nvidia установила рекомендованную цену на GeForce RTX 5090 на уровне $1999, что заметно больше, чем $1599 для GeForce RTX 4090. Высокий спрос на GeForce RTX 4090, которая до сих пор продается дороже MSRP, привел к решению заработать на последователе еще чуть больше — ругать за это странно, так работает любая коммерческая компания. Высокий спрос на GPU такого уровня можно отнести и на счет тех, кто покупает эти решения для использования в ИИ и других вычислениях — всё это относится и к GeForce RTX 5090. Дела на рынке сейчас может и не столь плохи, как в расцвет криптомайнинга времен GeForce RTX 30, но реальные цены GeForce RTX 5090 на Западе приближаются к двукратным, относительно рекомендованных $2000.
Флагманские видеокарты компании всегда трудно приобрести в первые месяцы по доступной цене, ситуация ухудшается. Причина – спрос выше предложения, GeForce RTX 5090 не имеет конкурентов. Предложения от AMD и Intel уступают ей уровнем качества и соответствуют, максимум, GeForce RTX 5070 или GeForce RTX 4080. Благодаря ИИ-возможностям нового формата вычислений FP4, GeForce RTX 5090 может быть в три раза быстрее GeForce RTX 4090 при работе с нейросетями, став лучшей на рынке до выхода GeForce RTX 6090 или хотя бы GeForce RTX 5090 Ti/Super/Titan. Отсутствие конкурентов позволяет Nvidia устанавливать любую цену на GeForce RTX 5090. Если видеокарты мгновенно раскупаются даже по завышенным ценам, то такой подход оправдан с коммерческой точки зрения. Понять пользователей, желающих купить лучший игровой GPU дешевле, можно, но именно так функционирует рынок.
Объем видеопамяти GeForce RTX 5090 составил 32 ГБ. Такое решение логично, так как 16 ГБ устанавливают на менее мощные модели, а 64 ГБ для игровых карт избыточен, хотя профессиональные решения с таким объемом уже появились. В играх памяти в 32 ГБ хватит на несколько лет при любых настройках качества. Профессиональным нагрузкам и приложениям искусственного интеллекта не хватает никакого объема — именно им полезна возможность запуска более крупных моделей. К сожалению, немалый объем памяти GeForce RTX 5090 означает, что покупающие решения для ИИ будут отбирать видеокарты у игроков. Если раньше это были майнеры, то теперь нейросетевики.
Компания Nvidia выпустила GeForce RTX 5090 Founders Edition. Видеокарта такого же размера, как GeForce RTX 4090 FE, но в полтора раза тоньше. Благодаря новому принципу системы охлаждения энергопотребление и тепловыделение увеличились. Видеокарта имеет аккуратный «промышленный» дизайн и металлическую конструкцию в строгой цветовой гамме с чуть более сглаженными углами. GeForce RTX 5090 FE оснащена белой статичной светодиодной подсветкой логотипа GeForce RTX и деталей вокруг воздухозаборников с обеих сторон.
Переработанный дизайн системы охлаждения позволил уменьшить толщину GeForce RTX 5090 FE с трех до двух слотов, несмотря на увеличение максимального потребления энергии с 450 Вт до 575 Вт. В системе Double Flow Through воздушные потоки проходят через радиаторы насквозь. Охлаждение осуществляется испарительной камерой и пятью тепловыми трубками, отводящими тепло от GPU к радиатору. Впервые в GeForce RTX 5090 FE использован жидкий металл для передачи тепла. При максимальной нагрузке GPU нагревается до 80°C, что не является высоким показателем для такого уровня мощности. Шумовой уровень вентиляторов при этом выше, чем у топовых Founders Edition предыдущих поколений. Nvidia приняла компромиссное решение, создав двухслотовую видеокарту с потреблением под 600 Вт. При этом в режиме без 3D-нагрузки видеокарта работает бесшумно благодаря остановке вентиляторов.
GeForce RTX 5090 FE имеет ограничения мощности в 575 Вт, которые можно увеличить до 600 Вт. Даже в базовой конфигурации это на 125 Вт больше, чем у GeForce RTX 4090. По энергоэффективности новинка приближена к GeForce RTX 4090, что неудивительно, так как для производства графического процессора используется тот же техпроцесс. Новая модель имеет 32 ГБ очень быстрой GDDR7-памяти, которая влияет на потребление энергии. Для дополнительного питания карты используется один 16-контактный разъем, позволяющий потреблять до 600 Вт (плюс 75 Вт по слоту PCIe), но максимальное энергопотребление решения по умолчанию ограничено на уровне 575 Вт.
Комплект Founders Edition включает переходник с восьмиконтактных разъемов на шестнадцатиконтактный — более новую модификацию, изготовленную качественнее с мягкими кабелями и высококачественными разъемами. Шестнадцатиконтактный разъем на карте, расположенный под углом, упростит использование в различных корпусах. Для подключения дисплеев доступны три стандартных разъема DisplayPort 2.1b и один HDMI 2.1b.
Пользователю предлагается выбор: FE подойдет, если размер видеокарты важен, но для тихой системы охлаждения лучше выбрать трех-четырехслотовые карты партнеров. Партнеры Nvidia выпустили множество GeForce RTX 5090 собственного дизайна, включая разогнанные с разными системами питания и охлаждения. Модели с обновленным графическим процессором доступны в разных модификациях от Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и других компаний.
Особенности графического процессора GB202
Серия видеокарт GeForce RTX 50 использует графические процессоры GB20x, созданные по новой архитектуре Blackwell. Модель GeForce RTX 5090 построена на базе флагманского графического процессора GB202, который демонстрирует все возможности и особенности серии, являясь одним из самых сложных и крупных игровых GPU. GB202 – решение от Nvidia, предназначенное для максимальной производительности в сегменте ультра-энтузиастов графики, создания контента и искусственного интеллекта.
Применяемый при производстве на TSMC техпроцесс является уже вторым специализированным вариантом 5-нанометрового EUV-техпроцесса, разработанного тайваньской компанией вместе с Nvidia, и он не слишком отличается от предыдущего по плотности и другим характеристикам чипов этого и предыдущего поколения. Apple и Intel применяют кристаллы, выполненные по 3-нанометровому техпроцессу на той же TSMC, но у них всё же не такие большие и сложные чипы, да и тактовая частота ниже. Повторное использование практически такого же техпроцесса, что и ранее, сказалось на линейке видеокарт GeForce RTX 50 и насколько она отличается от предыдущей — остальные решения семейства получили скромные приросты по отношению к своим предшественникам, а флагманский чип усложнили несколько больше, сделав больший шаг по производительности.
Площадь кристалла GB202 составляет 750 мм² (по замерам независимых источников даже чуть больше — порядка 760 мм²), что почти на четверть превышает площадь AD102 с его 609 мм² (по другим данным — 616 мм²). GB202 не является самым большим кристаллом Nvidia вообще. Вычислительные GH100 и GV100 (Titan V) имеют площади 814 мм² и 815 мм², а TU102, на котором была основана GeForce RTX 2080 Ti, — площадь 754 мм² (по данным Nvidia, сторонние источники дают большее значение). В любом случае, это очень много и, вероятно, уже близко к пределу для массовых кристаллов.
Исследователь Kurnal опубликовал снимок и схему кристалла GB202 на X.com. Схема демонстрирует расположение компонентов графического процессора: GPC, контроллеров памяти, L2-кэша и т. д., в сравнении с AD102 из GeForce RTX 4090. Новый топовый GPU имеет такое же количество кластеров GPC, как у AD102, но больше потоковых мультипроцессоров SM, объем кэш-памяти (в полном чипе) и 32-битных контроллеров памяти с поддержкой GDDR7. По площади и количеству транзисторов новый топовый GPU превосходит GB203 примерно вдвое, а по количеству основных исполнительных блоков разница еще больше.
Высокоуровневая структура графических процессоров Nvidia не меняется с Ampere. Как и другие графические процессоры компании, чип GB202 состоит из больших кластеров Graphics Processing Cluster (GPC), содержащих несколько кластеров текстурной обработки Texture Processing Cluster (TPC). В TPC находятся потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Каждому GPC принадлежит свой движок растеризации Raster Engine, а также несколько кластеров TPC, состоящих из вдвое большего количества мультипроцессоров SM. Рассмотрим схему графического процессора в упрощенной версии:
Видеокарта GeForce RTX 5090 основана на урезанной версии графического процессора GB202. В модели отключено одно звено GPC, а в трёх других – по одному кластеру TPC. В результате активны 11 кластеров GPC и 85 кластеров TPC, состоящих из 170 мультипроцессоров SM. Видеокарта оснащена 21760 CUDA-ядрами, 170 RT-ядрами, 680 тензорными ядрами, 680 текстурными блоками TMU и 176 блоками ROP. Объем L2-кэша сокращен с 128 МБ до 96 МБ. Подсистема памяти полного варианта GB202 включает L1-кэш объемом в 24576 КБ, регистровый файл объемом 49152 КБ и L2-кэш объемом 128 МБ.
GeForce RTX 5090 имеет базовую тактовую частоту 2017 МГц и турбо-частоту до 2407 МГц. В реальности эти показатели могут быть выше, чем у предшественницы — во время игры типичная частота GPU находится в диапазоне от 2,5 ГГц до 2,8 ГГц. Память в модели GB202 осталась неизменной: шестнадцать 32-битных контроллеров памяти обеспечивают общую шину в 512 бит. Благодаря GDDR7-памяти с эффективной скоростью 28 ГГц пропускная способность новинки достигла рекордных для игровых решений 1,8 ТБ/с.
О новой видеопамяти GDDR7 рассказываем подробнее… обзоре GeForce RTX 5080В новой архитектуре все 128 ядер CUDA на SM могут выполнять операции FP32 и INT32 параллельно. Тензорные ядра получили возможность использования нового формата данных FP4 для повышения производительности с допустимой потерей точности. RT-ядра четвертого поколения включают больше аппаратных блоков для ускорения функций трассировки, включая Mega Geometry. Эта концепция повышает геометрическую сложность объектов 3D-сцены при трассировке лучей за счет использования иерархии в структурах BVH. RT-ядра четвертого поколения созданы для эффективной работы Mega Geometry с помощью специальных кластерных движков для новых схем обработки ускоряющих структур.
Мультипроцессор в архитектуре Blackwell дополнительно оптимизирован для эффективного применения нейронных шейдеров помимо стандартных. Новая архитектура принесла возможности нейрорендеринга Neural Rendering, перспективные технологии в 3D-графике, позволяющие использовать генеративные нейросети в сценах с растеризацией и трассировкой лучей. Nvidia предлагает потенциально большее использование возможностей ИИ в процессе рендеринга, хотя на сегодня раскрыты лишь в процессе работы технологий масштабирования DLSS. Новые возможности расширяют сравнительно простую реконструкцию деталей при масштабировании, а также генерации дополнительных кадров. Для успешной работы нейрорендеринга в Blackwell внедрили новый аппаратный планировщик ИИ — AI Management Processor (AMP), который более эффективно занимается распределением задач ИИ и рендеринга по блокам графического процессора.
Упомянем в очередной раз и об улучшениях DLSS 4 В новом поколении Blackwell искусственный интеллект способен создать от одного до трёх дополнительных изображений с помощью данной технологии. Multi Frame Generation (MFG)Процесс генерации кадров ускорился, стал более эффективным в плане использования видеопамяти и позволяет достичь значительно большей частоты кадров. Представлены новые модели ИИ на базе трансформера, которые заменяют предыдущие модели генеративных нейросетей при увеличении разрешения и реконструкции лучей при трассировке, обеспечивая заметно лучшее качество изображения с незначительным снижением производительности. Такими возможностями также могут воспользоваться решения старых серий GeForce RTX 40 и GeForce RTX 30.
Технология DLSS от Nvidia – одно из главных преимуществ компании. Она повышает частоту кадров при игре без увеличения задержки. При базовой частоте в 40-50 FPS технология обеспечивает более плавную игру на мониторах с высокой частотой обновления. Качество изображения нормальное, незначительные артефакты незаметны в процессе игры. Важно иметь хотя бы 40-50 FPS без учета генерации кадров, только тогда дополнительные кадры улучшат комфорт. Опция полезна, но сильно зависит от производительности и монитора игрока.
Технологии повышения производительности, такие как DLSS, FSR и XeSS, обеспечивают высокое качество изображения в качественном режиме без заметных ухудшений, а иногда даже улучшают его. Технологии генерации дополнительных кадров повышают плавность видеоизображения без потерь качества. Nvidia лидирует в этой области, но другие компании, такие как Intel и AMD, тоже внедряют технологии искусственного интеллекта для масштабирования и генерации кадров. Некоторые предпочитают «честную картинку», но если разницы между отрендеренными пикселями и сгенерированными при помощи ИИ нет, то зачем переплачивать? Технологии нейронного рендеринга продолжат развиваться.
В контроллере вывода на дисплеи и медиадвижках GeForce RTX 50 произошли важные изменения. Для вывода изображения графические процессоры Blackwell получили поддержку разъемов DisplayPort 2.1b, обеспечивающих пропускную способность до 80 Гбит/с в режиме передачи UHBR 20. Это позволяет использовать дисплеи с высокими разрешением и частотой обновления: 8K при 165 Гц с DSC и 4K при 480 Гц с DSC. В новых видеокартах семейства GeForce RTX 50 добавлена поддержка кодирования и декодирования видео с цветовой субдискретизацией 4:2:2 для форматов H.264 и H.265.
Возможности обработки видеоданных у всех графических процессоров серии Blackwell одинаковы, но производительность кодирования и декодирования видео различается. В полной версии топового графического процессора GB202 установлено по четыре кодера и декодера видеоданных, в то время как в версии для GeForce RTX 5090 активны три кодера и два декодера. Несмотря на это, производительность при работе с видеоданными формата H.264 по сравнению с топовым решением линейки GeForce RTX 40 заметно возросла благодаря улучшенным блокам. Также появился новый режим AV1 Ultra High Quality (UHQ) — более требовательный, но обеспечивающий повышение качества изображения.
Предварительная оценка производительности
Рассмотрим теоретические характеристики видеокарт серии GeForce RTX 50, работающих на трех объявленных графических процессорах семейства GB20x, чтобы увидеть их отличия.
RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 | |
---|---|---|---|---|
Графический процессор | GB202 | GB203 | GB203 | GB205 |
Транзисторов, млрд. | 92,2 | 45,6 | 45,6 | 31,1 |
Площадь чипа, мм² | 750 | 378 | 378 | 263 |
Количество ядер CUDA | 21760 | 10752 | 8960 | 6144 |
Количество блоков TMU | 680 | 336 | 280 | 192 |
Количество блоков ROP | 176 | 112 | 96 | 80 |
Количество RT-ядер | 170 | 84 | 70 | 48 |
Тензорные ядра | 680 | 336 | 280 | 192 |
Турбо-частота, ГГц | 2,41 | 2,62 | 2,45 | 2,51 |
Объем памяти, ГБ | 32 | 16 | 16 | 12 |
Шина памяти, бит | 512 | 256 | 256 | 192 |
Пропускная способность, ГБ/с | 1792 | 960 | 896 | 672 |
Энергопотребление, Вт | 575 | 360 | 300 | 250 |
Цена, $ | 1999 | 999 | 749 | 549 |
Чип GB202, лежащий в основе видеокарты GeForce RTX 5090, установил рекорд по сложности среди игровых GPU — 92,2 млрд транзисторов, приближаясь к GB100, специализированному вычислительному чипу той же архитектуры Blackwell, состоящему из 104 млрд транзисторов. Площадь кристалла GB202 в 750 мм² незначительно уступает площади чипа TU102 архитектуры Turing (754 мм²), как мы уже сообщали ранее, поэтому флагман линейки получился весьма мощным. Решение включает 24576 CUDA-ядер в полной версии чипа (и 21760 в игровой, которую рассматриваем), остальные характеристики GPU также впечатляют — 512-битный интерфейс памяти в сочетании с GDDR7-памятью обеспечивает высокую пропускную способность в 1792 ГБ/с, что почти вдвое выше показателя GeForce RTX 5080.
Если Ada Lovelace позволила повысить вычислительную мощь более чем на 70%, то GB202 превосходит прямого предшественника лишь на треть. Новый топовый видеоадаптер явно ограничен возможностями того же техпроцесса. Nvidia разместила несколько больше ALU и других блоков, но плотность (количество транзисторов на площадь кристалла) осталась прежней, что не позволило сделать еще более впечатляющий шаг вперед. В отличие от GeForce RTX 5080 и младших решений нового семейства, именно топовая видеокарта должна сильнее превзойти аналогичный графический процессор этого же уровня из предыдущего поколения.
GeForce RTX 5090 оснащен на треть больше потоковых мультипроцессоров SM, чем GeForce RTX 4090 и почти вдвое больше, чем GeForce RTX 3090. Увеличение характеристик обусловлено также увеличением объема видеопамяти на 33%, а также более производительной GDDR7-памятью на треть, подключенной по шине, шире, чем у GeForce RTX 4090. Это обеспечило рост пропускной способности памяти на 78%, что важно для многих игровых и неграфических задач. Теоретическая производительность GeForce RTX 5090 по сравнению с GeForce RTX 4090 составляет порядка 27%. Однако, учитывая 32 ГБ GDDR7-памяти, работающей на скорости 28 Гбит/с при 512-битной шине в первом случае, впечатляющий прирост ПСП может привести к большему различию в скорости в случаях, когда она упирается в возможности памяти.
Из-за одинакового техпроцесса у графических процессоров серий GeForce RTX 50 и GeForce RTX 40 для повышения производительности GeForce RTX 5090 по сравнению с GeForce RTX 4090 пришлось увеличить энергопотребление до впечатляющих 575 Вт. Изменения делают новую модель не просто улучшенной версией GeForce RTX 4090, а значительно отличающейся от предшественника из линейки Blackwell. В этом поколении разрыв между GeForce RTX 5080 и GeForce RTX 5090 еще больше: у флагмана характеристики в два или почти два раза лучше, включая объем памяти с ПСП. Цена тоже отличается ровно вдвое.
Nvidia заявляет о преимуществе новой модели над GeForce RTX 4090 более чем вдвое, но при внимательном рассмотрении диаграммы видно, что этот прирост производительности почти всегда учитывает многокадровую генерацию DLSS. Хотя она действительно увеличивает частоту кадров, сравнивать таким образом не совсем корректно. Компания привела пару игр и ПО без учета DLSS 4 и ускоренных вычислений FP4 тензорными ядрами. GeForce RTX 5090 предназначена исключительно для разрешений 4K и выше (8K во многих случаях наконец-то становится играбельным не номинально), никто не будет тестировать новинку в меньшем разрешении.
Благодаря отсутствию многокадровой генерации, в играх GeForce RTX 5090 превосходит GeForce RTX 4090 на среднем уровне примерно 30%-32%, превышая ускорение других решений новой линейки по отношению к предшественникам. Однако энергопотребление по сравнению с моделью предыдущего поколения также выросло на 35%. Хотя прирост при переходе от GeForce RTX 3090 Ti (даже не GeForce RTX 3090) к GeForce RTX 4090 составлял около 50%, это может смутить покупателей, но ситуацию с производством полупроводников мы неоднократно разъясняли — при одинаковом техпроцессе иначе быть не может. Разница между GeForce RTX 4090 и GeForce RTX 3090 по производительности была более существенной, так как способствовала смена техпроцесса Samsung на более совершенное производство TSMC. Сейчас же скачка в технологических возможностях полупроводников не было, поэтому пришлось повышать показатели другими методами.
Неизменным остаётся положение дел и при включении трассировки лучей — усовершенствованные RT-ядра пока не обеспечивают ускорения в существующих играх. Нейронный рендеринг в них пока не применяется, хотя это одно из главных отличий Blackwell.
Он проявит себя в будущем с появлением игр и движков, оптимизированных для этих технологий.
Многие решения новой архитектуры требуют программной поддержки — внедрения новых возможностей в графические API и игровые проекты.
Если использовать архитектурные нововведения Blackwell в блоках аппаратного ускорения трассировки лучей, типа мегагеометрии для игр на движке Unreal Engine 5, то при включении трассировки эти игры будут работать на GeForce RTX 50 быстрее, чем на GeForce RTX 40.
Пока мегагеометрия применена только в Alan Wake 2, где используется сравнительно простой рендеринг без усложнённой иерархии уровней детализации для кластеров и их перестроения в каждый кадр, как делается в движке UE5, поэтому прирост там не слишком большой. Но это изменится в будущем и будет недостаточно быстро без мегагеометрии.
На мероприятии GDC 2025 для разработчиков игр было несколько анонсов на тему использования мегагеометрии и нейрорендеринга в играх — будем надеяться, что они не заставят себя долго ждать и появятся в выходящих проектах.
Новая модель не имеет конкурентов на рынке, даже в чистой растеризации она примерно на 75% быстрее предыдущего флагмана от AMD — Radeon RX 7900 XTX. Поскольку AMD отказалась от создания сверхмощных решений, то их новый Radeon RX 9070 XT даже с оптимизированной трассировкой не сможет сравниться с GeForce RTX 5090, которая останется заметно быстрее любой видеокарты AMD. GeForce RTX 5090 установила новый максимум производительности по всем показателям. AMD отказалась от борьбы в этом ценовом диапазоне, их решения медленнее (и дешевле), но в этом сегменте у них просто ничего нет, да и функционально они слабее. Впрочем, далеко не все нуждаются в решениях с такой мощностью и ценой — тем более, что за $2000 эту видеокарту не купить, а хорошо если уложиться в $3000. Критиковать можно сколько угодно, но Nvidia всё равно продаёт всё, что может произвести, так как GeForce RTX 5090 — просто самая быстрая видеокарта, у неё нет соперников.
GeForce RTX 5090 дороже предшественницы примерно на $400 и такой же разницей отличается в скорости, но игра производительность зависит от разрешения и настроек. Для дисплеев 1440p и 1080p такой мощности нет смысла, скорость будет упираться в процессор. Для GeForce RTX 5090 нужен монитор с разрешением не менее 4K. Если нужна самая быстрая видеокарта, то это GeForce RTX 5090. Она подходит для игр и ИИ-нагрузок, а также обладает функциями многокадровой генерации и технологиями будущего, такими как мегагеометрия и нейрорендеринг. В существующих играх GeForce RTX 5090 обеспечит идеально плавную игру в разрешении 4K при любых настройках графики. Для тех, кто не хочет или не может позволить столько денег за видеокарты, есть GeForce RTX 5080, GeForce RTX 5070 Ti и GeForce RTX 5070 — выбирайте на свой кошелёк, но с учетом того, что рекомендуемые цены сейчас не выдерживаются ни для одной из них. Это же относится и к недавно выпущенным решениям AMD.
Особенности видеокарты Palit GeForce RTX 5090 GameRock с объемом памяти 32 ГБ.
Сведения о производителеКомпания Palit Microsystems (торговая марка Palit) была основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира находится в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики располагаются в Китае. На рынке России компания присутствует с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты стали поступать только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после фактического банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, ориентированный на продажи в Китае. На сегодняшний день внутри Palit Group сосредоточено несколько торговых марок и брендов. .
Объект исследованияСерийно выпускаемая видеокарта Palit GeForce RTX 5090 GameRock объемом памяти 32 ГБ с шиной 512 бит и памятью GDDR7.
BIOS S: 2407(Boost)—2902(Max)
Память
Карта оснащена 32 гигабайтами памяти GDDR7 SDRAM, распределёнными по 16 микросхемам по 16 гигабитов на фронтальной стороне печатной платы. K4VAF325ZC-SC28Оптимизированы для работы на частоте 2333 МГц (эффективная ПСП 28 ГТ/с, или 28 Гбит/с). Для расчета эффективной ПСП GDDR6X физическую частоту умножали на 16, в то время как для GDDR7 — на 12. GDDR6X применяла кодирование PAM4 (4 Pulse Amplitude Modulation), работавшую совместно с двойной передачей сигнала (DDR) и двумя каналами, что давало множитель 16. GDDR6 использует модуляцию PAM2, поэтому финальный множитель физической частоты для получения эффективной ПСП — 8. Для GDDR7 разработчики из Samsung применяют PAM3, поэтому финальный множитель — 12, а физическая частота работы таких микросхем существенно выше, чем у предшественников.
Характеристики карты и сравнение с Palit GeForce RTX 4090 GameRock (24 ГБ).
В сравнении с флагманом прошлого поколения GeForce RTX 4090 различия между новинкой и ним очевидны. Отличия касаются прежде всего графических ядер (особенно их упаковки), поскольку у чипов огромная разница в шинах обмена с памятью. Изменилась система питания, а печатная плата GeForce RTX 5090 стала сложнее (связанно это с использованием 512-битной шины памяти и большим количеством микросхем памяти по сравнению с GeForce RTX 4090).
Ядро было изготовлено на третьей неделе 2025 года по технологическому процессу TSMC 4N, что соответствует примерно 5 нм. Маркировка — GB202-300, где -300 указывает на урезанный набор блоков GPU (-400 обычно означает полнофункциональный чип). Вряд ли будет выпущена GeForce RTX 5090 Ti для потребителей, но полновесный GB202 может быть полезен для полупрофессиональных задач.
Карта Palit GeForce RTX 5090 GameRock имеет суммарно 29 фаз питания (22 + 7).
Схема питания ядра (22 фазы) обозначена зеленым цветом, а память (7 фаз) — красным.
Карта оснащена двумя контроллерами Monolithic Power Systems, работающими по протоколу ШИМ.
- MP29816 предназначен для управления до шестнадцати фазами и размещается на лицевой стороне печатной платы. Информация от производителя отсутствует.
- Модель MP2988 с маркировкой от производителя предназначена для управления тремя фазами и установлена на обратной стороне платы.
Питание ядра функционирует по параллельной схеме. Контроллер MP29816 управляет четырьмя фазами питания микросхем памяти, добавляя к 11 фазам (по 2 на ядро) ещё четыре, итого получаем 15 фаз. Второй контроллер MP2988 управляет оставшимися тремя фазами питания микросхем памяти.
В преобразователях питания ядра и микросхем памяти применяются транзисторные сборки DrMOS MP87993 от компании MPS, способные выдержать ток до 90 ампер.
На обратной стороне платы управления расположен контроллер uPI Semi, предназначенный для отслеживания напряжений и температур.
В видеокартах Palit управление подсветкой выполняет контроллер Holtek.
Карта функционирует в двух режимах, запрограммированных двумя вариантами BIOS. Переключение осуществляется с помощью переключателя на переднем торце карты (на обратной стороне текстолита). P (performance / производительный, он же 1) и S (silent / тихий, он же 2)Режимы отличаются только скоростью вращения вентиляторов, при этом разницу можно назвать незначительной. Ограничение энергопотребления одинаковое для обоих режимов — 575 Вт.
Базовые частоты памяти и Boost-значение для работы ядра в обоих режимах BIOS 1 (P) / BIOS 2 (S) совпадают с рекомендованными значениями. Максимальная частота GPU у Palit немного выше референсной, но это никак не сказывается на производительности. Исследования показали, что карта Palit демонстрирует такую же производительность в играх, как и референсная модель.
В тесте потребление энергии видеокарты Palit достигало… 577 Вт (в обоих режимах BIOS P/S).
Из-за ограничения потребления ускорение вручную не тестировали.
Питание карты Palit поступает через 16-контактный разъем питания, соответствующий стандарту PCIe 5.0.
Комплект поставки карт включает переходник на разъём с четырьмя стандартными 8-контактными (PCIe 2.0) входами.
Карта имеет впечатляющие размеры, особенно по высоте – более 7 сантиметров. Из-за этого видеокарта занимает четыре слота в корпусе компьютера.
GeForce RTX 5090 не Модель поддерживает технологию SLI, но не имеет специального разъема сверху.
Карта снабжена тремя выходами DP 2.1b и одним HDMI 2.1b.
О некоторых видеокартах на базе GeForce RTX 5090 известно, что у них ядра содержат меньше блоков растеризации (ROP), чем заявлено. Штатно их количество составляет 176. В нашем образце всё соответствует заявленному числу.
Nvidia объявила, что карты с уменьшенным количеством ROP составляют всего 0,5% от общего числа видеокарт GeForce RTX 50. Компания взяла на себя обязательство по гарантийному обмену подобных карт независимо от производителя. Рекомендуется проверять свои GeForce RTX 50 с помощью программ типа GPU-Z и в случае обнаружения меньшего, чем необходимо, количества ROP обращаться к продавцам для замены.
Работа карты контролируется специальным приложением ThunderMaster. Программа позволяет управлять вентиляторами, частотой работы, напряжением ядра и отслеживать состояние карты.
Нагрев и охлаждение
Видим кулер с обдувом хвоста радиатора. В основе системы охлаждения — большой многосекционный пластинчатый радиатор с никелевым покрытием и тепловыми трубками, которые передают тепло ребрам радиатора.
Восемь трубок припаяны к большой медной испарительной камере, которая охлаждает как ядро, так и микросхемы памяти с помощью термопрокладок. Для охлаждения ядра применяется термопаста (не жидкий металл).
Для охлаждения преобразователей питания VRM предусмотрены отдельные элементы на радиаторе, а задняя пластина защищает печатную плату.
Радиатор закрыт кожухом с тремя вентиляторами диаметром 94 мм, имеющими по девять лопастей. Вентиляторы вращаются на одинаковой частоте (по умолчанию), но программой ThunderMaster можно задать индивидуальную работу каждого. Кожух из литого алюминия — массивный и жесткий.
Радиаторные пластины имеют наклон в тридцать градусов. Это способствует уменьшению шума и повышению эффективности охлаждения.
При малой нагрузке на видеокарту остановка вентиляторов происходит при температуре GPU ниже 50 градусов и нагреве микросхем памяти ниже 80 градусов. После запуска ПК вентиляторы работают, но после загрузки видеодрайвера идет опрос рабочей температуры, и вентилятор выключается. видеоролик на эту тему.
Мониторинг температурного режима:
Инженеры Nvidia исключили из отчётов по наблюдению показатель температуры самой нагреваемой области ядра.
Режим BIOS 1(P):
При тестировании под нагрузкой максимальная температура ядра не превысила 80 градусов, а микросхем памяти — 84 градуса, что близко к пределу даже для топовых моделей. Потребляемая мощность карты достигала 577 Вт.
Мы засняли и ускорили в 50 раз 8-минутный прогрев
В области ядра, на нижней части платы печатной в районе разъёма PCIe и возле разъёма питания карты отмечался наибольший нагрев. Перегревов не зафиксировано. Важно помнить, что такой карте требуется высококачественный и мощный блок питания.
Режим BIOS 2(S):
Максимальная температура процессора при нагрузке составила 82 градуса, микросхем памяти — 86 градусов, что приемлемо. Мощность расхода энергии достигала 577 Вт.
Шум
Для измерения шума помещение должно быть изолировано и звукопоглощающим, реверберации сведены к минимуму. Исследуемый системный блок без вентиляторов не генерирует механический шум. Уровень фонового шума 18 дБА — это шум в комнате и собственно шумомера. Измерения проводятся на расстоянии 50 см от видеокарты на уровне системы охлаждения.
Режимы измерения:
- В режиме ожидания 2D открыт веб-браузер с ресурсом iXBT.com, окно программы Microsoft Word и несколько интернет-мессенджеров.
- Режим просмотра кинофильмов в формате 2D использует SmoothVideo Project (SVP) для аппаратного декодирования и добавления дополнительных кадров.
- Тест FurMark выполняется при активации режима 3D с полной нагрузкой на графический процессор.
Классификация уровней шума представлена следующим образом:
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
При простоя в двухмерном режиме температура не превышала 49 °C, вентиляторы останавливались, уровень шума составлял фоновый — 18 дБА. Температура ядра даже в простое находится близко к порогу включения вентиляторов, поэтому при некоторых условиях пользователя (повышенная температура в помещении, более тесный или хуже продуваемый корпус) возможны периодические включения вентиляторов, но при относительно тихом режиме работы.
Во время просмотра фильма аппаратное декодирование не повлияло на качество изображения.
Режим BIOS 1(P):
При максимальной нагрузке температура графического процессора достигала 80/84°C (ядро/память). Вентиляторы раскручивались до 2170 оборотов в минуту, шум увеличивался до 36,4 дБА: это громко, но еще приемлемо.
Аудиозапись шума — здесь. Спектрограмма шума:
Режим BIOS 2(S):
При максимальной нагрузке трехмерной графики температура ядра и памяти достигала 82/86 градусов Цельсия. Вентиляторы вращались со скоростью 2100 оборотов в минуту, шум составлял 35,8 дБА — довольно громко, но чуть тише аналогичных моделей. В целом, различий между режимами P и S нет, нагрев и шум примерно одинаковы.
Подсветка
Кулер имеет карту с окраской, которая меняет цвет, как хамелеон, на лицевой части корпуса под светом. Такая карта выглядит хорошо и без подсветки, отражая различные цвета в зависимости от внешнего света.
На верхней части карты обозначен логотип серии.
Режим подсветки, включая отключение, задается с помощью программы ThunderMaster.
Выбранный режим можно сохранить непосредственно в карте. Тогда по необходимости подсветка настроется единожды, без повторного запуска программы.
В комплект поставки карт GameRock входит кабель для подключения к разъему ARGB (5 В) на материнской плате для синхронизации подсветки с платой. В таком случае запуск утилиты ThunderMaster не обязателен: карта сама определит подключение, и подсветка будет синхронизирована по умолчанию.
Комплект поставки и упаковка
Кроме карты и адаптера питания в комплект входят разборная подставка для видеокарты с регулируемым по высоте упором, бонусные наклейки и коврик для мыши.
Тестирование: синтетические тесты
Тестирование новой видеокарты Nvidia на стандартных частотах выполнено нами в нашем наборе синтетических тестов. Этот набор постоянно эволюционирует: добавляются новые тесты, а устаревшие выводятся из него.
Желание включить больше примеров с вычислениями связано с определенными сложностями. Авторы непрестанно стремятся расширять и совершенствовать набор тестов. Пожелания по этому поводу авторы принимают в комментариях к статье или напрямую.
Мы добавили к бенчмаркам несколько тестов для оценки производительности трассировки лучей, DLSS, FSR и XeSS. Также продолжаем использовать подтесты из 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и другие. Приложения DirectX 11 и 12, которые ранее использовались в бенчмарках, исключены, так как последние время выдавали некорректные результаты.
Испытания синтетических программ выполняли на следующих видеокартах:
- GeForce RTX 5090 со стандартными параметрами (RTX 5090)
- GeForce RTX 5080 со стандартными параметрами (RTX 5080)
- GeForce RTX 4090 со стандартными параметрами (RTX 4090)
- Radeon RX 7900 XTX со стандартными параметрами (RX 7900 XTX)
Для оценки производительности новой флагманской видеокарты GeForce RTX 5090 сравнивали её с двумя другими картами Nvidia. Первая – это флагман прошлого поколения GeForce RTX 4090, самая мощная модель на архитектуре Ada Lovelace. Сравнение этих двух GPU покажет, насколько Blackwell улучшила положение дел. Вторая карта – GeForce RTX 5080 из текущей линейки. Результаты их сравнения помогут понять, насколько топовое решение обогнала вторую по старшинству модель в новой линейке.
У новинки от AMD и Intel нет прямых конкурентов, потому что таковых не планируется. Поэтому выбрали самую быструю имеющуюся модель Radeon — RX 7900 XTX. Она является топовой видеокартой компании AMD предыдущего поколения, хоть и не сопоставима с GeForce RTX 5090 по рыночному позиционированию. Остальные видеокарты Radeon не подходят для сравнения с GeForce RTX 5090 из-за меньшей мощности и цены, а новое поколение GPU в этом ничего не изменит.
Тесты 3DMark Vantage
В течение многих лет мы обращаемся к не самым свежим синтетическим тестам из набора 3DMark Vantage, поскольку в них часто можно обнаружить интересные детали, отсутствующие в более современных тестах. Feature тесты этого набора поддерживают DirectX 10 и остаются пригодными для анализа производительности новых видеокарт, позволяя сделать ценные выводы.
Feature Test 1: Texture Fill
Первый тест оценивает работоспособность блоков выборки текстур. Для этого заполняется прямоугольник данными из небольшой текстуры при помощи множества изменяющихся на каждом кадре текстурных координат.
Эффективность видеокарт AMD и Nvidia в текстурном тесте Futuremark обычно высока и показывает результаты близкие к теоретическим, хотя иногда несколько заниженные у некоторых GPU. Производительность графического процессора GB202 в игровой версии теста получилась ожидаемой — GeForce RTX 5090 значительно превзошла GeForce RTX 4090 и GeForce RTX 5080, что соответствует теории. Преимущество над последней если не двукратное, то близкое к этому, а Ada отстала прилично.
Сравнение новой флагманской видеокарты с единственным соперником компании AMD бессмысленно, но все же результат благоприятен для GeForce RTX 5090. Ранее несколько поколений AMD были сильны в этом тесте, но эффективная скорость текстурирования текущего семейства Radeon снизилась, и даже близкие по цене решения Nvidia догнали его, не говоря уже о современной топовой модели. Таким образом, GeForce RTX 5090 ощутимо быстрее всех, что неудивительно при такой разнице в количестве блоков текстурирования.
Feature Test 2: Color Fill
Вторая задача — проверка скорости заполнения экрана. Для неё применяется простейший пиксельный шейдер, не влияющий на производительность. Интерполированное значение цвета записывается в внеэкранный буфер с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, часто применяемый в играх с HDR-рендерингом, поэтому такой тест считается актуальным.
Результаты второго подтеста 3DMark Vantage демонстрируют производительность блоков ROP независимо от пропускной способности видеопамяти. Данный тест оценивает именно производительность системы ROP, а блок обработки потока обычно не оказывает заметного влияния на показатели. Новая видеокарта GeForce RTX 5090 по этому показателю соответствует теоретической оценке. Предыдущая модель GeForce RTX 4090 по скорости подсистемы ROP даже быстрее, но в реальности оказалась чуть медленнее. В сравнении с GeForce RTX 5080 показатели близки к теоретической разнице между моделями одного семейства, у флагмана блоков ROP значительно больше.
Все видеокарты Nvidia в данном тесте проиграли флагманской модели AMD Radeon RX 7900 XTX, которая превзошла GeForce RTX 4090 и оказалась чуть быстрее GeForce RTX 5090 именно в этой задаче. GeForce по пиковой скорости заполнения сцены всегда уступают конкурентам из-за меньшего числа блоков ROP по сравнению с соперниками, поэтому подобные результаты в данном тесте не являются неожиданными.
Тест особенностей 3: Параллаксное мапирование затенения
Этот вид feature-теста интересен потому что подобная техника давно применяется в играх. В нем формируется один четырехугольник (точнее, два треугольника) с использованием Parallax Occlusion Mapping, создающей имитацию сложной геометрии. Используются ресурсоемкие операции по трассировке лучей и карта глубины высокого разрешения. Поверхность освещается при помощи алгоритма Strauss. Тест является очень сложным для видеочипов пиксельного шейдера, содержащих многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Результаты теста из пакета 3DMark Vantage зависят не только от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости важен правильный баланс GPU и эффективность выполнения сложных шейдеров. Тест довольно полезен, так как результаты часто коррелируют с результатами игровых тестов.
Математическая и текстурная производительность важны, и в тесте 3DMark Vantage новая модель GeForce RTX 5090 продемонстрировала ожидаемый результат, опередив GeForce RTX 4090 на 20%. Разница не столь значительна, так как ПСП здесь не особо важна. GeForce RTX 5080 отстала более чем в полтора раза. Radeon RX 7900 XTX показала такой же результат, что и вторая видеокарта новой архитектуры Blackwell.
Feature Test 4: GPU Cloth
Четвертый тест уникален тем, что использует GPU для расчета физических взаимодействий (симуляция ткани). Вершинная симуляция с комбинированным использованием вершинных и геометрических шейдеров в нескольких проходах обеспечивает реализацию эффекта. Перенос вершин между проходами осуществляется с помощью stream out, что позволяет оценить производительность исполнения вершинных и геометрических шейдеров, а также скорость stream out.
Скорость рендеринга теста зависит от нескольких параметров: производительности обработки геометрии и эффективности выполнения шейдеров.
В этом тесте преимущество должны иметь чипы Nvidia, но получаемые результаты часто некорректны, поэтому их серьёзно оценивать не стоит.
В прошлом это касалось только GeForce, но со временем видеокарты Radeon попали в аналогичную ситуацию: более новые решения и драйверы AMD демонстрируют низкие результаты, похоже из-за ПО, которое давно не оптимизировали для устаревшего тестового пакета. Новый флагман показал почти такой же результат, как GeForce RTX 5080, но при этом на 40% быстрее предшественника GeForce RTX 4090 – возможно, дело в лучшем драйвере или улучшениях аппаратных блоков обработки геометрии Blackwell.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на основе систем частиц, вычисляемых с помощью графического процессора. Применяется вершинная симуляция, где каждая вершина соответствует отдельной частице. Stream out используется для той же цели, что и в предыдущем тесте. Вычисляются сотни тысяч частиц, каждая анимируется независимо, а также рассчитываются их столкновения с поверхностью рельефа. Частицы визуализируются геометрическим шейдером, который из каждой точки создает четыре вершины, формирующие частицу. Наиболее нагружен шейдерный блок вершинными расчетами, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage результаты новинок давно далеки от теории, так что не факт, что они вообще что-то отражают. Если же считать результаты корректными, то топовая видеокарта архитектуры Blackwell снова показала лучший результат, опередив GeForce RTX 4090 и GeForce RTX 5080, что объяснимо теорией. Radeon RX 7900 XTX из предыдущего поколения проиграла всем представленным в сравнении видеокартам Nvidia, что можно объяснить разве что плохой оптимизацией драйверов, так как раньше результаты всех GPU от обоих производителей были заметно выше.
Feature Test 6: Perlin Noise
Заключительный тестер пакета Vantage выполняет математически-напряженный тест графического процессора. Процесс подразумевает расчет нескольких октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал применяет собственную функцию шума, что увеличивает нагрузку на видеочип.
Результаты математического теста показывают производительность решений, которая, хотя и не всегда соответствует теории, близка к максимальной мощности видеочипов в сложных задачах. Тест основан на операциях с плавающей запятой и новый архитектуры должны были продемонстрировать возможности двойного запуска команд, но из-за устаревшего теста не все возможности современных GPU раскрываются по его результатам.
Новая флагманская модель серии GeForce RTX 50 продемонстрировала ожидаемый результат по сравнению с аналогичной моделью предыдущего поколения, опередив ее на 27%, то есть ровно на теоретическую разницу в вычислительной производительности. Решение на основе GB202 превзошло GeForce RTX 5080, основанную на GB203, и преимущество флагмана составило более полуторакратное. Что касается Radeon RX 7900 XTX, то GeForce RTX 5090 в данном случае явно быстрее — почти вдвое. Однако эти решения не конкурируют друг с другом на рынке. Проведем проверку результатов в более современных синтетических тестах, использующих повышенную нагрузку на GPU.
Тесты Direct3D 12
Примеры из SDK Microsoft и AMD, работающие на Direct3D12, исключены из тестов, поскольку демонстрируют неверные результаты. В качестве единственного вычислительного теста с поддержкой Direct3D12 остался бенчмарк Time Spy из 3DMark. Протестированы видеокарты в двух графических тестах для оценки производительности при включенной и отключенной возможности асинхронных вычислений, появившихся в DirectX 12.
Новая флагманская модель Nvidia по производительности превосходит видеокарту предыдущего поколения аналогичного уровня на 25%-28%, что согласуется с теорией о разнице между ними. GeForce RTX 5080 в этом тесте тоже показал неплохой результат.
Видеокарты Radeon в данном тесте часто превосходят по производительности конкурентов от GeForce за аналогичную цену, что важно учитывать при сравнении. Производительность представленной сегодня видеокарты GeForce RTX 5090 оказалась выше Radeon RX 7900 XTX, так как даже GeForce RTX 5080 ей не является конкурентом. Результаты этого теста в играх не всегда отражают реальную производительность, поэтому принимаем их во внимание — в задачах растеризации решения AMD могут быть эффективнее, и переходим к тестам трассировки лучей.
Тесты трассировки лучей
Бенчмарк Port Royal от создателей тестов 3DMark – один из первых тестов производительности трассировки лучей. Тест функционирует на всех графических процессорах с поддержкой DirectX Raytracing API. В разрешении 2560×1440 при различных настройках мы протестировали несколько видеокарт, сравнивая отражения, рассчитанные трассировкой лучей в двух режимах, и традиционным для растеризации методом.
Тест демонстрирует новые возможности применения трассировки лучей через DXR API. В нем реализованы алгоритмы отрисовки отражений и теней с использованием трассировки, но сам тест не очень оптимизирован и сильно загружает, в том числе мощные видеокарты. Тем не менее, для сравнения производительности разных видеокарт в данной задаче тест вполне подходит.
Результаты теста четко демонстрируют разницу в подходах AMD и Nvidia к поддержке аппаратного ускорения трассировки лучей, по крайней мере, до RDNA3 включительно. GeForce RTX 5090 показала ожидаемый максимальный результат, опередив GeForce RTX 4090 на 28%-38%, при этом в сложных условиях новинка обгоняет предшественницу не больше, а меньше.
Видеокарты уровня GeForce RTX x090 заметно быстрее моделей GeForce RTX 5080, а единственное в сравнении решение AMD оказалось медленнее всех.
Новый подтест 3DMark предназначен для оценки производительности трассировки лучей DirectX Raytracing. В отличие от предыдущего, он не гибридный и не использует растеризацию, а только трассировку лучей, точнее показывая скорость GPU в отношении аппаратного ускорения трассировки. Сцена бенчмарка знакома по другим подтестам 3DMark и достаточно мала — BVH-структура теоретически помещается в большой кэш, что может помочь новым видеокартам.
Все GeForce в данных условиях заметно превосходят Radeon, поскольку выделенные RT-ядра Nvidia выполняют основную часть работы и обладают большей универсальностью.
В тесте видеокарта GeForce RTX 5090 показала на 38%-39% большую производительность по сравнению с предшествующей моделью GeForce RTX 4090. Такой результат очень значителен, поскольку трассировка лучей является важным параметром для современных графических процессоров. Возможно, такое же улучшение будет наблюдаться и в играх с требовательной трассировкой лучей, например, в Cyberpunk 2077.
В 2022 году в пакет 3DMark добавили тест «Speed Way», предназначенный для оценки производительности графических процессоров Nvidia и AMD новых поколений при трассировке лучей. Этот тест по нагрузке на разные блоки GPU близок к игровым проектам, которые широко используют трассировку лучей, что делает его интересным для нас.
Приемлемые частоты кадров в обоих разрешениях демонстрируют лишь топовые видеокарты. GeForce RTX 4090 показывала более 60 FPS в 4K, а GeForce RTX 5080 почти достигла этого уровня. Разница между Radeon и GeForce значительна, единственная видеокарта AMD в сравнении заметно уступает всем остальным, хотя ее прямых ценовых конкурентов на диаграмме нет. Новое флагманское решение серии Blackwell быстрее GeForce RTX 4090 в этом тесте более чем на 40%, демонстрируя, что прирост производительности в сложных условиях может быть больше заявленных 27%. Да и GeForce RTX 5080 отстает от нового флагмана почти на 60%, что свидетельствует о его превосходстве в таких тяжелых условиях.
Ещё один полусинтетический бенчмарк создан на основе реального игрового движка — это китайский проект Boundary с поддержкой DXR и DLSS. Бенчмарк предъявляет высокую нагрузку к GPU, активно использует трассировку лучей для сложных отражений с несколькими отскоками луча, мягких теней и глобального освещения. В тестах Radeon технологию DLSS использовать не представляется возможным.
Без DLSS даже в Full HD-разрешении нормально работают лишь достаточно мощные видеокарты. В нашем сравнении сегодня такие, и хотя самая быстрая на данный момент видеокарта AMD отстала от всех GeForce, но всё равно показала больше 60 FPS. 4K-разрешение без масштабирования играбельно только на топовых GPU, да и то GeForce RTX 4090 не смогла показать 60 FPS. Но рассматриваемая новинка смогла, обойдя предыдущего флагмана снова лишь на 30%. А вот GeForce RTX 5080 уступает довольно прилично. Если мы ранее предположили, что скорость в тесте ограничивается пропускной способностью видеопамяти, то это явно не так. Показатели единственной представленной в сравнении видеокарты Radeon более чем вдвое ниже, что уже не должно удивлять никого.
С включением масштабирования разрешения качественным методом DLSS все три видеокарты Nvidia, представленные в тесте, даже при 4K разрешении обеспечивали приемлемую частоту кадров, превышающую порог в 60 FPS. При такой нагрузке только включение DLSS позволяет играть в 4K-разрешении с максимальными настройками в самых ресурсоемких играх. Новая топовая модель GeForce RTX 5090 показала результаты на 30%-40% выше, чем GeForce RTX 4090, что неплохо, а GeForce RTX 5080 отстает от флагмана в полтора раза.
Рассмотрим ещё один полуигровой бенчмарк, основанный на китайской игре Bright Memory. Интересно, что оба теста довольно похожи по результатам и качеству изображения, хотя по тематике они разные. Этот бенчмарк даже чуть более требователен, особенно к производительности трассировки лучей. Жаль, что на видеокартах AMD он не работает, требуя именно карты GeForce RTX. Мы добавили на диаграмму ещё и GeForce RTX 3090 — для оценки приростов производительности за три поколения.
В данном тестировании GeForce RTX 5090 на чипе GB202 показала результат на 37% быстрее, чем GeForce RTX 4090 с процессором AD102. Такое преимущество обусловлено как большей эффективностью трассировки лучей, так и увеличенной ПСП, а также большим количеством исполнительных блоков в первом GPU. В этом тесте GeForce RTX 5080 оказалась медленнее на до 64%, поскольку для четырёх K-разрешения важна и емкость видеопамяти, и её пропускная способность.
Вычислительные тесты
В пакете синтетических тестов пока есть только устаревший и не совсем оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1, который основан на LuxRender и использует OpenCL. Ищем новые бенчмарки с OpenCL для актуальных задач, чтобы добавить их в состав пакета.
Новая флагманская видеокарта GeForce RTX 5090 имеет больше вычислительных блоков по сравнению с GeForce RTX 4090, поэтому её превосходство в тесте не удивительно. Разница в 30%-40% свидетельствует о том, что это связано не только с количеством блоков. Новый GPU, вероятно, более эффективен в подобных задачах, хотя разницы в тестах не всегда одинаковы. В сравнении с GeForce RTX 5080 последняя показывает средние результаты, а в двух подтестах заметно уступает. По сравнению с топовой видеокартой конкурента из предыдущего поколения результат новинки во всех подтестах минимум вдвое выше результата лучшего Radeon.
V-Ray Benchmark — ещё один тест вычислительной производительности графических процессоров. Это трассировка лучей без применения аппаратного ускорения. Тест на базе рендерера V-Ray демонстрирует возможности GPU в сложных вычислениях и может показать преимущества новых видеокарт. В прошлых тестах использовались разные версии бенчмарка, выдающие результат в виде времени, затраченного на рендеринг, и в виде количества миллионов просчитанных путей за секунду, но остался только первый вариант.
Тест демонстрирует программную трассировку лучей, где GeForce RTX 5090 превосходит GeForce RTX 4090 всего на секунду, а GeForce RTX 5080 отстает в полтора раза. Единственный Radeon, который едва можно назвать конкурентом указанной видеокарте, показал результат более чем вдвое хуже уровня топовых видеокарт Nvidia двух поколений назад.
Новая модель пока не функционирует ни в Cinebench 2024, ни в OctaneRender 2020.1.5. Возможно, приложения в будущем получат обновления с оптимизацией под серию GeForce RTX 50, но временно их заменили другими версиями бенчмарка V-Ray с более развитыми возможностями.
Видеокарты AMD в этих программах уже не работают, а также не запускалась версия теста 4.10 с топовой GeForce RTX 5090 из-за ошибки, поэтому переходим к версии 5.02.
В тесте новая флагманская модель GeForce RTX 5090 обошла аналогичную по уровню модель прошлого поколения на 35% в режиме CUDA. При включенном аппаратном ускорении RTX, которое существенно повышает результаты графических процессоров Nvidia, разница составила порядка 23%, что ближе к теоретической разнице между GPU по вычислительной производительности. Результаты GeForce RTX 3090 наглядно демонстрируют значительный скачок производительности между GeForce RTX 30 и GeForce RTX 40, в то время как GeForce RTX 50 ускорилась меньше из-за техпроцесса, о котором уже говорилось.
Для оценки вычислительной мощности графических процессоров в задачах искусственного интеллекта применяется набора тестов MLPerf. MLPerf создан исследователями из Гарварда, Стэнфорда, Nvidia, Google и других университетов и организаций.
Данный набор тестов используется для измерения производительности Large Language Model (LLM) — языковой модели нейронной сети с большим количеством параметров, являющейся ключевой технологией генеративного ИИ. MLPerf измеряет скорость генерации текста при помощи искусственного интеллекта на основе различных исходных данных. В тестах используется модель Llama2-7B, а бенчмарк определяет время обработки входного запроса и получение первого токена в четырех типах тестов, а также количество генерируемых токенов в секунду после этого — то есть устойчивую производительность модели.
Производительность различных GPU оценивается в общей категории, представляющей геометрическое среднее всех подтестов. Разработчики теста сотрудничают с Nvidia, AMD и Intel. Графические процессоры Nvidia и AMD используют только DirectML, в то время как Intel — и DirectML, и OpenVINO, что приводит к более высоким результатам для Intel Arc.
Время получения первого токена свидетельствует о скорости начала ответа ИИ, подобно времени отклика системы. По этому показателю все видеокарты Nvidia превосходят флагман AMD прошлого поколения, RX 7900 XTX почти в три раза медленнее и не соперничает с GeForce RTX 5090. Разница между GeForce RTX 5090 и GeForce RTX 5080 составила 37%, а новинка на 17% обошла предыдущего флагмана GeForce RTX 4090, что чуть ниже наших ожиданий, но это лишь выдача первого токена, в последующих циклах разница должна быть больше.
Разница в скорости выдачи второго и последующих токенов существенно меняется: GeForce RTX 5090 на 36% быстрее GeForce RTX 4090, а флагманская модель на 56% опережает GeForce RTX 5080. AMD RX 7900 XTX, единственная представленная в сравнении видеокарта компании AMD, все так же медленнее всех (в два раза по сравнению с GeForce RTX 5090), но разница с GeForce сократилась. Будет интересно увидеть Radeon RX 9070 XT, обзор которой следует, но вряд ли он составит конкуренцию GeForce RTX 5090.
Тесты технологий DLSS/XeSS/FSR
В данном разделе изучаем тесты, связанные с технологиями повышения производительности. Прежде это были лишь технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), затем добавилась технология генерации промежуточных кадров — DLSS 3, а позднее — DLSS 4. Первым в материал включили отдельный тест технологии DLSS, хотя ранее проводились тесты с ее применением в приложениях с трассировкой лучей, было решено провести и отдельное тестирование. Рассмотрим результаты GPU компании Nvidia в разрешении 4K с включением технологии DLSS различных уровней качества сразу нескольких версий.
Начнем с режима Performance: изображение создается с меньшим разрешением и затем масштабируется до 4K с добавлением генерируемых кадров в соответствующих режимах. Без DLSS рендеринг происходит в полном разрешении, что резко снижает производительность. GeForce RTX 4090 выдала лишь 58 FPS в разрешении 4K, чего недостаточно для комфортной игры. В таких условиях GeForce RTX 5090 показала вполне играбельные 78 FPS. Но включение DLSS 2 в «производительном» режиме обеспечивает достаточную частоту кадров для всех видеокарт. Новая GeForce RTX 5090 в таком режиме на 27% быстрее GeForce RTX 4090, что соответствует теоретической разнице.
Многокадровая генерация выступает сильной стороной линейки Blackwell. Включение генерации промежуточных кадров предоставляет GeForce RTX 5090 огромный выигрыш даже по сравнению с GeForce RTX 4090. При использовании одного сгенерированного кадра новинка превосходит предыдущее топовое решение на 40%, а активация всех возможностей DLSS 4 дает преимущество перед GeForce RTX 4090 в 2,5 раза, как и заявлено компанией. GeForce RTX 5080 всегда отстает — от 50% до 65%.
В режиме DLSS все GeForce обеспечивают более 60 кадров в секунду. Новый флагман превосходит GeForce RTX 4090 на 31%, даже без использования генерации кадров. Это приблизительно равно результатам без включения DLSS, но генерация одного кадра увеличивает преимущество и повышает плавность изображения при небольшом увеличении задержки управления. FPS без генерации не должен быть ниже 40, так как генерация не улучшает задержку управления.
В режиме DLSS 3 при добавлении одного сгенерированного кадра GeForce RTX 5090 опережает GeForce RTX 4090 более чем на 40%, а увеличение до трех кадров обеспечивает новому флагману 2,65-кратное преимущество над GeForce RTX 4090. Также рассматриваемый графический процессор быстрее GeForce RTX 5080 на 65% в таких условиях. При высокой производительности даже в качественном режиме DLSS с генерацией кадров в разрешении 4K возможно, что 8K-разрешение станет востребованным?
В 8K родной рендеринг недоступен даже на мощных решениях: GeForce RTX 5090 выдаёт чуть больше 20 FPS. DLSS позволяет использовать 8K-разрешение и на GeForce RTX 4090, но только в «производительном» режиме, а GeForce RTX 5090 справляется и в «качественном», генерируя один кадр.
GeForce RTX 5090 превосходит предшественницу во всех параметрах: на 27%, 77% и даже некоторые блоки не ускорились. При генерации кадров GeForce RTX 5090 в 2,5 раза быстрее GeForce RTX 4090, для нового флагмана этот режим становится играбельным: без DLSS частота кадров почти 50 FPS, а у GeForce RTX 4090 такого нет.
Так что GeForce RTX 5090 первая видеокарта для 8K, хоть и с обязательным DLSS с MFG.
XeSS — это технология повышения производительности, которая работает аналогично DLSS 2.0 от Nvidia. XeSS также использует искусственный интеллект для восстановления информации в кадре при рендеринге в меньшем разрешении и масштабировании до более высокого. В отличие от DLSS, XeSS разработан компанией Intel и работает на всех современных видеокартах, хотя эффективность его работы может отличаться на разных моделях. Для тестирования использовался специализированный бенчмарк из пакета 3DMark с пониженным разрешением рендеринга.
Включение XeSS может повысить частоту кадров более чем вдвое. Технология универсальна, DLSS продвинута, но работает только на Nvidia, FSR — самая универсальная, но простая, а XeSS хороша и универсальна, но уступает DLSS по качеству и функциональности. Новая GeForce RTX 5090 в этом тесте эффективнее, чем GeForce RTX 4090. Возможно, программисты Nvidia оптимизировали это в драйверах. Ограничение производительности CPU становится заметно, разницы между режимами XeSS нет, так как сравниваем карты в 2K-разрешении. Тем не менее, GeForce RTX 5090 значительно быстрее предшественницы и GeForce RTX 5080, а низкая эффективность Radeon RX 7900 XTX удивляет — видеокарта AMD отстает в этом тесте.
FSR 2.0 от AMD — ещё одна технология масштабирования рендеринга. Её добавили в списке специализированных подтестов 3DMark. Сцены разных технологий масштабирования отличаются, поэтому сравнение затруднительно. Можно только оценить рост производительности, но необходимо учитывать реальное разрешение рендеринга и разницу в качестве, что усложнит задачу.
Технология FSR универсальна и работает на различных графических процессорах приблизительно одинаково. В тестах FSR 2.0 особых открытий не наблюдалось. Отчасти заметен упор в CPU, хотя не так сильно, как раньше. Radeon RX 7900 XTX снова оказался менее эффективным по сравнению с видеокартами Nvidia, несмотря на то что не является их прямым конкурентом на рынке. Производительность этой модели явно недостаточно высока.
Обзор представленной сегодня топовой модели GeForce RTX 5090 показывает её лидерство, что не удивительно. При активации технологии масштабирования разрыв по сравнению с GeForce RTX 4090 уменьшается с 32% до 23%, что указывает на ограничения в возможностях процессора. В целом, тесты всех технологий масштабирования не выявили ничего необычного. За исключением многокадровой генерации DLSS 4, новинка отличается от GeForce RTX 4090 по чистой скорости примерно на 30% в среднем, но добавление кадров DLSS 4 даёт новому топовому решению дополнительное преимущество. Переходим к тестированию новой флагманской видеокарты Nvidia в реальных игровых тестах.
Тестирование: игровые тесты
Конфигурация тестового стенда
Конфигурация тестового стенда
Список инструментов тестирования
В ходе всех игровых испытаний применялась максимальная графика.
- Черная мифология: Обезьяна-царь (Игра Науки/Игра Науки)
- Cyberpunk 2077 от Софтклаба и CD Projekt RED, обновление 2.21 (январь 2025 года).
- Сага Сениу: Ад в глазах 2 (Ninja Theory/Xbox Games).
- Call of Duty: Modern Warfare II (Infinity Ward/Activision), без трассировки и DLSS/FSR/XeSS.
- Alan Wake 2 (Remedy/Epic Games)
- «Рачэт и Кланк: Разлом Реальности» от Insomniac Games, Sony и Софтклаба.
- Руководитель проекта «Призрак Цусимы» расширенная версия (Студия Sucker Punch Productions / Sony Interactive).
- Наследие Хогвартса (Аваланч Софтвэре/Warner Bros).
- Avatar: Frontiers of Pandora (Ubisoft)
- Atomic Heart (Mundfish/VK)
- Индиана Джонс и Великий круг (Machine Games / Bethesda Softworks) (с поддержкой RTX и DLSS / FSR / XeSS).
Кратко о производительности в 3D-играх
До подробных тестов дадим краткую информацию о производительности семейств, куда входит испытуемый акселератор, и его конкурентов. Все это мы субъективно оценим по 7-балльной шкале.
Игры с классической растеризацией. :
GeForce RTX 5090 является лидером среди протестированных карт. Флагманские решения иногда не раскрывают весь свой потенциал в традиционных играх, даже при разрешении 4K, поскольку общая производительность ограничена ресурсами системы, прежде всего — процессором. Тем не менее, в классических играх с растеризацией можно получить комфортную игру на максимальных настройках графики в любом разрешении, включая 4K (2160p), а во многих — даже в 8K.
Игры, поддерживающие трассировку лучей и технологии upscaling DLSS, FSR и XeSS. :
В играх можно играть с высокими настройками графики, включая трассировку лучей, даже в разрешении 4K. Использование динамического масштабирования не обязательно. DLSS 3 и MFG обеспечат существенное увеличение FPS в разрешении 8K.
Результаты тестирования в 3D-играх
Результаты тестирования на стандартных решениях без аппаратного отслеживания лучей при разрешениях 1920×1080, 2560×1440 и 3840×2160.
Black Myth: Wukong
Cyberpunk 2077 v.2.21
Senua’s Saga: Hellblade II
Call of Duty: Modern Warfare II
Alan Wake 2
Ratchet and Clank: Rift Apart
Ghost of Tsushima Director’s Cut
Hogwarts Legacy
Avatar: Frontiers of Pandora
Atomic Heart
Результаты тестирования с включенной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160.
Black Myth: Wukong, RT+DLSS/FSR/XeSS
Cyberpunk 2077 v.2.21, RT
Cyberpunk 2077 v.2.21, RT + DLSS/FSR
Senua’s Saga: Hellblade II, DLSS/FSR/XeSS
Alan Wake 2, RT
Alan Wake 2, RT + DLSS/FSR
Ratchet and Clank: Rift Apart, RT
Краш и Кланк: Разлом реальностей, RT с DLSS/FSR/XeSS.
Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS
Hogwarts Legacy, RT
Hogwarts Legacy, RT + DLSS/FSR/XeSS
Avatar: Frontiers of Pandora, RT
Avatar: Frontiers of Pandora, RT + DLSS/FSR
Atomic Heart, DLSS/XeSS
Indiana Jones and the Great Circle, RT
Индиана Джонс и Великий круг, RTX + DLSS/FSR/XeSS.
Результаты тестирования при активации аппаратного отслеживания лучей и применении технологий DLSS/FSR/XeSS с разрешением 7680×4320 (8K).
Cyberpunk 2077, RT + DLSS/FSR
Senua’s Saga: Hellblade II, DLSS/FSR/XeSS
«Ретчет и Кланк: Разлом миров» с поддержкой RT и DLSS/FSR.
Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS
Hogwarts Legacy, RT + DLSS/FSR/XeSS
Indiana Jones and the Great, RT + DLSS/FSR/XeSS
Рейтинг iXBT.com
Методика расчета рейтингов
Рейтинг ускорителей iXBT.com Показывает сравнение производительности видеокарт.
- Вариант рейтинга iXBT.com без включения RT
Рейтинг основан на результатах всех тестов, выполненных без применения технологий трассировки лучей. Нормализацию рейтинга производят относительно наименее мощного ускорителя из группы карт — Arc A310 (скорость и возможности Arc A310 принимают за 100%). Рейтинги формируются на основе 30 регулярно исследуемых нами акселераторов в рамках проекта. Лучшая видеокарта месяцаДля анализа отобрана группа карт, состоящая из GeForce RTX 5090 и его соперников.
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
01 | RTX 5090 32 ГБ, 2407—2890 МГц/28 ГТ/с | 7516 | 231 | 325 000 |
02 | RTX 4090 24 ГБ, 2520—2640 МГц/21 ГТ/с | 5484 | 148 | 370 000 |
03 | RTX 5080 16 ГБ, 2617—2850 МГц/30 ГТ/с | 4980 | 304 | 164 000 |
07 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 4424 | 372 | 119 000 |
GeForce RTX 5090 в разрешении 4K превосходит GeForce RTX 4090 на 37%, GeForce RTX 5080 — на 51%, а Radeon RX 7900 XTX — на 70%. Это огромная разница по сравнению с лидером предыдущего поколения и GeForce RTX 5080. В теории это позволяет разместить в нишу между лидерами текущего поколения GeForce RTX 5080 Super и GeForce RTX 5080 Ti, если Nvidia решит так поступить. Нужно отметить, что выводы сделаны на основе тестов в 4K, а в более низких разрешениях потенциал флагманских ускорителей может не быть полностью реализован. Современные и дорогие флагманы наиболее интересны в самых сложных режимах с включением RT, их производительность в классических играх давно избыточна.
- Рейтинг iXBT.com с поддержкой RT/DLSS/FSR/XeSS.
Рейтинг основан на результатах 10 тестов, которые применяют технологию трассировки лучей вместе с Nvidia DLSS, AMD FSR или Intel XeSS. Нормирование рейтинга происходит по показателю самого медленного ускорителя в каждой группе — Arc A310 (скорость и возможности Arc A310 приняты за 100%).
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
01 | RTX 5090 32 ГБ, 2407—2890 МГц/28 ГТ/с | 18257 | 562 | 325 000 |
02 | RTX 5080 16 ГБ, 2617—2850 МГц/30 ГТ/с | 13532 | 825 | 164 000 |
04 | RTX 4090 24 ГБ, 2520—2640 МГц/21 ГТ/с | 11028 | 298 | 370 000 |
11 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 6254 | 526 | 119 000 |
При проведении игр с разрешением 4K GeForce RTX 5090 превосходит GeForce RTX 4090 на 65%, GeForce RTX 5080 — на 35%, а Radeon RX 7900 XTX — на 292%. GeForce RTX 5080 заняла более высокое место в рейтинге, так как в четырех из десяти тестовых игр уже реализована поддержка DLSS 4 с многокадровой генерацией, что позволяет картам поколения GeForce RTX 5 значительно, иногда в разы опережать предшественников по производительности.
Рост производительности новых карт значителен, но не стоит забывать: в играх с DLSS этот прирост связан с MFG, а не исключительно аппаратными возможностями. Протестировав GeForce RTX 5090 и GeForce RTX 5080 только с DLSS 2/3 без MFG, получили иную картину: GeForce RTX 5090 опережает GeForce RTX 4090 на 42%, а GeForce RTX 5080 обходит ее на 48%. Таким образом, новый флагман GeForce RTX 5090 — это реальный скачок.
Рейтинг полезности
Рейтинг полезности Получаются те же карты, если показатель рейтинга предшествующего периода разделить на цены упомянутых ускорителей. Для вычисления рейтинга полезности применялись розничные цены. на март 2025 года.
- Вариант рейтинга полезности без включения RT
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
17 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 372 | 4424 | 119 000 |
25 | RTX 5080 16 ГБ, 2617—2850 МГц/30 ГТ/с | 304 | 4980 | 164 000 |
26 | RTX 5090 32 ГБ, 2407—2890 МГц/28 ГТ/с | 231 | 7516 | 325 000 |
28 | RTX 4090 24 ГБ, 2520—2640 МГц/21 ГТ/с | 148 | 5484 | 370 000 |
Полезность рейтинга на данный момент невысока: стоимость новых GeForce RTX 50 сильно переоценена (в особенности GeForce RTX 5090), учитывая опасения производителей поставлять такие карты в Россию из-за санкций. Кроме того, мало кто из пользователей, потративших большие средства на видеокарту, ограничится играми без RT и/или DLSS.
- Рейтинг полезности с использованием RT/DLSS/FSR/XeSS.
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
03 | RTX 5080 16 ГБ, 2617—2850 МГц/30 ГТ/с | 825 | 13532 | 164 000 |
18 | RTX 5090 32 ГБ, 2407—2890 МГц/28 ГТ/с | 562 | 18257 | 325 000 |
21 | RX 7900 XTX 24 ГБ, 2500—2990 МГц/20 ГТ/с | 526 | 6254 | 119 000 |
26 | RTX 4090 24 ГБ, 2520—2640 МГц/21 ГТ/с | 298 | 11028 | 370 000 |
GeForce RTX 4090 активно применяют в датацентрах для вычислений, главным образом для работы нейронных сетей. В розницу ее практически не продают, а цена не кажется оправданной. С GeForce RTX 5090 ситуация еще сложнее, но если считать ее игровой видеокартой, то при цене около 225 тысяч рублей ускоритель на базе GeForce RTX 5090 был бы самым привлекательным среди всех флагманов.
Тем не менее, нужно помнить, что GeForce RTX 5090 кажется избыточным для игр, особенно по объему видеопамяти. По этой причине Nvidia установила рекомендованную цену на это решение в два раза выше, чем на GeForce RTX 5080 (о ценах и их отличии от рекомендованных — тема отдельного обсуждения), хотя игровая производительность GeForce RTX 5090 явно не вдвое превосходит производительность GeForce RTX 5080.
Выводы и сравнение энергоэффективности
Ускоритель GeForce RTX 5090 (32 ГБ) Это настоящий флагман от Nvidia нового поколения. Производительность в играх значительно выше, чем у лучших моделей прошлых лет, особенно в играх с трассировкой лучей и DLSS с многокадровой генерацией.
Это первый игровой продукт с объёмом видеопамяти 32 ГБ. GeForce RTX 5090 позиционируется не как исключительно игровой ускоритель, а скорее как полупрофессиональный продукт для моделирования, проектирования и вычислений общего назначения. Такой объем памяти позволяет быстро обрабатывать большие модели, вмещая целые проекты в видеопамяти (при оптимизации ПО).
GeForce RTX 5090 привлекателен для компьютерных систем и кластеров, занятых вычислениями в области искусственного интеллекта (разработка моделей, совершенствование нейронных сетей). В геймерские компьютеры GeForce RTX 5090, скорее всего, попадет только в системы очень обеспеченных пользователей.
Текущие цены на видеокарты — отдельная история. Рекомендованных розничных цен (MSRP) в ближайшем будущем не предвидится, даже с учётом налогов. На момент подготовки обзора единичные предложения карт GeForce RTX 5090 (производства Palit) появлялись на маркетплейсах по ценам от 325 тысяч рублей, типичное значение в рознице составляло от 400 тысяч. При текущем курсе рубля это кратная разница с MSRP. На Западе, включая США, GeForce RTX 5090 стоит не дешевле 3000-3500 долларов. Многие партнёры Nvidia уже объявили о повышении отпускных цен почти на всю линейку GeForce RTX 50. В сети ходит информация о том, что Nvidia продает своим же партнерам комплекты из ядра и микросхем памяти по ценам, составляющим до 80% от MSRP. Как им в таких условиях производить, продавать и получать прибыль, оставаясь в рамках MSRP? При этом дефицит GeForce RTX 5090 и GeForce RTX 5080 сохраняется.
При расчете рейтинга полезности в обзоре использовали сумму 325 тысяч рублей, потому что по такой минимальной цене на момент подготовки можно было найти GeForce RTX 5090 на маркетплейсах. Речь идет пока только о картах Palit, других нет.
GeForce RTX 5090 имеет графическое ядро, которое по сравнению с GeForce RTX 4090 увеличилось примерно на треть. Пропускная способность памяти (ПСП) в нём составляет 1792 ГБ/с, что на 77% выше чем у GeForce RTX 4090 (1008 ГБ/с). В этом и заключается основное преимущество GeForce RTX 5090 над предшественником. Новое ядро GB202 — это не просто AD102 с увеличенным количеством блоков и быстрой памятью. В архитектуре Blackwell, как и в работе с новой технологией мультикадровой генерации (MFG), есть свои особенности. Первые тесты DLSS при генерации трех и более кадров на основе разных моделей ИИ показали преимущество нового поколения не только в физических параметрах (количестве блоков, частоте работы и т.д.), но и в программных оптимизациях и использовании нейронных сетей для повышения игровой производительности.
Производители игр и Nvidia, выпускающая приложение Nvidia App, играют значительную роль. Приложение позволяет ускорителям поколения GeForce RTX 50 принудительно включать MFG в играх с поддержкой DLSS 3. Таких игр много. Список игр, где карты GeForce RTX 50 могут обеспечить существенный прирост производительности, уже большой.
Остался вопрос о качестве графики с DLSS 4, возможных задержках и лагах. Рассмотрим его отдельно — это сложный аспект, не изучаемый обычными обзорами видеокарт. Долгосрочные испытания дорогостоящих карт затруднены, но нашли решение. Вскоре займемся этой темой.
Повторюсь, доля программной части в видеокарте (как едином аппаратно-программном комплексе) значительно возросла. Даже если графический процессор сохранил набор аппаратных блоков, не очень отличающийся от предшественника (например, GeForce RTX 5080 или GeForce RTX 5070 Ti), но получил инструменты для работы с нейронными сетями, включая программные оптимизации, то может претендовать на звание ускорителя нового поколения.
Программная часть ускорителей всё больше совершенствуется, активнее применяются нейронные сети из области ИИ. Аппаратная часть GPU должна иметь блоки для быстрых вычислений. Будет ли игровая индустрия переходить к «выдумыванию» кадров и целых сцен во время игры? Полагаем, что генерация нескольких кадров предел, поскольку такой подход создает элемент непредсказуемости: как себя поведет ИИ, если дать ему свободу генерировать контент внутри игры?
GeForce RTX 5090 лидирует по игровой производительности, конкурентов у него пока нет. AMD на данном этапе не намерена выпускать флагманские решения в новом поколении. Intel вообще никогда не поднимала вопрос о выпуске флагманского ускорителя для игр.
В отношении энергоэффективности GeForce RTX 5090 занимает среднее положение (ближе к концу в классических играх, ближе к началу — в играх с RT/DLSS/XeSS/FSR), так как при потреблении 575 Вт для лидирования по этому показателю необходимо выдавать высокие показатели производительности. Даже GeForce RTX 4090 располагается выше благодаря значительно меньшему потреблению (450 Вт). Ранее такие карты потребляли около 600 Вт, но Nvidia посредством программных оптимизаций снизила это значение без потери производительности.
К ярким нововведениям Blackwell относится нейронный рендеринг, который уже повышает качество изображения и производительность в условиях застоя в полупроводниковом производстве. Технологии масштабирования и генерации кадров DLSS увеличивают частоту кадров, обеспечивая высокое качество изображения при помощи искусственного интеллекта, который генерирует большинство пикселей вместо традиционного рендеринга. Технология Ray Reconstruction сокращает количество лучей для создания высококачественных изображений с трассировкой лучей, используя шумоподавление и реконструкцию недостающих деталей. ИИ совершенствуется, качество рендеринга растет при снижении вычислительных затрат и объема памяти по сравнению с обычными методами.
Решения Blackwell оптимизированы под технологии нейронного рендеринга, которые позволят разработчикам ИИ использовать возможности генеративного ИИ в реальном времени для рендеринга и моделирования. Генеративный ИИ поможет создавать реалистичные ландшафты и сложные сцены, более достоверные физические симуляции и поведение игровых персонажей. Полностью можно использовать генеративный искусственный интеллект для рендеринга человеческих лиц. Профессиональные приложения 3D-дизайна могут применять возможности генеративного ИИ в Blackwell для ускорения рабочих процессов при создании контента. Microsoft внедряет эти возможности в следующую версию DirectX, а аппаратное ускорение нейрорендеринга поддерживается Intel, AMD и Qualcomm, поэтому развитие будет стремительным.
Конкретная протестированная карта Palit GeForce RTX 5090 GameRock (32 ГБ) Габариты модели равны внушительным 33×15 см, занимая в системном блоке 4 слота. Кулер не обладает тихой работой, но и не самый шумный среди подобных. По отзывам западных медиа, ни одна карта на базе GeForce RTX 5090 не отличается умеренным уровнем шума, ведь такую мощностью почти 600 Вт необходимо как-то рассеивать.
Видеокарта Palit имеет максимальную потребляемую мощность 575 Вт (официальный лимит Nvidia) и оснащена одним разъемом питания 12VHPWR (PCIe 5.0). У неё четыре видеовыхода: один HDMI 2.1b и три DisplayPort 2.1b, обеспечивающие пропускную способность до 80 Гбит/с в режиме передачи UHBR 20 и позволяющие подключить дисплей 8K с частотой обновления 60 Гц по одному кабелю. Красивый кожух кулера, названный производителем «хамелеоном», впечатляет даже без подсветки. Единственным недостатком внешнего вида является контрастирующие черные круги вентиляторов: хотя бы лопасти должны были быть полупрозрачными, чтобы часть свечения подсветки попадала на них.
Компания Palit снова порадовала комплектацией: помимо видеокарты в комплекте есть переходник питания, адаптер для синхронизации подсветки, подставка, которая крепится к карте, а также стикеры и коврик для мыши.
GeForce RTX 5090 обеспечит отличный игровой опыт на высоких настройках качества во всех играх, как с включенной, так и с отключенной трассировкой лучей и технологиями масштабирования в разрешениях до 2160p (4K). В многих играх при использовании DLSS/FSR/XeSS, а иногда и без них, можно получить комфортную игру даже в разрешении 8K.
В номинации «Оригинальный дизайн» карта Palit GeForce RTX 5090 GameRock (32 ГБ) получила награду: