![](https://digitalartspace.ru/wp-content/uploads/2025/02/1s2v5uphxa755fzyev.jpg)
Общая информация о GeForce RTX 5080
Появление графической архитектуры Nvidia Turing несколько лет назад стало началом новой эры в реальном времени, предоставив аппаратную трассировку лучей и ускорение искусственного интеллекта для игр и профессионального ПО. В последующих архитектурах Ampere и Ada Lovelace эти возможности совершенствовались: обновлялись тензорные и RT-ядра, улучшался DLSS, увеличивалась производительность. В Ada Lovelace появилась генерация кадров DLSS и реконструкция лучей на основе нейросетей. С течением времени трассировка лучей и применение нейросетей стали стандартом, появившись даже на игровых консолях. Нейросети позволили продолжить рост качества изображения, так как традиционные методы ускорения достигли своих пределов, а рендеринг с помощью ИИ развивается быстрее. Технология DLSS кратно повысила частоту кадров, генерируя большинство пикселей при меньших затратах производительности. Реконструкция лучей позволила улучшить освещение с использованием трассировки пути, значительно сократив необходимые расчеты.
Nvidia продолжила движение в направлении совершенствования технологий искусственного интеллекта в новой архитектуре Blackwell. В ней улучшена технология DLSS, появилась многокадровая генерация для увеличения частоты кадров и качества изображения за счет более эффективных ИИ-моделей. Nvidia предлагает методы нейронного рендеринга для отрисовки материалов и объектов. Компания утверждает о наступлении «эры нейронного рендеринга», а несомненно, влияние нейросетей на нашу жизнь возрастает. Несмотря на сохраняющуюся группу сторонников традиционных методов, применение нейросетей при дорисовке изображения позволяет повысить его качество и производительность одновременно. Добавление возможности применения нейросетей в шейдерах DirectX Microsoft стимулирует разработчиков ПО к использованию этих возможностей шире.
Рассмотрим материал по порядку. Он будет обширный и продемонстрирует много новых возможностей, открывающихся с новыми GPU. Архитектуру Blackwell, включающую игровые и вычислительные графические процессоры, назвали в честь Дэвида Гарольда Блэквелла — американского математика и статистика, известного как один из авторов теоремы Рао—Блэквелла—Колмогорова, а также другими достижениями в области теории вероятностей, теории игр, статистики и динамического программирования. Первые видеокарты Nvidia на основе новой архитектуры Blackwell — модели GeForce RTX 5090, RTX 5080, RTX 5070 Ti и RTX 5070. В основе флагманской модели GeForce RTX 5090 лежит графический процессор GB202, являющийся самым мощным в компании. GeForce RTX 5080 и RTX 5070 Ti построены на графическом процессоре GB203, а GeForce RTX 5070 использует чип GB205.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/s64b9zm4nvhp0ttwd5.jpg)
Временное пропускание топовой модели новой линейки не исключает её возвращения в будущем, а ознакомление с возможностями новой архитектуры Nvidia начнётся с GeForce RTX 5080. Вторая по мощности видеокарта нового поколения способна выполнять те же задачи, что и флагман, но за вдвое меньшую цену. С 16 ГБ памяти и шиной памяти объёмом 256 бит (в два раза меньше чем у GeForce RTX 5090) Nvidia рекомендует использование GeForce RTX 5080 для самых высоких разрешений рендеринга с максимальными графическими настройками, включая трассировку лучей.
GeForce RTX 5080 мало чем отличается от GeForce RTX 4080 (Super). Компания Nvidia столкнулась с трудностями в повышении чистой производительности в поколении Blackwell. Семейство GeForce RTX 40 сделало большой скачок по техпроцессам, что дало приличный прирост производительности. У GeForce RTX 50 ситуация сложнее — даже с использованием передовых технологий, таких как память GDDR7 и шина PCI Express 5.0. Все графические процессоры нового поколения используют тот же самый 5-нанометровый техпроцесс TSMC 4N, что и предыдущее поколение. Без усовершенствований в технологии производства значительный прирост производительности в реальных условиях добиться сложно.
Увеличение производительности возможно за счет модификации архитектуры, но она уже достаточно совершенна. Просто добавление блоков не решит проблему. Чистая математическая производительность простых задач при росте количества блоков ALU увеличивается, но общая графическая производительность не будет линейной. Необходимо повышать и частоту GPU (что в значительной степени ограничено возможностями техпроцесса), и производительность остальных частей конвейера. Nvidia предложила путь повышения производительности не за счет чистой мощности, а с помощью технологий искусственного интеллекта — объединения объектов, отрисованных традиционным способом, с дополнениями, созданными генеративным ИИ. Новая графическая архитектура Blackwell оптимизирована для запуска нейросетей и 3D-графики на GPU одновременно, включая новый аппаратный планировщик.
Nvidia считает нейронный рендеринг следующей эрой компьютерной графики. Благодаря интеграции нейросетей в процесс отрисовки можно добиться значительного прироста производительности и качества изображения. Применение DLSS — лишь начало этого процесса, когда изображение изначально создается в низком разрешении, а затем дорисовывается нейросетью в более высокое, а кадры размножаются с помощью умной ИИ-интерполяции. DLSS уже способна имитировать сцену со всеми тенями, отражениями и преломлениями, иногда справляясь лучше традиционного рендеринга благодаря информации из предыдущих кадров. Потенциальные возможности нейросетей огромны: их внедрение в программируемые шейдеры может изменить процесс еще сильнее — позволит эффективнее сжимать текстуры, использовать более реалистичные материалы и сложное освещение, а также многое другое. Некоторые детали, например человеческие лица, можно полностью рисовать нейросетью на основе очень простых векторных изображений.
Сегодня подробно обсудим все, но сначала рассмотрим GeForce RTX 5080. Эта видеокарта предназначена для энтузиастов, желающих получить функциональность новой архитектуры и высокую производительность, заплатив вдвое меньше флагманской GeForce RTX 5090. Она рассчитана на самые высокие разрешения и максимальные графические настройки, включая самую сложную трассировку лучей. Новинка обеспечит высокую производительность во всех играх, включая проекты с самой продвинутой графикой и применением трассировки пути, лишь в редких случаях для этого придется включить DLSS, которая получила значительное улучшение в этом поколении.
Архитектура Blackwell графически основана на аппаратном уровне. Она не сильно отличается от предшествующей Ada Lovelace, которая сама по себе во многом схожа с архитектурой Ampere. Все эти архитектуры имеют между собой много общего, поэтому для понимания материала полезно ознакомиться и с предыдущими статьями по теме.
- [16.11.22] Обзор видеоускорителя Nvidia GeForce RTX 4080 (16 ГБ)
- [26.10.22] Обзор видеоускорителя Nvidia GeForce RTX 4090 (24 ГБ)
- [10.10.22] Теоретический обзор Nvidia GeForce RTX 4090 и RTX 4080
- [30.09.20] Nvidia GeForce RTX 3090: мощнейший графический ускоритель, хотя и не предназначенный исключительно для игр.
- [16.09.20] Nvidia GeForce RTX 3080: первая часть — теория, архитектура и синтетические тесты
![](https://digitalartspace.ru/wp-content/uploads/2025/02/abfs7sd3w9obgieecn.jpg)
Графический ускоритель GeForce RTX 5080 | |
---|---|
Кодовое имя чипа | GB203 |
Технология производства | 5 нм (TSMC 4N) |
Количество транзисторов | 45,6 млрд |
Площадь ядра | 378 мм² |
Архитектура | Унифицированное устройство с набором процессоров для параллельной обработки данных любого типа: вершин, пикселей и подобных. |
Аппаратная поддержка DirectX | DirectX 12 Ultimate с поддержкой Feature Level 12_2. |
Шина памяти | Память имеет 256 бит, реализованных через восемь независимых контроллеров на 32 бита каждый. Контроллеры поддерживают память типа GDDR7. |
Частота графического процессора | до 2617 МГц |
Вычислительные блоки | В составе имеется 84 потоковых процессора с 10752 ядрами CUDA, предназначенных для целочисленных операций INT32 и вычислений с плавающей запятой форматов FP16/FP32/FP64. |
Тензорные блоки | 336 тензорных ядер предназначены для вычислений с использованием матриц в форматах INT4, INT8, FP4, FP8, FP16, FP32, BF16 и TF32. |
Блоки трассировки лучей | Для расчетов пересечений лучей с треугольниками и BVH используется 84 ядра RT. |
Блоки текстурирования | Система использует 336 блоков, отвечающих за текстурную адресацию и фильтрацию. Блоки поддерживают компоненты FP16/FP32 и трилинейные, а также анизотропные фильтры для всех типов текстур. |
Блоки растровых операций (ROP) | Система оснащена четырнадцатью широкополосными блоками обработки изображений размером 112 пикселей каждый. Блоки поддерживают различные режимы сглаживания, включая программируемые, а также форматы буфера кадра FP16 и FP32. |
Поддержка мониторов | HDMI 2.1b и DisplayPort 2.1b |
Спецификации видеокарты GeForce RTX 5080 | |
---|---|
Частота ядра | до 2617 МГц |
Количество универсальных процессоров | 10752 |
Количество текстурных блоков | 336 |
Количество блоков блендинга | 112 |
Эффективная частота памяти | 30 ГГц |
Тип памяти | GDDR7 |
Шина памяти | 256 бит |
Объем памяти | 16 ГБ |
Пропускная способность памяти | 960 ГБ/с |
Вычислительная производительность (FP32) | до 56,3 терафлопс |
Теоретическая максимальная скорость закраски | 293 гигапикселей/с |
Теоретическая скорость выборки текстур | 879 гигатекселей/с |
Шина | PCI Express 5.0 x16 |
Разъемы | по выбору производителя |
Энергопотребление | до 360 Вт |
Дополнительное питание | один 16-контактный разъем |
Количество слотов в системном блоке. | по выбору производителя |
Рекомендуемая цена | $999 |
Новинка получила название, соответствующее принципу наименования решений компании — GeForce RTX 5080 следует за GeForce RTX 4080 и занимает вторую позицию в новом поколении графических процессоров. Выше нее только GeForce RTX 5090, а ниже — GeForce RTX 5070 Ti и RTX 5070. Графический процессор GB203 в модели в два раза меньше топового GB202, на котором основан флагман, но в RTX 5080 используется полная версия чипа со всеми доступными исполнительными блоками, в отличие от RTX 5090. Поэтому, если выйдут позже RTX 5080 Super или 5080 Ti, Nvidia придется использовать в них урезанную версию GB202, извлечь максимум из GB203 уже невозможно.
Новым GeForce RTX 5080 пока нет прямых соперников на рынке. AMD хотя и анонсировала новое поколение видеокарт, перенесла выпуск их минимум до марта. Таким образом, условным конкурентом новой модели является топовая модель текущего семейства — Radeon RX 7900 XTX. Цена последней приблизительно соответствует цене RTX 5080. С учетом того что RTX 5080 быстрее RTX 4080 Super, от RX 7900 XTX особой конкуренции ждать не стоит, особенно при активном использовании трассировки лучей.
Объем видеопамяти GeForce RTX 5080 в объёме 16 ГБ — разумный выбор. 8 ГБ было бы недостаточно, а больший объем с быстродействующей GDDR7-памятью пока дорог, поэтому Nvidia остановилась на оптимальном варианте. Желание получить 24 ГБ понятно, но шина памяти этого не позволяет. И такой объём памяти не сильно помогает Radeon RX 7900 XTX в противостоянии с RTX 4080 Super. Поэтому вариант в 16 ГБ можно считать наилучшим на данный момент, для любых приложений он будет достаточно до ближайших лет. Более большой объем видеопамяти даст преимущество лишь в исключительных случаях.
Nvidia выпустила для западных рынков GeForce RTX 5080 Founders Edition. Эта видеокарта имеет такой же дизайн, как топовая модель GeForce RTX 5090 Founders Edition: одинаковая длина, высота и толщина в два слота. Отличия заключаются только в наклейках на задней стороне. Система охлаждения RTX 5080 FE использует двойное сквозное продувание: печатная плата размещена в центре, не мешая вентиляторам. Для вывода сигнала на дисплей и PCIe используется отдельные маленькие платы. Такая конструкция позволяет воздушному потоку от вентиляторов свободно проходить через ребра радиатора и выводить воздух через заднюю часть. Кулер использует пять тепловых трубок для охлаждения не только GPU, но и чипов памяти и элементов цепи питания. Система охлаждения проще по сравнению с RTX 5090, где используется жидкий металл и испарительная камера, что логично — от этого GPU нужно отводить всего 360 Вт мощности вместо 575 Вт.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/b57tbm2vrf81o6c99s.jpg)
Дополнительное питание видеокарты подаётся через 16-контактный разъем. В комплекте Founders Edition — переходник с двух 8-контактных разъемов на 16-контактный. Новая модификация отличается лучшим качеством, мягкими кабелями и разъемами. 16-контактный разъем расположен под углом 45 градусов, как в RTX 3090 FE. Founders Edition имеет освещенный логотип GeForce RTX и области вокруг воздуховодов, светодиоды свечение статичное, изменить цвет или яркость нельзя, отключить его тоже нет возможности.
Для подключения мониторов карта имеет три разъема DisplayPort 2.1b и один HDMI 2.1b. Единственный неудобство – компактность конструкции. Все тестеры считают RTX 5090 FE громкой, а RTX 5080 FE хоть и тише флагмана, но не достаточно тихой из-за малого размера системы охлаждения. Впрочем, у пользователя есть выбор: если важен размер карты, то FE – неплохой вариант, но для по-настоящему тихой системы охлаждения лучше выбрать трех-четырехслотовые карты от партнеров. Одну из таких сегодня тестируем.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ooybbg209g9l83zl5h.jpg)
Различные партнеры Nvidia представили на рынок модели GeForce RTX 5080 собственной разработки с разными характеристиками: разогнанными версией, системами питания и охлаждения. Графические процессоры новой модели уже доступны в модификациях от таких брендов, как Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и других.
Особенности архитектуры Blackwell
В серии видеокарт GeForce RTX 50 используются графические процессоры GB20x, построенные на новой графической архитектуре Blackwell. Графический процессор GB203, лежащий в основе модели GeForce RTX 5080, обладает всеми возможностями и особенностями флагманского GB202, который установил рекорд по сложности и размеру среди игровых GPU.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/b1gforu1gu9vca061l.png)
GB203 по размерам и количеству транзисторов очень напоминает AD103, который используется в GeForce RTX 4080. Оба чипа обладают схожим количеством исполнительных блоков и производятся с применением TSMC — 4N техпроцесса. Кристалл GB203 имеет площадь 378 мм² и содержит 45,6 млрд транзисторов, в то время как AD103 занимает площадь 378,6 мм² и включает 45,9 млрд транзисторов. Применяемый техпроцесс является специализированным вариантом 5-нанометрового EUV-техпроцесса TSMC. Несмотря на это, линейка видеокарт GeForce RTX 50 не сильно отличается от предыдущей.
Высокоуровневое строение графических процессоров Nvidia с архитектурой Ampere не меняется. Как и все графические процессоры компании, чип GB203 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC). Внутри кластера TPC содержатся потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Кластер GPC самостоятельно производит основные вычисления, включая работу собственного движка растеризации Raster Engine, нескольких кластеров TPC, состоящих из вдвое большего количества мультипроцессоров SM.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/yp0cst6zytx8ymxhcv.png)
Модель видеокарты GeForce RTX 5080 основана на графическом процессоре GB203, содержащем семь вычислительных кластеров GPC с 42 кластерами TPC и всего 84 мультипроцессора SM, все из которых активны в RTX 5080. Каждый SM включает 128 CUDA-ядер, что делает полную версию чипа состоящей из 10752 CUDA-ядер – на 5% больше, чем у RTX 4080 Super (10240). В состав также входят 84 RT-ядра, 336 тензорных ядер, 336 текстурных блоков TMU и 112 блоков ROP. Общий объем L2-кэша остался прежним – 64 МБ. Подсистема памяти включает L1-кэш объемом 10752 КБ и регистровый файл объемом 21504 КБ, что немного больше, чем у AD103.
Пропускная способность памяти новинки значительно возросла по сравнению с GeForce RTX 4080. Ширина шины осталась прежней — восемь 32-битных каналов на 256 бит, но используется новая GDDR7-память с эффективной частотой в 30 ГГц. В итоге получается 960 ГБ/с пропускной способности памяти — на треть больше, чем у RTX 4080 и почти как у RTX 4090.
Разберём внутреннее устройство решений Blackwell. Новые GPU не сильно отличаются от Ada Lovelace по пиковым показателям, если не брать топовый GB202, но в них внедрили множество изменений и улучшений, направленных на будущее.
Каждый кластер GPC графического процессора включает отдельный движок растеризации Raster Engine, два раздела ROP по восемь блоков каждый, а также шесть или восемь кластеров TPC — в топовом GB202 их восемь, а в рассматриваемом GB203 — шесть. В каждом кластере TPC находится один движок PolyMorph Engine и два мультипроцессора SM.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/s1c3jy8qlktebisixo.png)
Потоковые мультипроцессоры SM выступают главными компонентами графических процессоров Nvidia, обеспечивая параллельное выполнение на разных ядрах (CUDA, Tensor, RT). Функции планирования выполнения варпа также возложены на их плечи. Устройство разделено на четыре сектора, каждый с собственным регистровым файлом, планировщиком и диспетчером.
Четыре сектора совместно используют 128 КБ L1-кэша и четыре текстурных модуля TMU.
Мультипроцессор Blackwell имеет несколько вычислительных блоков, включая тензорное ядро и два набора из 16 блоков ALU — SIMD16. В отличие от Ada Lovelace, где лишь один блок SIMD16 выполнял целочисленные расчеты, оба блока в Blackwell одинаковые и могут выполнять как FP32-операции, так и INT32. На схемах Nvidia все ALU в разделах SM объединены в один SIMD, но на самом деле их два. Строение мультипроцессоров SM осталось практически неизменным: две SIMD, каждая состоящая из 16 блоков FP32/INT32. Унифицированные ядра FP32/INT32 могут работать только как FP32- или INT32-ядра каждый цикл. Повышение целочисленной вычислительной производительности может ускорить задачи, например, расчет аргументов, адресов и указателей.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/jpg3zs90n17xt8n7wq.png)
В каждом SM четыре тензорных ядра могут выполнять 1024 инструкции FMA с точностью FP16 за такт. Нововведение — удвоение скорости операций над данными с точностью FP4. Остальные изменения в мультипроцессорах SM отсутствуют: четыре блока для специальных функций, L1-кэш и регистровый файл остались прежними.
По сравнению с Ada пиковая производительность Blackwell изменилась только для вычислений INT32 — удвоено выполнение, так же как и для матричных FP4-вычислений.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/x22b4gp56obyojnzjr.png)
Разработка и оптимизация мультипроцессора в Blackwell для эффективного применения нейронных шейдеров дополнили стандартные оптимизации, применяемые к Ada и предыдущим архитектурам. Мультипроцессоры Blackwell обеспечивают удвоенную производительность точечных выборок из текстур за такт по сравнению с Ada, что ускоряет некоторые операции доступа к текстурам в алгоритмах, таких как стохастическая фильтрация текстур, используемая в новых методах нейронного текстурного сжатия.
В мультипроцессорах тензорные ядра предназначены для математических действий умножения и суммирования матриц, применяемых в приложениях ИИ и высокопроизводительных вычислениях.
Эта специализация важна для обучения и использования нейросетей. Как и предыдущие GPU, тензорные ядра Blackwell поддерживают операции FP16, BF16, TF32, INT8, INT4 и FP8. Впервые добавлена поддержка операций с меньшей точностью FP4.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/i641w22lz2jtggmjv9.jpg)
Генеративные модели ИИ, такие как Stable Diffusion, создают изображения по текстовым описаниям. По мере усложнения и масштабирования моделей возрастают требования к скорости вычислений. В тензорные ядра семейства Blackwell добавили поддержку FP4-вычислений. Менее точное квантование уменьшает размер моделей. По сравнению с FP16, используемой большинством моделей, FP4 в два раза сокращает потребление памяти, что позволяет графическим процессорам RTX 50 обеспечивать вдвое более высокую производительность по сравнению с предыдущим поколением GPU при использовании сниженной точности.
Этот вариант не подойдет во всех ситуациях, но благодаря использованию качественного квантования в TensorRT Model Optimizer скорость вычислений увеличивается при меньших требованиях к памяти. По заявлениям Nvidia, это не приводит к большой потере качества итогового результата. Например, модель FLUX.dev (Black Forest Labs) при использовании FP16 требует более 23 ГБ видеопамяти и запускается только на GeForce RTX 4090 и профессиональных графических процессорах с аналогичным объемом памяти. С FP4 для запуска FLUX.dev требуется менее 10 ГБ, что позволяет запустить ее локально на большем количестве видеокарт GeForce RTX с памятью от 12 ГБ.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/mc9y1lbiv82z82mz8o.jpg)
Если модель FLUX.dev при точности FP16 на GeForce RTX 4090 создает изображения с заданными параметрами за 15 секунд, то на GeForce RTX 5090 с точностью FP4 такое же изображение генерируется уже за 5 секунд — заметное ускорение, особенно при работе в течение минут или даже часов. Несмотря на поддержку запуска моделей ИИ с точностью FP4 и на старых графических процессорах Nvidia, только на решениях Blackwell это имеет смысл из-за встроенной поддержки операций FP4. На более старых GPU такие операции выполняются в режиме эмуляции, что приводит к еще меньшей скорости по сравнению с FP8.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/a4k4h1mlmkvll7oskw.png)
Новый тип видеопамяти — GDDR7
GeForce RTX 50 стала первым видеоадаптером, поддерживающим видеопамять GDDR7 с повышенной пропускной способностью. Nvidia долгие годы сотрудничает с Micron для разработки передовых технологий графической памяти. Для архитектуры Ampere Nvidia и Micron выпустили память GDDR6X и продолжили работу над еще большей скоростью для решений Ada. В результате была достигнута эффективная скорость GDDR6X-памяти до 22,4 Гбит/с, а флагманская видеокарта GeForce RTX 4090 имела пропускную способность памяти до 1 ТБ/с. Архитектура Blackwell получила поддержку нового стандарта памяти GDDR7, использующего технологию передачи сигналов PAM3 — компромиссное решение между технологиями PAM4 и PAM2.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ung8r0btnok9ibxlnv.png)
Новый стандарт памяти отличается от GDDR6 и GDDR6X, которые применяла только Nvidia. GDDR до шестой версии кодирует сигнал амплитудно-импульсной модуляцией с двумя уровнями сигнала — PAM2. Видеопамять GDDR6X различает уже четыре уровня сигнала, передавая два бита за цикл при помощи кодирования PAM4. Новый стандарт не способен работать на такой высокой скорости, как GDDR6, и по скорости передачи данных был близок к нему. Из-за сложности и повышенного энергопотребления GDDR6X понадобился новый стандарт — GDDR7. Эта память стандартизирована JEDEC, ее выпускают уже несколько компаний, а не одна Micron. Новый интерфейс использует что-то среднее между кодированием PAM2 и PAM4 с тремя уровнями сигнала, передавая три бита данных за два цикла. Главное отличие — новая память менее требовательна к отношению сигнал/шум по сравнению с GDDR6X, поддерживает коррекцию ошибок и использует пониженное напряжение.
Изменения позволили GDDR7 достичь значительно более высокой пропускной способности по сравнению с предшественницами. Усовершенствования также повысили энергоэффективность, предлагая отличную производительность при относительно низком потреблении энергии, чего не могла похвастаться GDDR6X. В итоге видеокарты семейства GeForce RTX 50 оснащены памятью GDDR7 со скоростью до 30 Гбит/с, а новый флагман обеспечивает пиковую пропускную способность памяти в 1,792 ТБ/с. GeForce RTX 5080 комплектуется 30 Гбит/с памятью GDDR7, которая обеспечивает пиковую пропускную способность памяти 960 ГБ/с — почти как у предыдущего флагмана.
Трассировка лучей и улучшенная геометрия
Nvidia непрерывно совершенствует производительность аппаратной трассировки лучей, повышая как общую скорость, так и предлагая новые возможности для расширения функционала этих блоков. В графических процессорах Nvidia RT-ядра включают специализированные блоки для ускорения обработки структур данных Bounding Volume Hierarchy (BVH) и выполнения проверки пересечения луча с треугольником или ограничивающим прямоугольником. Благодаря выполнению основных функций трассировки лучей аппаратными блоками, мультипроцессоры SM освобождаются для других задач — работы пиксельных, вершинных и вычислительных шейдеров.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ylekzuxhtvocbifmvp.png)
Проверка пересечения луча и треугольника — сложная вычислительная операция, часто встречающаяся при рендеринге сцен с трассировкой лучей. По заявлениям Nvidia, четвёртое поколение RT-ядер в архитектуре Blackwell обеспечивает вдвое большую производительность по сравнению с Ada Lovelace при проверке пересечения луча и треугольника. Количество тестов пересечения с ограничивающими боксами Nvidia не разглашает. RT-ядра Ada и Blackwell содержат специальный блок Opacity Micromap Engine, ускоряющий проверку пересечений для полупрозрачных объектов. Также новые RT-ядра в Blackwell включают Triangle Cluster Intersection Engine, ускоряющий трассировку лучей при использовании Mega Geometry, и блок Linear Swept Spheres для аппаратного ускорения трассировки тонкой геометрии, такой как волосы.
Mega Geometry Новая технология компании основана на расширениях API RTX и аппаратных блоках Blackwell, повышающих геометрическую детализацию в приложениях с трассировкой лучей.
Технология позволяет игровым движкам с современными системами уровня детализации, такими как Nanite в Unreal Engine 5, отслеживать лучи для всей геометрии без упрощений. Количество треугольников в играх постоянно растет, а Nanite позволяет создавать большие открытые миры с сотнями миллионов треугольников.
Увеличение сложности игровых сцен приводит к экспоненциальному росту затрат на построение иерархии BVH для разных уровней детализации, что мешает достичь высокой частоты кадров при трассировке лучей. Каждый уровень детализации усложняет генерацию ускоряющих структур BVH, поэтому обычно используется упрощенная геометрия.
Технология Mega Geometry ускоряет создание BVH и позволяет работать с сотнями миллионов анимированных треугольников. Она обновляет определённые кластеры треугольников на GPU партиями, уменьшая нагрузку на CPU. Mega Geometry появится в Nvidia RTX версии Unreal Engine (NvRTX), и разработчики игр смогут использовать Nanite с полной трассировкой лучей для каждого треугольника. В существующих играх поддержка мегагеометрии ожидается в будущем в Alan Wake 2.
Две основные проблемы мешают интеграции трассировки лучей в системы типа Nanite и Mega Geometry решает обе. Первая — обновления уровней детализации на основе кластеров. Игровые движки обычно изменяют уровень сложности объектов в зависимости от их расстояния до камеры, меняя число треугольников. Традиционные методы используют ограниченное количество уровней разной геометрической сложности, но системы вроде Nanite обновляют детальность постепенно, заменяя геометрию небольшими группами по 128 треугольников — кластерами. Изменение конфигурации кластеров, составляющих объект, может происходить каждый кадр для плавного изменения детализации. Но для трассировки лучей нужна отдельная структура данных — иерархия ограничивающих объемов (BVH). Многочисленные сборки BVH, которые Nanite запускает при большом количестве объектов с большим количеством полигонов, могут перегрузить все реализации аппаратной трассировки лучей — производительность нынешнего оборудования для этого явно недостаточна.
Технология Mega Geometry открывает новые возможности при построении структур BVH, использующих кластеры треугольников в качестве элементов — структуры ускорения на уровне кластера (CLAS). Такие структуры могут быть сгенерированы из групп до 256 треугольников. Наборы CLAS служат входными данными для создания BVH и генерируются по запросу при загрузке объекта, а затем кэшируются для использования в последующих кадрах. Благодаря тому, что каждый CLAS состоит из сотен треугольников, время обработки сокращается на порядки по сравнению с традиционными методами. Игровой движок может переключать уровни детализации, реконструируя структуры BVH из CLAS.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/u9faskr9dxf3pdqct4.jpg)
Технологии API Mega Geometry разработаны для пакетной обработки. Входные параметры всех технологий хранятся в памяти GPU, что позволяет игровому движку выполнять подбор уровня детализации, анимацию, отбрасывание невидимых объектов и другие операции непосредственно на GPU. Это минимизирует расчеты на CPU.
Благодаря этому Mega Geometry почти исключает использование ресурсов CPU для управления структурами BVH.
Также сокращается объем видеопамяти — например, при использовании Nanite из Unreal Engine 5 сразу на несколько сотен мегабайт, по оценке Nvidia.
Гибкая генерация кластеров на видеокартах совместно с быстрым построением структур BVH расширяет возможности использования различных представлений геометрии, таких как разделяемые поверхности. Subdivision SurfacesВ приложениях серьезного рендеринга давно применяются алгоритмы Subdivision Surfaces, обеспечивающие высокое качество поверхностей при сохранении эффективности моделирования и анимации. В профессиональной 3D графике широко используется алгоритм разбиения поверхностей, который криволинейные поверхности воспроизводит путем рекурсивного усложнения сетки из полигонов. При аппаратной трассировке поверхности Subdivision Surfaces необходимо будет разбить кривые поверхности на треугольники (тесселяция), что приведет к усложнению структур BVH и их перестроению каждый кадр. Ускорение этого процесса возможно с помощью тех же полигональных кластеров CLAS, кэшированных в памяти.
Рассматривание света таких поверхностей обычно начинается с их разделения на треугольники для ускорения вычислений на GPU. Во время анимации или изменения точки обзора объект неоднократно делится на треугольники, что приводит к большому количеству обновлений BVH и снижает производительность. Возможности Mega Geometry позволяют программе сразу же сопоставлять разбиение на треугольники с формированием кластеров и быстро строить BVH из структур CLAS, повышая производительность и открывая возможность применения такого представления геометрии в реальном времени приложениях с использованием аппаратной трассировки лучей.
Эффективное использование трассировки лучей затрудняется большим количеством объектов на сцене. Движки для игр с высокой геометрической детализацией обычно применяют много объектов и строят ускоряющие структуры верхнего уровня TLAS из всех объектов в каждом кадре. Это работает неплохо до нескольких тысяч объектов, но не больше. Mega Geometry предлагает решение — новый тип структуры верхнего уровня — Partitioned Top-Level Acceleration Structure (PTLAS). Вместо того, чтобы строить новый TLAS с нуля каждый кадр, PTLAS использует то, что большинство объектов на сцене могут быть статичными. Это упрощает генерацию структур BVH: графический процессор получает прямой доступ к ним и выполняет работу над ними, используя изменения. Неизменные объекты можно вынести в разделы BVH и не перестраивать их без необходимости.
В обновленных RT-ядрах добавили функцию проверки пересечения луча с геометрическими простыми. Linear Swept Spheres (LSS)Предлагаемая схема от Nvidia использует сферы в линейных сегментах, этап рендеринга поддерживается Blackwell аппаратно, что позволяет производить визуализацию волос в два раза быстрее, при этом для хранения геометрии требуется в несколько раз меньше видеопамяти.
Использование Mega Geometry значительно повышает возможности трассировки лучей, применяя более эффективный геометрический конвейер по сравнению с традиционным. Технология доступна во всех API трассировки лучей, поддерживаемых Nvidia: DirectX 12 — через NVAPI с поддержкой кластеров и PTLAS, Vulkan — через расширения Nvidia для кластеров и PTLAS, OptiX 9.0 с родной поддержкой кластеров. В данный момент это собственные API компании, но Nvidia, вероятно, работает над интеграцией этих возможностей в стандартные Direct3D и Vulkan.
В заключение самое важное и приятное: технологии Mega Geometry поддерживаются всеми графическими процессорами RTX, начиная с Turing, но с разной производительностью и эффективностью. RT-ядра четвертого поколения в Blackwell специально разработаны для более эффективной работы Mega Geometry, имея кластерные движки для реализации схем сжатия геометрии и обработки BVH, хотя предыдущие GPU также справятся с задачей.
Усовершенствованная технология повышения производительности DLSS 4
Новый поколение графической архитектуры улучшило технологию DLSS, которая выпустила четвертую версию. В Ada Lovelace появилась генерация промежуточного кадра, а в новом поколении нейросеть способна вставить несколько кадров — до трех. Алгоритм генерации кадров также изменился и выполняется быстрее, расходуя меньше видеопамяти по данным Nvidia. DLSS 4 с помощью многокадровой генерации позволяет добиться значительно большей частоты кадров по сравнению с традиционным рендерингом, обеспечивая максимальное качество трассированной картинки для 4K-разрешения при 240 FPS.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/1r3ivhtlirvardqqm2.jpg)
В DLSS 3 для создания дополнительного кадра используются данные игры, такие как векторы движения и глубина пикселей, а также оптический ускоритель потока. В DLSS 4 многокадровая генерация MFG объединяет новые аппаратные возможности Blackwell и программную модель, работающую на 40% быстрее и использующую на 30% меньше видеопамяти. Эта модель запускается один раз на каждый отрисованный кадр для генерации нескольких дополнительных кадров, в то время как DLSS 3 FG запускалась бы многократно. Даже при генерации одного кадра новая модель обеспечивает чуть более высокую частоту кадров с меньшим объемом памяти.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/1nxncxus9okxytooqk.jpg)
Для эффективной работы многокадрового генератора нужны блоки из Blackwell — это улучшенные тензорные ядра с повышенной производительностью и AI Management Processor для распределения нагрузок ИИ и рендеринга по исполнительным ядрам GPU. Графическому процессору требуются пять моделей ИИ: для суперразрешения, реконструкции лучей и генерации нескольких кадров для каждого отрисованного кадра, всё это за несколько миллисекунд. В DLSS 3 для синхронизации вывода кадров на экран использовался CPU, что иногда приводило к нестабильной частоте кадров и неплавному отображению. Для улучшения этого при генерации нескольких кадров в Blackwell внедрили аппаратный блок Flip Metering, позволяющий более точно управлять синхронизацией дисплея.
Мы неоднократно отмечали, что генерация кадров увеличивает количество изображений в секунду, делая видеоряд более плавным. Однако это не уменьшает задержку ввода, которая зависит от времени между полноценными кадрами, отрисованными игровым движком. FG и MFG действительно делают изображение более комфортным для глаза, но отзывчивость не улучшается, если реальная частота кадров ниже определенного значения комфорта.
Это зависит от игры: иногда достаточно 30-40 FPS, а иногда нужны 60 FPS. Генерация кадров может даже немного увеличить время реакции, так как требует работы графического процессора над сгенерированными кадрами. В результате задержки могут незначительно возрасти. Для решения этой проблемы используется обновленная технология Reflex версии 2, которая позволяет смещать кадр в зависимости от действий игрока перед его отправкой на дисплей.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/c6xk6ucmox2f8ag8z0.jpg)
Рефлекс — технология для уменьшения задержки в играх, выпущенная в 2020 году. Технология синхронизирует работу процессора и видеопроцессора, выводя действия игрока на экран быстрее. Это дает преимущество в многопользовательских играх. За четыре года Рефлекс был интегрирован в более чем сто игр. Скоро в популярных играх появится вторая версия технологии — Рефлекс 2, которая может сократить задержку вывода еще сильнее. В Рефлексе 2 сочетается уже известный режим Рефлекс Low Latency с новой технологией Frame Warp, известной по VR, где также нужны минимальные задержки. Frame Warp ещё больше сокращает задержку путём обновления кадра на основе информации о действиях игрока прямо перед отправкой кадра на экран.
В DLSS 4 произошли существенные улучшения во всех технологиях: Ray Reconstruction, Super Resolution и DLAA. Ранее DLSS применяла сверточные нейронные сети (CNN) для генерации новых пикселей на основе анализа локального контекста и отслеживания изменений в последовательных кадрах. Новая модель трансформер точнее определяет значение каждого пикселя как в кадре, так и в нескольких кадрах. Модели DLSS 4 принимают вдвое больше параметров для более глубокого понимания сцены и используют большую вычислительную мощность тензорных ядер при реконструкции изображений с лучшим качеством в статике и динамике. Новая модель трансформер генерирует изображение более высокого качества, эффективно распознавая крупные паттерны, и лучше масштабируется.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/m9qey0nydlgimsokm2.jpg)
В играх с трассировкой лучей заметно выражен прирост качества благодаря новой модели трансформер.
Она существенно повышает качество реконструкции лучей при сложных условиях освещения.
Например, в сценах игры Alan Wake 2 сетчатое ограждение отрисовывается качественнее, снижается двоение и смазывание изображения на вращающихся лопастях вентилятора и других движущихся объектах, устраняется мерцание тонких линий электропередач. В игре Horizon Forbidden West новая модель ИИ улучшает детализацию текстур на одежде и аксессуарах главной героини, повышая четкость изображения в целом.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/56cg0hc8zumu2bow9m.jpg)
Реконструкция лучей улучшает качество изображения при использовании возможностей ИИ для генерации дополнительных пикселей в сценах с интенсивной трассировкой лучей: DLSS заменяет работу шумодавов обученной нейросетью, которая генерирует более качественные пиксели. Чем сложнее и интенсивнее трассировка лучей в сцене, тем заметнее прирост качества от новой модели, особенно это видно в сценах со сложным освещением. Модель трансформер для масштабирования Super Resolution показывает хорошие результаты на практике, обеспечивая лучшую временную стабильность, меньше ореолов и более высокую детализацию при движении.
Многокадровая генерация и новые модели трансформеров пригодятся в играх, поддерживающих более ранние версии DLSS, а на видеокартах серии GeForce RTX 50 её можно использовать сразу во множестве игр и приложений. Среди них — известные проекты: Alan Wake 2, Cyberpunk 2077, Indiana Jones and the Great Circle, Star Wars Outlaws, у которых есть встроенная поддержка многокадровой генерации. Black Myth: Wukong, Naraka: Bladepoint, Marvel Rivals и Microsoft Flight Simulator 2024 также получат поддержку в скором времени, а Black State, Doom: The Dark Ages и Dune: Awakening — с момента выхода в продажу.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/n6974i7ds805kgi9ll.jpg)
В играх с поддержкой старых версий DLSS можно применять новейшую технологию DLSS 4 благодаря новому механизму замены. DLSS OverrideВ настройках нового драйвера можно переопределить параметры DLSS для каждой поддерживаемой игры. Переопределение DLSS для генерации кадров включает многокадровую генерацию и доступно только на GeForce RTX 50, переопределение предустановок моделей ИИ включает последнюю модель генерации кадров для GeForce RTX 50 и RTX 40, а модель трансформера для суперразрешения и реконструкции лучей доступна всем пользователям GeForce RTX. Можно принудительно заставить DLSS работать в режиме DLAA или DLSS Ultra Performance, даже если эти режимы отсутствуют в настройках игры. Поддержка DLSS Override есть для 75 игр и приложений к моменту запуска, а новая реконструкция лучей на основе модели трансформера, Super Resolution и DLAA поддерживается более чем в 50 играх и приложениях.
Последняя версия драйвера получила ещё одну новую функцию. Nvidia Smooth MotionНовая модель ИИ в драйвере создает дополнительный кадр между двумя кадрами, генерируемыми игрой. Это возможность повысить частоту кадров в играх без поддержки DLSS за счет генерации одного промежуточного кадра. Smooth Motion можно включать в играх с родным разрешением и с технологиями сверхвысокого разрешения или другими методами масштабирования. Частота кадров увеличивается, но качество не такое высокое, как у полноценной генерации кадров DLSS. Тем не менее, интерполяция может смотреться неплохо. Smooth Motion доступен в настройках приложения Nvidia для совместимых DirectX 11 и DirectX 12 игр.
Новый тип шейдеров — нейронные шейдеры
Новое нововведение Blackwell весьма многообещающее и перспективное, но не дающее результата прямо сейчас. Nvidia предлагает новый вид шейдеров для того, чтобы нейросети напрямую участвовали в рендеринге, дополняя работу привычных вычислительных блоков. Компания изменила многое в игровой индустрии в 2018 году с выпуском первых видеокарт серии GeForce RTX, и тогда получила шквал критики за малый прирост производительности в существующих играх в погоне за «не нужной» (как казалось тогдашним критикам) аппаратной трассировкой, которую тогда использовали буквально в двух-трех играх. Но с тех пор уже несколько сотен игр и приложений используют трассировку лучей и технологии ИИ так или иначе, и они появились уже и в игровых консолях. Трассировка лучей и трассировка пути в реальном времени — это именно то, что приносит играм реалистичное изображение с максимально точной и достоверной имитацией реалистичного освещения, и игр с их поддержкой становится всё больше.
Сегодня трассировка лучей уже редко подвергается критике, поскольку подтвердила свою эффективность и широкое применение. Однако Nvidia, следуя своей традиции, продолжает искать для отрасли что-то свеженькое. И это нейронный рендеринг. RTX Neural Rendering Набор технологий искусственного интеллекта и рендеринга с ускоренной обработкой сложных сцен, а также реалистичной визуализацией объектов. Много архитектурных улучшений в Blackwell направлено на повышение производительности и эффективности новых типов шейдеров. Шейдеры чаще всего вычисляют уровни освещения и цвета для всех пикселей сцены, работая на GPU как часть графического конвейера.
Изначально использовались простые программы — конвейер с фиксированными функциями, где все операции графического конвейера предопределены и частично настраиваемы, но программировать их было невозможно. Новые GPU были заточены для выполнения конкретного набора операций. В GeForce 3 появились зачатки программируемого затенения и вершинных шейдеров. Позже применялся язык HLSL для затенения пикселей, в DirectX 10 — геометрические шейдеры, в DX11 — вычислительные шейдеры, а в DX12 — аппаратная трассировка лучей.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/88q99ncka6ndvya7de.jpg)
Нейронные шейдеры – следующий этап развития программируемых шейдеров, где модели ИИ заменяют сложные алгоритмы. Nvidia считает, что нейронные шейдеры станут доминирующей технологией в будущих играх.
Компания уже применяет нейросети в DLSS с помощью тензорных ядер. Новые возможности графических API обеспечат доступ к тензорным ядрам из любых типов шейдеров, включая пиксельные и трассировку лучей. Это позволит использовать преимущества нейросетей: сжатие текстур, Neural Materials, Neural Radiance Cache, RTX Skin и RTX Neural Faces.
Специализированные SDK позволят разработчикам обучать нейронные сети в шейдерах на GeForce RTX и ускорять их работу на тензорных ядрах.
Компрессия текстур RTX Neural Texture Compression (NTC) Искусственный интеллект применяет возможности сжатия текстур. «Нейронное» представление занимает в памяти в несколько раз меньше места, до семи раз по сравнению с традиционными блочными форматами, сохраняя качество. О volume данных для игр постоянно растет, большая часть из которых — именно текстуры. Это повышает требования к объему памяти графических процессоров и влияет на производительность из-за ограничений пропускной способности. Нейронное сжатие текстур использует нейросети из нейронных шейдеров для сжатия и распаковки, превосходя привычные методы. Демонстрация Nvidia Neural Materials использует 1110 МБ памяти для стандартных материалов фонаря и ткани, а с нейронными материалами та же картинка получается при использовании лишь 333 МБ — трехкратная экономия при более высоком качестве.
Также интересен подход стохастической фильтрации текстур. Stochastic Texture Filtering (STF)Метод стохастической фильтрации вводится для создания случайности в текстурных выборках, что уменьшает визуальные артефакты алиасинга и муара. Эта техника эффективна в ситуациях, где применение традиционных методов фильтрации, таких как трилинейная или анизотропная, нецелесообразно, например, при использовании нейронного сжатия текстур. Стохастическую фильтрацию также можно сочетать с аппаратной фильтрацией для достижения более высокого уровня обработки — кубической или гауссовой. На графических процессорах семейства Blackwell стохастическая фильтрация работает вдвое быстрее благодаря увеличению скорости выборки точек из текстур в два раза по сравнению с предыдущими поколениями GPU.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/1pes6ozov6lw85crye.jpg)
Нейроматериалы Neural Materials Искусственный интеллект используется для оптимизации сложного шейдерного кода многослойных материалов, таких как фарфор и шелк, ускоряя отрисовку в несколько раз и снижая ресурсоемкость рендеринга. Для некоторых материалов, состоящих из нескольких слоев, трассировка лучей для каждого слоя слишком затратна. Методы ИИ могут заменить математическую модель материала нейронной аппроксимацией, обеспечивая качественное отрисовку с высокой частотой кадров.
Neural Radiance Cache (NRC) Шейдер для кэширования и аппроксимации информации об освещении использует нейросети, обученные на игровых данных, для точной отрисовки непрямого освещения. С его помощью можно сохранять информацию о сложном освещении и использовать её для создания качественного глобального освещения при рендеринге реального времени. Шейдер частично трассирует один-два луча, сохраняет данные в кэше и затем выводит условно бесконечное количество отскоков лучей для реалистичного представления непрямого освещения. Это одновременно улучшает качество непрямого освещения при трассировке пути и повышает производительность, так как трассируется меньше лучей. Шейдер доступен через RTX Global Illumination SDK и будет применяться в Portal RTX, а затем и в RTX Remix.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/viur014zwj2b11trxq.jpg)
Нейронный шейдер NRC использует результат трассировки пути после одного отскока луча и выдает значения освещения для множества отскоков. NRC обучает малые нейронные сети на игровых данных в реальном времени и имитирует трассировку пути с большим количеством отскоков, помещая данные в кэш. Поскольку сеть обучается во время игры, NRC постепенно подстраивается для получения точного профиля глобального освещения для разных игровых сцен.
Точный отображение кожи — одна из известных проблем 3D-графики. Если рисовать ее без учета полупрозрачности, как будто она непроницаема для света, как дерево или металл, то изображения людей будут выглядеть неестественно. В реальности свет проникает под кожу и рассеивается внутри, излучаясь затем в других участках. Традиционные методы рендеринга недостаточно точно моделируют взаимодействие света с кожей, поэтому для улучшения часто используют метод подповерхностного рассеяния (SSS). RTX Skin В играх подповерхностное рассеяние можно использовать вместе с трассировкой лучей для имитации проникновения света в полупрозрачные материалы.
Результат — более мягкий и реалистичный внешний вид кожи, не только человеческой.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/0633ryenkmvktocbkc.jpg)
Реалистичная визуализация человеческих лиц при рендеринге в реальном времени представляет собой ещё большую сложность. Люди мгновенно замечают любые дефекты на лицах, даже самые незначительные. Для этого есть термин «Зловещая долина» — когда искусственный человек выглядит очень похоже на настоящего, но при этом не точно как настоящий, и эта небольшая разница вызывает у наблюдателей большее отторжение, чем если бы объект совсем не был похож на человека. В кинофильмах проблему решили со временем, но это обычно требует огромных вычислительных ресурсов.
RTX Neural Faces Предлагается новый подход к повышению качества рендеринга лиц с использованием генеративного искусственного интеллекта. В качестве входных данных используется простое растровое изображение лица вместе с информацией о его положении в пространстве (поза, поворот и так далее), а модель генеративного ИИ применяется для отрисовки более естественных лиц. Нейросеть может обучаться на основе тысяч изображений лица под любым углом, при разном освещении, выражении разных эмоций и так далее.
В качестве данных могут использоваться как реальные фотографии, так и высококачественные изображения, сгенерированные за длительное время. Обученная модель оптимизируется Nvidia TensorRT и используется для отрисовки лиц в режиме реального времени — это значительный шаг на пути к переопределению графики при помощи генеративного ИИ в режиме реального времени.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/vrw0woh8u14qlt3j9v.jpg)
RTX Neural Faces можно дополнить RTX Character Rendering SDK Для отрисовки реалистичных волос и кожи, что представляет собой не простую задачу, применяются методы отрисовки прядей. Реалистичные методы отрисовки волос на основе прядей требуют до 30 треугольников на прядь и под 4 миллиона треугольников для всех волос. Это делает трассировку лучей весьма сложной. Linear-Swept Spheres (LSS)Технология, уменьшающая объем геометрии при рендеринге волос, заменяет треугольники сферами и обеспечивает ускоренное отрисовка волос с трассировкой лучей на GeForce RTX 50, повышая производительность.
Существует множество методик применения нейронных шейдеров. Nvidia приводит лишь несколько примеров из своей практики. Нейронные шейдеры могут отрисовывать сложные многослойные материалы или материалы, для которых важен расчет подповерхностного рассеивания света, без необходимости точных физических расчетов с помощью тензорных блоков.
Возникает вопрос: зачем упрощать рендеринг, если мы перешли к физически корректной трассировке лучей? Ключ в том, чтобы получить изображение, аналогичное результату точного физического расчета. Если да, то пользователю все равно, была ли это полноценная трассировка пути или ее имитация при помощи нейросетей.
В отличие от хаков растеризации, которые часто создают неправдоподобное и нереалистичное изображение, нейронные шейдеры могут в некоторых случаях имитировать аналогичный результат с приемлемой точностью, чем упростить вычислительную нагрузку при создании полностью корректных расчетов трассировкой лучей.
Технологии нейронного рендеринга – это прекрасно и перспективно, но увидеть их в играх сегодня или завтра едва ли удастся. В будущем они обязательно появятся, но на первых порах, скорее всего, штучно, чтобы продемонстрировать возможности технологии. Для широкого распространения требуется поддержка не только разработчиков игр, но и графических API. Пока можно использовать NVAPI и расширения Nvidia для Vulkan, но было бы замечательно получить полноценную поддержку от DirectX.
Позитивно, что компания Nvidia сотрудничает с Microsoft для внедрения поддержки этой функциональности. Cooperative VectorsНововведение даст возможность перемножать матрицы любых размеров в шейдерном коде, что важно для работы нейросетей. Это откроет возможности тензорных ядер GeForce RTX и позволит разработчикам игр ускорить нейронные шейдеры на решениях Nvidia, а затем и на графических процессорах других производителей. Другие производители графических процессоров вынуждены будут добавить поддержку Cooperative Vectors в своих решениях, что в конечном итоге выгодно всей индустрии. Пока же эта возможность доступна только для решений Nvidia и вряд ли получит широкое распространение, хотя перспективы технологии впечатляют.
Другие изменения и улучшения
В графических процессорах, разработанных по архитектуре Ada Lovelace, стала доступна возможность динамической перегруппировки инструкций. Shader Execution Reordering (SER)Технология повышает связность доступа к данным в задачах, таких как выполнение пиксельных шейдеров для отраженных лучей. В архитектуре Blackwell эффективность SER удвоилась, что благоприятно влияет на загрузку работой тензорных ядер при выполнении нейронных шейдеров. Новая архитектура Blackwell также получила программируемый планировщик контекста. AI Management Processor (AMP)Архитектура построена на ядре RISC-V. Ранее существовали GPU с похожим планировщиком, но AMP более гибко и эффективно распределяет время GPU между различными задачами.
Технология Shader Execution Reordering (SER) позволяет при трассировке лучей перестраивать потоки вычислений на GPU для оптимального использования аппаратных возможностей. Динамический порядок работы особенно эффективен в сложных задачах, таких как трассировка пути. Потоки, выполняющие нейронные задачи когерентно, могут быть направлены в тензорные ядра, что значительно ускоряет и нейронное затенение. SER был улучшен в Blackwell, как аппаратными, так и программными средствами. Основная логика переупорядочения SER в Blackwell вдвое эффективнее, что снижает затраты на перестраивание. Приложения управляют SER с помощью небольшого API, что позволяет разработчикам точнее применять переупорядочение. Несколько игр с реализацией трассировки пути уже используют SER.
В контроллере вывода на дисплеи и медиадвижках GeForce RTX 50 внесены изменения. Графические процессоры Blackwell получили поддержку разъемов для вывода изображения. DisplayPort 2.1bДанные кабели обеспечивают пропускную способность до 80 Гбит/с в режиме передачи UHBR 20, что дает возможность использовать дисплеи с высоким разрешением и частотой обновления: 8K при 165 Гц (с DSC) и 4K при 480 Гц (также с DSC). В более привычных ситуациях такая пропускная способность позволяет подключать 8K-дисплей с частотой обновления 60 Гц по одному кабелю.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/f0nn71ux05km2p2aua.png)
Новое поколение видеокарт GeForce RTX 50 поддерживает кодирование и декодирование видео с цветовой субдискретизацией 4:2:2 для форматов H.264 и H.265. Ранние архитектуры GPU, такие как Ada Lovelace, работали только с 4:2:0 для этих форматов. Новое поколение видеокарт обеспечивает кодирование и декодирование с лучшим качеством благодаря поддержке 4:2:2.
Формат 4:4:4 сохраняет полное значение каждого цветового канала, но это увеличивает размер файлов и пропускную способность при передаче данных. Цветовая субдискретизация снижает эти требования, храня меньше информации о цветности. В формате 4:2:0 сохраняются только данные яркости, а каналы цветности содержат лишь 25% исходной цветовой информации. Формат 4:2:2 предлагает компромисс между сохранением цветовой информации и уменьшением размера файла, храня половину исходной цветовой информации.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/e3707o1tnuxlpay11d.png)
Этот формат обеспечивает лучшее качество и популярен в дорогих полупрофессиональных и профессиональных видеокамерах. Однако программная обработка таких видеоданных затруднена из-за высокой ресурсоемкости. 4:2:2 предоставляет вдвое больше информации о цвете при всего лишь на 30% большем размере файла по сравнению с 4:2:0. Эта дополнительная цветовая информация особенно полезна для HDR-контента и сохранения мелких деталей. На GPU без аппаратной поддержки используется программное декодирование 4:2:2, что создает довольно высокую вычислительную нагрузку. Аппаратная же поддержка декодирования 4:2:2 позволяет видеоредакторам с легкостью работать с таким контентом.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ctst06tedoardhvioe.png)
Программные возможности кодирования значительно медленнее аппаратных кодеров NVEnc 9-го поколения, доступных в решениях семейства Blackwell. Старшая модель из анонсированных решений семейства Blackwell оснащена двумя декодерами NVDec, подобными тем, что есть в Ada Lovelace, но производительность при обработке видеоданных в формате H.264 возросла вдвое. Чипы содержат разное количество кодировщиков видео: в топовом кристалле GB202 их три, а в GB203 — два блока NVEnc. Также появился новый режим… AV1 Ultra High Quality (UHQ)Предложенный вариант более строгий, но повышает качество изображения незначительно.
Предварительная оценка производительности
Теоретические характеристики новых видеокарт GeForce RTX 50, работающих на основе трёх графических процессоров GB20x, помогут увидеть их различия.
RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 | |
---|---|---|---|---|
Графический процессор | GB202 | GB203 | GB203 | GB205 |
Транзисторов, млрд. | 92,2 | 45,6 | 45,6 | 31,1 |
Площадь чипа, мм² | 750 | 378 | 378 | 263 |
Количество ядер CUDA | 21760 | 10752 | 8960 | 6144 |
Количество блоков TMU | 680 | 336 | 280 | 192 |
Количество блоков ROP | 176 | 112 | 96 | 80 |
Количество RT-ядер | 170 | 84 | 70 | 48 |
Тензорные ядра | 680 | 336 | 280 | 192 |
Турбо-частота, ГГц | 2,41 | 2,62 | 2,45 | 2,51 |
Объем памяти, ГБ | 32 | 16 | 16 | 12 |
Шина памяти, бит | 512 | 256 | 256 | 192 |
Пропускная способность, ГБ/с | 1792 | 960 | 896 | 672 |
Энергопотребление, Вт | 575 | 360 | 300 | 250 |
Цена, $ | 1999 | 999 | 749 | 549 |
Процессор GB202, лежащий в основе видеокарты RTX 5090, установил рекорд сложности для игровых GPU — 92,2 млрд транзисторов. Это значение близко к значению чипа GB100 — специализированного вычислительного чипа той же архитектуры Blackwell, состоящего из 104 млрд транзисторов. По площади кристалла GB202 (750 мм²) немного уступает чипу TU102 архитектуры Turing (754 мм²).
Флагманское решение включает 192 потоковых мультипроцессора SM, что суммарно дает 24576 CUDA-ядер. Другие характеристики этого GPU также впечатляют. У него 512-битный интерфейс памяти, который в сочетании с памятью GDDR7 обеспечивает очень высокую пропускную способность — 1792 ГБ/с. В остальном топовый GPU явно ограничен возможностями техпроцесса: если Ada Lovelace с большим шагом по микроэлектронному производству позволил повысить вычислительную мощность более чем на 70%, то GB202 превосходит своего предшественника лишь на треть. Инженерам Nvidia удалось разместить на той же площади больше ALU и других блоков, но не увеличить плотность транзисторов на площадь кристалла.
Другие чипы игровой серии Blackwell обладают менее впечатляющими характеристиками по сравнению с самым быстрым GPU. GB203 в два раза меньше флагмана по площади, сложности и количеству вычислительных блоков.
По сравнению с AD103 предыдущего поколения примерно того же уровня позиционирования он не сильно выделяется. Кроме того, шина памяти у GB203 вдвое уже — всего 256 бит. Вместе с GDDR7-памятью это не является узким местом для решения такого уровня.
Если сравнивать новинку с GeForce RTX 4080 и RTX 4080 Super, то ее тактовая частота лишь немного выше, а рост пиковой производительности не превышает 10%-15%. В играх без использования новых технологий RTX 5080 вряд ли существенно превзойдет графические процессоры предыдущего поколения того же уровня.
GeForce RTX 5080 оснащён 16 ГБ GDDR7-памяти с эффективной частотой 30 ГГц, подключённой по 256-битной шине. Это обеспечивает пропускную способность в 960 ГБ/с, на треть превышающую пропускную способность модификаций RTX 4080. Прирост производительности может привести к соответствующему росту частоты кадров, но не выше 25%-30% в большинстве случаев. Только в самых сложных играх с трассировкой лучей прирост составит более 15%-20%. Улучшения также возможны в играх с расчётом глобального освещения, учитывающим большое количество просчитываемых отражений лучей, поскольку эти алгоритмы часто сталкиваются с ограничением по пропускной способности памяти.
При показателе энергопотребления в 360 Вт, превышающем 320 Вт у предшественников, для многих читателей новая модель выглядит скорее как GeForce RTX 4080 Ti, чем как RTX 5080. Nvidia оставила рекомендованную цену в $999, поэтому на некую улучшенную RTX 4080 Ti она вполне похожа. Но всё же аппаратные улучшения в графической архитектуре есть, и немалые, поэтому это скорее именно RTX 5080, но… лишь с косметическими аппаратными изменениями. К сожалению, в этом поколении очень сильно вырос разрыв между RTX 5080 и RTX 5090 — у флагмана все характеристики вдвое или почти вдвое лучше, и объем памяти с ПСП в том числе. Правда, и цена отличается ровно вдвое.
Технический прогресс несколько замедлился по объективным причинам. Рост чистой производительности GPU не может происходить прежними темпами, как в предыдущих поколениях. Специалистам Nvidia пришлось выжимать максимум из имеющегося техпроцесса 5 нм при помощи новой функциональности. Blackwell отличается новыми возможностями технологии DLSS и внедрением нейронных шейдеров и других функций не просто так. Это продолжение движения в сторону того, чтобы рендеринг производился не только грубой силой традиционных исполнительных блоков с порой излишне сложной работой над изображением, но и дорисовыванием пикселей при помощи масштабирования и генерации дополнительных кадров при помощи технологии DLSS 4 уже сейчас, а в будущем — с широким использованием нейронных шейдеров.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/p7vqj2s3eeluq5d1jt.png)
Nvidia традиционно демонстрирует преимущество новой модели по сравнению с RTX 4080 в два и более раза, но этот прирост производительности не всегда объективен. Его расчет часто основывается на многокадровой генерации, а качество масштабирования может быть нестабильным, хотя DLSS 4 заметно его улучшил, устранив многие артефакты предыдущих версий. Иногда даже при высокой частоте кадров из-за работы MFG большие задержки ввода могут помешать комфортной игре, поскольку фактическая частота кадров оказывается ниже уровня минимального комфорта.
Чистая производительность графических процессоров всё ещё важна, а GeForce RTX 5080 по этому показателю не сильно превосходит RTX 4080. В прошлых поколениях увеличенной мощи RTX 4080 хватало, чтобы сравняться со старшим братом, но на этот раз RTX 4090 остаётся быстрее. Стоимость топовой модели прошлого поколения всё ещё высокая, а RTX 5080 по рекомендованной цене не отличается от предшественников этого уровня. Непонятно, по каким ценам реально будет купить решения новой линейки, ведь пока что их большой дефицит.
Особенности видеокарты Palit GeForce RTX 5080 GameRock с памятью 16 ГБ.
Сведения о производителеКомпания Palit Microsystems (торговая марка Palit) появилась в 1988 году на Тайване. Штаб-квартира расположена в Тайбэе, логистический центр — в Гонконге, а офис по продажам в Европе — в Германии. Производство налажено в Китае.
На российском рынке с 1995 года (сначала как безымянные продукты, под маркой Palit — после 2000). В 2005 году компания приобрела торговую марку Gainward и ряд активов у банкротящейся компании, образовав холдинг Palit Group. В Шеньжене открылся офис по продажам на китайском рынке. Сейчас в составе Palit Group несколько торговых марок и брендов. .
Объект исследованияВидеокарта Palit GeForce RTX 5080 GameRock с памятью GDDR7 объемом 16 ГБ и шиной 256 бит.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/0dx94bmu9p0knyligm.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/s58kz46i0vlxzonmr7.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/i2uiakqoydsrl50jf5.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/8uw4b0hb7om44g69t8.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/xe6lk9bir1lzf7p67n.jpg)
Видеокарта Palit GeForce RTX 5080 GameRock объемом памяти 16 ГБ с шиной GDDR7 шириной 256 бит. | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | GeForce RTX 5080 (GB203) | |
Интерфейс | PCI Express x16 5.0 | |
Частота работы GPU (ROPs), МГц | BIOS P: 2617(Boost)—2842(Max) BIOS S: 2617(Boost)—2842(Max) |
2617(Boost)—2850(Max) |
Тактовая частота памяти (в МГц) и эффективная скорость передачи данных (Гбит/с). | 1875 (30) | 1875 (30) |
Ширина шины обмена с памятью, бит | 256 | |
Число вычислительных блоков в GPU | 84 | |
Число операций (ALU/CUDA) в блоке | 128 | |
Суммарное количество блоков ALU/CUDA | 10752 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 336 | |
Число блоков растеризации (ROP) | 112 | |
Число блоков Ray Tracing | 84 | |
Число тензорных блоков | 336 | |
Размеры, мм | 330×150×71 | 310×120×40 |
Число слотов на материнской плате, занятых видеокартой. | 4 | 2 |
Цвет текстолита | черный | черный |
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S) | 346/347 | 360 |
Энергопотребление в режиме 2D, Вт | 37 | 37 |
Энергопотребление в режиме «сна», Вт | 10 | 10 |
Уровень шума при максимальной нагрузке в режиме работы 3D, измеряемый в децибелах (биос P и биос S). | 31,9/28,7 | 39,0 |
Уровень шума в 2D (просмотр видео), дБА | 18,0 | 18,0 |
Уровень шума в 2D (в простое), дБА | 18,0 | 18,0 |
Видеовыходы | 1×HDMI 2.1b, 3×DisplayPort 2.1b | 1×HDMI 2.1b, 3×DisplayPort 2.1b |
Поддержка многопроцессорной работы | нет | |
Количество дисплеев, которые можно подключить одновременно. | 4 | 4 |
Питание: 8-контактные разъемы | 0 | 0 |
Питание: 6-контактные разъемы | 0 | 0 |
Питание: 16-контактные разъемы | 1 | 1 |
Вес карты с комплектом поставки (брутто), кг | 3,22 | 2,9 |
Вес карты чистый (нетто), кг | 2,2 | 2,0 |
Максимальное разрешение/частота, DisplayPort | 3840×2160@240 Гц, 7680×4320@120 Гц | |
Максимальное разрешение/частота, HDMI | 3840×2160@144 Гц, 7680×4320@120 Гц | |
Предварительная цена видеокарт с чипом GeForce RTX 5080. | 180 000 рублей |
Память
![](https://digitalartspace.ru/wp-content/uploads/2025/02/5er5ttt5f9bn4i6c8s.jpg)
Карта вмещает 16 ГБ оперативной памяти GDDR7 SDRAM, распределённые по 8 микросхемам по 16 Гбит на верхней стороне платы. K4VAF325ZC-SC32Работают на номинальной частоте 1875 МГц с эффективной скоростью передачи данных 32 Гбит/с.
Характеристики карты и её отличие от Palit GeForce RTX 4080 Super GamingPro (с памятью на 16 ГБ).
![](https://digitalartspace.ru/wp-content/uploads/2025/02/5hshkiaepxdlwbx987.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/grfglj1czszdzteqp8.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/6nongz6bhzal8vnpzw.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ctqf8ofj8fdaiblojs.jpg)
Сравнение новинки с продуктом предыдущего поколения такого же уровня (GeForce RTX 4080 Super) показывает логичное различие. Несмотря на одинаковые шины обмена с памятью, карты отличаются кардинально: графические ядра имеют разные размеры, система питания претерпела изменения, а печатная плата стала короче, но при этом выше (благодаря высокой системе охлаждения).
Ядро было выпущено 51-й неделей 2024 года (кристалл изготовлен по технологии TSMC 4N — по разным оценкам это 5 нм). Маркировка — GB203-400, а -400 обычно означает полнофункциональный чип. Если в будущем будет вариант GeForce RTX 5080 Super/Ti на базе GB203, то повышение производительности возможно только за счет увеличения частот работы.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/a0edal9m3dz3n1ydtr.jpg)
Карта видео Palit GeForce RTX 5080 GameRock имеет 19 фаз питания (16 + 3).
![](https://digitalartspace.ru/wp-content/uploads/2025/02/j46c95uc1ateqxxsi1.jpg)
Схема питания ядра обозначена зелёным цветом, а памяти — красным.
Шестнадцать фаз питания ядра регулирует ШИМ-контроллер MP29816 от Monolithic Power Systems. Этот контроллер способен управлять до шестнадцати фазами и размещается на обратной стороне платы.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/8avagb7zbis5rjv8pa.jpg)
В преобразователе питания ядра и микросхем памяти применяются транзисторные сборки DrMOS — MP87993 от фирмы MPS, способные работать с током до 90 ампер.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/acxiptcvcwk49r44i0.jpg)
Питание микросхем памяти также регулирует ШИМ-контроллер MPS — MP2988 с заводской маркировкой. Он рассчитан на максимальное число 3 фаз и установлен на лицевой части платы.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/1qvw1r7wzxnoa54ybw.jpg)
На обратной стороне печатной платы установлен контроллер On Semi для отслеживания напряжений и температур.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/geun2vygexgt2mknp9.jpg)
Palit поручает управление подсветкой своих видеокарт контроллеру от компании Holtek.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/f4c9gucams47ktt5y6.jpg)
Карта функционирует в двух режимах, определённых двумя вариантами BIOS, переключение между которыми осуществляется посредством переключателя на лицевой панели карты. P (performance / производительный, он же 1) и S (silent / тихий, он же 2)Два режима отличаются только скоростью вращения вентиляторов, но максимальное потребление энергии в обоих случаях равно 360 ватт.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/s4ayebr1o1hnyuplwz.jpg)
Частоты памяти и Boost частота ядра в обоих режимах BIOS 1(P)/BIOS 2(S) установлены на заводские значения. Максимальная частота GPU карты Palit немного ниже базовой (на 8 МГц), что не влияет на производительность. Исследования показали, что карта Palit демонстрирует такую же производительность в играх, как и референсная модель.
Расход энергии видеокарты Palit во время тестов достигал… 346 Вт (в режиме BIOS P) и до 347 Вт В играх типа Cyberpunk 2077 при некоторых настройках графики энергопотребление может достигать 363 Вт.
Ручной разгон позволил достичь максимальных частот 2955/31538 МГц, что при игре в разрешении 4К повысило производительность всего на 2,5% по сравнению с базовыми показателями. Из-за неподвижного лимита энергопотребления реальный прирост скорости оказался незначительным, а потребление карты составило почти 349 Вт.
Питание для карты Palit подаётся через разъём питания стандарта PCIe 5.0, имеющий 16 контактов.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/qcydemqq0y5jf3scf9.jpg)
В комплект поставки карт входит переходник для такого разъема с трех стандартных 8-контактных, с которыми многие знакомы.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/q20hpje3boox0j7d6u.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/otoan1b730cbe0y0ge.jpg)
Данная карта имеет внушительные размеры, особенно толщина – более 7 см. Из-за этого видеокарта занимает 4 слота в корпусе компьютера.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/f4n3vzef57cai7279r.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/hwydkol6ilefiixqwz.jpg)
GeForce RTX 5080 не Эта карта поддерживает технологию SLI (мультиграфическую конфигурацию), но не имеет специального разъема на верхней части корпуса.
Карта оснащена тремя выходами DP версии 2.1b и одним выходом HDMI версии 2.1b.
Работа карты регулируется фирменной утилитой ThunderMaster. Программа позволяет управлять вентиляторами (3 вентилятора объединяются в два блока: центральный и боковые), частотами работы карты, напряжением ядра и отслеживать состояние карты (мониторинг).
![](https://digitalartspace.ru/wp-content/uploads/2025/02/evofbsx3zw916qbdk6.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/hqlk1pn722d96btu9k.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/66uqlqyelw50x0xqwv.png)
Нагрев и охлаждение
Видим кулер с вентиляцией задней части радиатора. Системе охлаждения присутствует большой многосекционный пластинчатый никелированный радиатор с тепловыми трубками, передающими тепло на ребра радиатора.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/alynmmx7hlc6yc0hfy.jpg)
Восемь трубок припаяны к большой медной испарительной камере, которая охлаждает как ядро, так и микросхемы памяти с помощью термопрокладок. Для охлаждения ядра применяется термопаста (не жидкий металл).
![](https://digitalartspace.ru/wp-content/uploads/2025/02/wprwttuyzd5a013hnz.jpg)
На радиаторе предусмотрены специальные площадки для охлаждения преобразователей питания VRM. Задняя пластина выполняет функцию защиты платы.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/v1cxyi9chpy9rp1o9n.jpg)
Радиатор защищает кожух с тремя вентиляторами диаметром 92 мм, имеющими по девять лопастей. Вентиляторы вращаются на одной частоте (по умолчанию), но программу ThunderMaster можно использовать для настройки работы центрального и двух крайних отдельно. Кожух из литого алюминия представляет собой массивную раму, обеспечивающую жесткость конструкции.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/2v1qil5vxm2oafpdjw.jpg)
Радиатор имеет пластины, имеющие наклон в 30 градусов. Такая конструкция уменьшает шум и повышает эффективность охлаждения.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/sqj4noguua69bzof8q.jpg)
При малой нагрузке на видеокарту вентиляторы останавливаются, когда температура GPU снижается до менее 50 градусов, а нагрев микросхем памяти — до менее 80 градусов. В момент запуска ПК вентиляторы работают, но после загрузки видеодрайвера проводится опрос рабочей температуры, и вентилятор выключаются. видеоролик на эту тему.
Мониторинг температурного режима:
Последняя на момент публикации версия 8.20 утилиты HWInfo ещё не поддерживала GeForce RTX 50, поэтому часть показаний с её датчиком была не совсем точной. Для демонстрации температурных показателей и максимального энергопотребления использовалась утилита MSI Afterburner 4.6.6.beta5.
Обратите внимание: инженеры Nvidia исключили из отчётных данных показатель температуры самой горячей точки ядра, поэтому HWInfo выводит неточную информацию по этому параметру, которую следует игнорировать.
Режим BIOS 1(P):
![](https://digitalartspace.ru/wp-content/uploads/2025/02/pwwghun60zfv168gou.jpg)
Максимальная температура процессора после стресс-теста не превысила 71 градус, а микросхем памяти — 76 градусов, что свидетельствует о хорошем охлаждении. Уровень энергопотребления видеокарты достигал 346 Вт.
Мы засняли и ускорили в 50 раз 8-минутный прогрев
Самый высокий нагрев регистрировался на плате внизу возле разъема PCIe и рядом с разъемом питания карты.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/aggdaa2rf10jmk2sk9.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/6ar0iuvbhggudg80t1.jpg)
При ручной регулировке температуры работа видеокарты практически оставалась неизменной (только немного увеличивались обороты вентиляторов), а энергопотребление достигало 349 Вт.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/byq50iu0z58w1id1hq.jpg)
Режим BIOS 2(S):
![](https://digitalartspace.ru/wp-content/uploads/2025/02/wcfi75rjqhxhvhkk88.jpg)
Максимальная температура процессора после стресс-теста составила 75 градусов, память разогрелась до 80 градусов. Это допустимый показатель. Мощность видеокарты достигала 347 Вт.
Шум
Измерительная методика предполагает, что помещение изолировано от посторонних шумов и ревербераций снижены. В системе тестирования шума видеокарт отсутствуют вентиляторы, исключая механический шум со стороны блока. Уровень фонового шума — 18 дБА, он отражает уровень шума в комнате и самого измерительного прибора. Измерения выполняются на расстоянии 50 см от видеокарты, на уровне системы охлаждения.
Режимы измерения:
- Работает режим ожидания в двумерном пространстве: открыт интернет-браузер с ресурсом iXBT.com, окно программы Microsoft Word и несколько приложений для интернет-связи.
- Просмотр фильмов в режиме 2D осуществляется при помощи SmoothVideo Project (SVP), обеспечивающего аппаратное декодирование и добавление промежуточных кадров.
- Тест FurMark выполняется при режиме 3D с максимальной загрузкой графического процессора.
Уровни шума разделяют на категории.
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
В состоянии покоя двухмерная модель не превышала 34 °C по температуре, вентилятор оставался неактивным, уровень шума составлял фон — 18 дБА.
Во время просмотра фильма с аппаратной обработкой видеоне было никаких изменений.
Режим BIOS 1(P):
При максимальной нагрузке в 3D температура составляла 71/76 градусов по Цельсию (ядро/память). Вентиляторы работали на максимальных оборотах — 2290 оборотов в минуту, шум возрастал до 31,9 дБА: это отчетливо слышно.
Аудиозапись шума — здесь. Спектрограмма шума проблем не выявила:
![](https://digitalartspace.ru/wp-content/uploads/2025/02/mlghwe0e6m46s29llg.png)
Режим BIOS 2(S):
При максимальной нагрузке в режиме трёхмерной графики температура составляла 75/80 градусов Цельсия (ядро/память). Вентиляторы при этом вращались со скоростью 1850 оборотов в минуту, шум достигал 28,7 децибел — это тихо.
Подсветка
Карта с подсветкой «хамелеон» по всей лицевой поверхности корпуса выглядит эффектно. Подсветка работает превосходно, а даже без нее карта переливается различными цветами при изменении освещения.
На верхней части карты обозначен логотип серии подсветкой.
Регулировать режимы подсветки, включая её отключение, можно с помощью программы ThunderMaster.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/xj8705h62o67lzcu8z.png)
Можно сохранить выбранный режим непосредственно в карте. При необходимости настройки подсветки достаточно сделать это один раз.
В комплект поставки карт серии GameRock входит кабель для подключения к разъему ARGB (5 В) на материнской плате для синхронизации подсветки с платой. При этом запуск утилиты ThunderMaster не обязателен: карта сама определит подключение, и подсветка будет синхронизирована автоматически.
Комплект поставки и упаковка
В комплект входит карта, руководство пользователя, разбираемая подставка под видеокарту с регулируемым по высоте упором, бонусные наклейки и коврик для мыши.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/xy127so0bbmmf4aib0.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/fd5rbx1ciwrbsmhkr3.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/dfp70areqjia46xasv.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/nct5q4lsarvxh20w1i.jpg)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ohr0n2s6rmm1jnzrcv.jpg)
Тестирование: синтетические тесты
В ходе тестирования новой видеокарты Nvidia на стандартных частотах мы использовали набор синтетических тестов. Он динамичен: иногда появляются новые тесты, а устаревшие выводятся из него. Мы стремимся добавить больше примеров с вычислениями, однако это вызывает определенные трудности. Набор постоянно развивается и совершенствуется, поэтому если у вас есть конкретные предложения по улучшению – оставьте их в комментариях к статье или обратитесь к авторам.
Мы внедрили дополнительные тесты в бенчмарки для оценки производительности трассировки лучей и технологий масштабирования разрешения (DLSS, FSR и XeSS). Также применяем наборы подтестов из 3DMark (Time Spy, Port Royal, DX Raytracing, Speed Way и др.). Приложения DirectX 11 и 12 из SDK пришлось исключить, так как они часто выдавали неверные результаты.
На перечисленных видеокартах осуществлялись синтетические тесты.
- GeForce RTX 5080 со стандартными параметрами на шине PCIe 5.0 (RTX 5080 PCIe 5)
- GeForce RTX 5080 со стандартными параметрами на шине PCIe 4.0 (RTX 5080 PCIe 4)
- GeForce RTX 4090 со стандартными параметрами (RTX 4090)
- GeForce RTX 4080 Super со стандартными параметрами (RTX 4080 Super)
- Radeon RX 7900 XTX со стандартными параметрами (RX 7900 XTX)
Для анализа производительности новой видеокарты GeForce RTX 5080 использовали две видеокарты Nvidia предыдущего поколения. Первая — флагманская RTX 4090, самая мощная модель на основе прошлой архитектуры. Второй вариант — RTX 4080 Super того же ценового уровня, которую заменяет новинка семейства Blackwell. Сравнительные результаты покажут, смогла ли новая архитектура ускорить решение задач этого уровня и насколько сильно на производительности сказывается пропускная способность памяти, так как по количеству исполнительных блоков модели довольно близки.
Сравнивать новинку будем с Radeon RX 7900 XTX — единственным подходящим конкурентом из нынешнего поколения Radeon. Позиционирование в теории близко к RTX 5080, ведь это топовая модель AMD. Другие Radeon не подходят из-за меньшей мощности и цены. Новое поколение GPU еще не доступно. Сравнение с этой моделью покажет уровень новинки против единственной условно конкурирующей карты.
Тесты 3DMark Vantage
В течение многих лет мы обращаемся к не самым новым синтетическим тестам из пакета 3DMark Vantage, так как в них можно обнаружить интересную информацию, отсутствующую в других, более современных тестах. Тесты с поддержкой DirectX 10 из этого набора остаются относительно актуальными, и при анализе результатов новых видеокарт мы всегда делаем ценные выводы.
Feature Test 1: Texture Fill
Первый тест оценивает работу узлов обработки текстур. Для этого в прямых фигурах меняют значения на основе маленьких текстур с помощью множества переменных координат, которые обновляются с каждым кадром.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ppxvf1l1r1iqkfnaz8.png)
Эффективность работы видеокарт AMD и Nvidia в текстурном тесте Futuremark обычно высока, демонстрируя результаты близкие к теоретическим параметрам, хотя иногда полученные показатели могут быть несколько занижены для некоторых GPU. Производительность полной версии графического процессора GB203 в этом тесте оказалась на ожидаемом уровне — RTX 5080 немного превзошла предшественницу, опередив RTX 4080 Super на 8%, что чуть ниже ожиданий исходя из теории.
Новинка обходит единственного условного конкурента компании AMD, хотя несколько последних поколений от AMD были сильнее в этом тесте. Эффективная скорость текстурирования решений текущего семейства Radeon снизилась, и близкие по цене решения Nvidia их догнали. Топовая модель предыдущего семейства — RTX 4090 — ощутимо быстрее всех, что не удивительно при большой разнице в количестве блоков текстурирования.
Feature Test 2: Color Fill
Вторая задача — тестирование скорости заполнения. Для этого применяется простой пиксельный шейдер, не влияющий на производительность. Интерполированный цвет записывается во внеэкранный буфер с использованием альфа-блендинга. В качестве внеэкранного буфера используется 16-битный буфер формата FP16, часто применяемый в играх с HDR-рендерингом, поэтому тест соответствует современным требованиям.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/s58f5vuan8xn3r157u.png)
Результаты второго подтеста 3DMark Vantage демонстрируют производительность блоков ROP без учета пропускной способности видеопамяти. Данный тест измеряет именно производительность подсистемы ROP, на которую ПСП обычно не оказывает заметного влияния. У новой видеокарты GeForce RTX 5080 эта ситуация почти такая же, как у предшествующей модели RTX 4080 (Super). По скорости подсистемы ROP новинка превзошла более старый GPU на 11%, что близко к теоретической разнице. Понятно, что топовое решение предыдущего поколения заметно быстрее, так как и блоков ROP у него значительно больше.
В этом тесте все видеокарты Nvidia проиграли флагманской модели AMD Radeon RX 7900 XTX, которая превзошла даже RTX 4090. Видеокарты GeForce по пиковой скорости заполнения сцены всегда показывают худшие результаты, поэтому подобные сравнительные данные в этом тесте не являются неожиданностью.
Тест функции 3: Параллаксное затенение.
Один из самых интересных тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также поверхность затеняется при помощи алгоритма Strauss. Тест очень сложный для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/z7uuo8qmflcm2rnbwk.png)
Результаты теста из пакета 3DMark Vantage зависят не только от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этом тесте важен правильный баланс GPU и эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нём нередко коррелируют с результатами игровых тестов.
Математическая и текстурная производительность играют важную роль, и в тесте из 3DMark Vantage новая модель GeForce RTX 5080 продемонстрировала ожидаемый результат, близкий к показателю RTX 4080 Super — всего на 8% быстрее. Небольшое количество улучшений в новом GPU привело к незначительному приросту скорости. Топовая RTX 4090 предыдущего поколения всё ещё опережает всех, а видеокарта Radeon RX 7900 XTX показала такой же результат, как рассматриваемая карта семейства Blackwell.
Feature Test 4: GPU Cloth
Четвёртый тест интересен тем, что в нём рассчитываются физические взаимодействия (имитация ткани) с помощью GPU. Вершинная симуляция реализуется комбинированной работой вершинных и геометрических шейдеров за несколько проходов. Для переноса вершин из одного прохода симуляции в другой используется stream out. Таким образом, проверяется производительность исполнения вершинных и геометрических шейдеров, а также скорость stream out.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/37v01xrga4trcptm9t.png)
Результат теста скорости рендеринга зависит от производительности обработки геометрии и эффективности выполнения шейдеров. Преимущества чипов Nvidia должны проявиться в этом тесте, но мы часто получаем неточные результаты, поэтому не стоит придавать им большое значение.
Сначала такое наблюдалось только у GeForce, но со временем и видеокарты Radeon попали в ту же ситуацию: более новые решения и драйверы AMD показывают низкие результаты. Похоже, причина в драйверах, которые давно никто не оптимизирует для очень старого тестового пакета. Новая модель в этом тесте оказалась почти на 40% быстрее своей предшественницы RTX 4080 Super — возможно, новый драйвер работает лучше, а может быть, ускорились аппаратные блоки, ведь в них были некоторые изменения.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на основе систем частиц, вычисляемых графическим процессором. Применяется вершинная симуляция: каждая вершина — это отдельная частица. Stream out используется так же, как и в предыдущем тесте. Вычисляются сотни тысяч частиц, каждая из которых анимируется отдельно, с учетом столкновений с картой высот. Отрисовка частиц выполняется геометрическим шейдером, который из каждой точки создает четыре вершины, формирующие частицу. Наиболее загружено шейдерные блоки вершинными расчетами, также тестируется Stream out.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/j487gbdzwk9pvqmlg9.png)
Во втором геометрическом тесте из 3DMark Vantage новинки показывают далекие от теории результаты. Если считать их корректными, то рассматриваемая видеокарта архитектуры Blackwell показала результат между моделями RTX 4080 Super и RTX 4090, что объяснимо теорией. Условно конкурирующая со всеми топовая Radeon RX 7900 XTX проиграла всем представленным в сравнении видеокартам Nvidia. Это можно объяснить разве что плохой оптимизацией драйверов, ведь раньше результаты GPU обоих производителей были заметно выше.
Feature Test 6: Perlin Noise
Последний тестер пакета Vantage является математически-сложным тестом GPU. Он рассчитывает несколько октав алгоритма Перлин шума в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума, что увеличивает нагрузку на видеочип. Алгоритм Перлин шума — это стандартный способ, часто применяемый в процедурном текстурировании, и он использует много математических вычислений.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/r9je3yxg5j0gbupq5z.png)
Математический тест показывает производительность решений, которая хотя и не всегда совпадает с теорией, близка к максимальной мощности видеочипов в сложных задачах. В тесте применяются операции с плавающей запятой, новые архитектуры могли бы продемонстрировать возможности двойного запуска команд, но из-за устаревшего теста он не способен полностью раскрыть потенциал современных GPU, если судить по их результатам.
Новая графическая карта GeForce RTX 50 серии демонстрирует результаты, сопоставимые с топовой моделью предыдущего поколения аналогичного уровня, опережая ее на 10%. Разница, по всей вероятности, не окажется заметной. Неудивительно, что оба GPU уступают старшей модели RTX 4090, основанной на чипе более высокого класса с большим количеством блоков. В сравнении с Radeon RX 7900 XTX GeForce RTX 5080 показала себя быстрее. Давайте проверим результаты в современных синтетических тестах с повышенной нагрузкой на GPU.
Тесты Direct3D 12
Примеры из SDK Microsoft и AMD, применяющие Direct3D12, исключили из тестирования, так как давно демонстрируют неверные результаты. В качестве единственного вычислительного теста с поддержкой Direct3D12 сохранился бенчмарк Time Spy из 3DMark. Нам важен не только общий сравнительный анализ мощности видеокарт, но и разница производительности при включенном и отключенном асинхронных вычислениях, появившихся в DirectX 12. Для достоверности протестировали видеокарты в двух графических тестах.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/z4u3e91xi4xcx4gjr6.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/0w595slf7b85yv3iu1.png)
С тестов производительность новой модели GeForce RTX 5080 сравнивалась в двух режимах работы — по шине PCIe 5.0 и 4.0. Разница оказалась несущественной. При сравнении производительности новой модели Nvidia с видеокартой предыдущего поколения того же уровня, новое решение оказалось быстрее на 10%-15%, что соответствует теории о разнице между ними. Новая модель расположилась ровно посередине между парой GPU предыдущей архитектуры, и до RTX 4090 ей не так уж далеко.
Видеокарты Radeon в данном тесте зачастую показывают лучшие результаты, чем по цене сравнимые GeForce. Производительность GeForce RTX 5080 оказалась практически такой же высокой, как у Radeon RX 7900 XTX и RTX 4080 Super. Важно отметить, что результаты этого теста не всегда хорошо коррелируют с реальной игровой производительностью. В задачах растеризации решения AMD могут выглядеть немного лучше, но перейдём к тестам трассировки лучей, где ситуация меняется кардинально.
Тесты трассировки лучей
Бенчмарк Port Royal от создателей тестов серии 3DMark – один из первых тестов производительности трассировки лучей. Этот тест функционирует на всех видеокартах с поддержкой DirectX Raytracing API. В тестировании использовались различные видеокарты в разрешении 2560×1440 при разных настройках, когда отражения рассчитывались методом трассировки лучей в двух режимах и традиционным для растеризации способом.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/kp4zym4hwj5z5tou15.png)
Тест демонстрирует новые возможности применения трассировки лучей через DXR API с алгоритмами отрисовки отражений и теней. Несмотря на невысокую оптимизацию, которая загружает даже мощные графические процессоры, он пригоден для сравнения производительности различных GPU в этой задаче.
Результаты теста наглядно демонстрируют разницу в подходах компаний AMD и Nvidia к поддержке аппаратного ускорения трассировки лучей, по крайней мере до RDNA3 включительно, хотя последняя немного улучшила положение. Новая GeForce RTX 5080 показала довольно ожидаемый результат, обойдя RTX 4080 Super, но разница выросла уже до 15%-20% — пока подтверждаются ожидания, что в более сложных условиях новинка может оторваться сильнее. Обе видеокарты уровня RTX x080 заметно медленнее недавней топовой модели RTX 4090. Единственное в сравнении решение конкурента оказалось в этом тесте не таким уж плохим, RX 7900 XTX медленнее и RTX 4080 Super, конечно, но отставание не критичное.
Новый подтест 3DMark предназначен для оценки производительности трассировки лучей DirectX Raytracing. В отличие от предыдущего, этот тест не гибридный и не использует растеризацию, опираясь исключительно на трассировку лучей. Это позволяет более точно измерить скорость GPU именно в плане аппаратного ускорения трассировки. Сцена в бенчмарке знакома по другим подтестам 3DMark и достаточно мала — BVH-структура теоретически помещается в большой кэш, что может быть преимуществом для новых видеокарт.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/7ergrswo0tjsxvn6dw.png)
GeForce в этих условиях заметно опережают Radeon, поскольку выделенные RT-ядра Nvidia выполняют большую часть работы и более универсальны: производительность снижается при включении трассировки не так сильно, как у ядр Ray Accelerator + обычных SIMD-ядер конкурента. В большинстве игр с применением трассировки лучей нагрузка на RT-блоки заметно меньше, положение Radeon не столь критично. Но в данном тесте видеокарты Nvidia сохраняют явное преимущество.
К сожалению, в этом первом тесте новинке GeForce RTX 5080 не удалось превзойти RTX 4080 Super: результат оказался практически вдвое хуже, сравнимый с единственным предложением конкурента. Обычно ускорение в задачах трассировки лучей выше, чем в растеризации, но здесь что-то пошло не так — вероятно, проблема в драйверах, ведь во всех остальных тестах ситуация соответствует ожиданиям. Впрочем, это редкий синтетический тест, о котором почти все забыли, в играх такого не наблюдается.
В 2022 году в пакет 3DMark добавили тест Speed Way, рассчитанный на трассировку лучей, с учетом выпуска новых поколений графических процессоров Nvidia и AMD. Тест по нагрузке на различные блоки GPU напоминает распространенные игры с активным использованием трассировки лучей, поэтому представляет большой интерес.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/z9ufla34w360di1d1r.png)
Достижимая частота кадров в обоих разрешениях показывают обычно только лучшие графические процессоры, GeForce RTX 5080 достиг этого уровня, так как был близок к 60 FPS в 4K. Разница между Radeon и GeForce здесь есть, но она уменьшилась — единственная видеокарта AMD в этом сравнении не слишком сильно уступает по цене конкуренту в виде RTX 4080 Super. Новое решение семейства Blackwell на 22%-23% быстрее RTX 4080 Super в данном тесте, поэтому прирост производительности в сложных условиях может быть больше теоретически обоснованных 15%. Даже бывшая топовая модель RTX 4090 всего лишь на 10%-12% быстрее новинки.
Изучим ещё один полусинтетический бенчмарк, созданный на основе реального игрового движка. Boundary — это китайский проект с поддержкой DXR и DLSS. Данный бенчмарк предъявляет серьёзные требования к GPU, трассировка лучей в нём широко используется: для сложных отражений со многими отскоками луча, мягких теней и глобального освещения. В тестах Radeon технологию DLSS применять невозможно.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/6j0vak0aq9mmuzepbx.png)
Даже при разрешении Full HD приемлемую производительность обеспечивают только мощные видеокарты, а самая быстрая на сегодняшний день видеокарта AMD отстает от всех GeForce, но все равно показала более 60 FPS. В разрешении 4K без масштабирования играбельно только на топовой RTX 4090, и даже новая RTX 5080 не смогла показать более 40 FPS. Новая модель обошла RTX 4080 Super всего лишь на 13% в 4K, а в Full HD они очень близки. Тест показал, что скорость не ограничивается пропускной способностью видеопамяти — RTX 5080 имеет более высокий показатель ПСП, но это ей ничего не дало. Результаты единственной представленной в сравнении видеокарты Radeon почти вдвое ниже, а в тестах трассировки лучей решения AMD не могут конкурировать с NVIDIA.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/gt066bs5vgvifodfvm.png)
С включением масштабирования разрешения качественным методом DLSS 2 все представленные в тесте видеокарты Nvidia даже в разрешении 4K обеспечивали приемлемую частоту кадров, превысив порог в 60 FPS. Новая модель GeForce RTX 5080 показала результаты до 20% выше по сравнению с RTX 4080 Super, что неплохо. При подобной нагрузке только включение DLSS позволяет играть в разрешении 4K при максимальных настройках в самых ресурсоемких играх. К сожалению, в еще одном привычном для нас игровом бенчмарке, основанном на китайской игре — Bright Memory — новая видеокарта не заработала, как и видеокарты AMD.
Вычислительные тесты
Продолжаем поиск бенчмарков с применением OpenCL для актуальных вычислительных задач, которые войдут в набор синтетических тестов. В данном разделе пока представлен старый и не очень оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Кроссплатформенный тест основан на LuxRender и использует OpenCL.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/rnxo58srdnk0060m5k.png)
Видеокарта GeForce RTX 5080 на базе чипа GB203 имеет незначительно больше вычислительных блоков по сравнению с RTX 4080 Super, поэтому в тесте немного обошла последнюю – это подтверждает теория. Разница в среднем по трем тестам оказалась выше ожидаемой, а RTX 4090 опережает их значительно. В всех подтестах результат новой карты выше, чем у лучшего Radeon, а в самом сложном подтесте разница двукратная. Более современная шина PCIe практически не повлияла на скорость.
Рассмотрим ещё один тест производительности графических процессоров — V-Ray Benchmark. Этот тест тоже основан на трассировке лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray демонстрирует возможности GPU в сложных вычислениях и может показать преимущества новых видеокарт. В прошлых тестах использовались разные версии бенчмарка, выдающие результат в виде времени, затраченного на рендеринг, и количества миллионов просчитанных путей за секунду, но остался только первый вариант.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/c51pvxd4y530vhynwl.png)
Тест демонстрирует программную трассировку лучей, где новая GeForce RTX 5080 оказалась на уровне RTX 4080 Super, а обе модели уступают RTX 4090. Единственный Radeon, претендующий на звание конкурента, показал слабый результат, приближаясь к уровню RTX 3090 Ti, но не сравнимый с более современными видеокартами Nvidia.
Новые версии Cinebench и OctaneRender пока не поддерживают GeForce RTX 50. В будущем приложения могут получить обновления для оптимизации под новую серию видеокарт, но пока что их заменили на более продвинутые версии бенчмарка V-Ray. В новых версиях V-Ray видеокарты AMD уже не функционируют.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/yjgwir43mhltjt43fu.png)
Различий между версиями шины PCIe не установлено, ее пропускная способность никак не влияет на результат. Новая модель GeForce RTX 5080 лишь немного быстрее RTX 4080 Super, что огорчает. Топовая модель прошлого поколения RTX 4090 хоть и превосходит остальных, но незначительно. RTX 3090 Ti добавлена для сравнения прироста производительности в предыдущем поколении GPU по сравнению с нынешним — разница очевидна.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/rc7lphdz7j86tmx8dq.png)
В этом тесте новой модели GeForce RTX 5080 заметно опережает аналог Super из прошлого семейства — на 22% в режиме CUDA. При включенном аппаратном ускорении RTX разница составила порядка 10%, что тоже неплохо. Примечательно, что даже RTX 3090 Ti отстаёт не так значительно.
Повышенная пропускная способность шины PCIe не оказала влияния. Чтобы узнать, различается ли пропускная способность PCI Express версий 5.0 и 4.0, проведем проверку с помощью специализированного теста из пакета 3DMark, который измеряет пиковую пропускную способность по шине.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/vbmazmfu5wfrmao9ua.png)
Видно, что пиковая пропускная способность зависит от версии шины PCIe. Разница между 5.0 и 4.0 меньше теоретически ожидаемой двукратной, но все равно почти полуторакратная. Теоретически скорость передачи данных практически ничего не меняет в реальных тестах: разницы между 5.0 и 4.0 нет ни в одном из тестов, лишь пара-тройка процентов преимущества. Но GPU нового поколения готова к будущему и сможет выжать из PCIe больше, когда это потребуется.
Шины PCI Express пятого поколения уже доступны в настольных компьютерах и применяются твердотельными накопителями. Однако видеокарты пока не получают существенного преимущества от вдвое большей полосы пропускания, поэтому решение не пользуется большой популярностью среди производителей. Тем не менее, все анонсированные решения архитектуры Blackwell поддерживают ширину интерфейса в 16 линий PCIe 5.0, что может быть полезным в будущем.
Тесты технологий DLSS/XeSS/FSR
В данном разделе анализируются дополнительные тесты, связанные с технологиями повышения производительности. Сначала это были лишь технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), затем добавилась технология генерации промежуточных кадров — DLSS 3, а позднее — DLSS 4. Сначала в материалах появился отдельный тест технологии DLSS, хотя ранее уже проводились тесты с применением DLSS в приложениях с трассировкой лучей, но самостоятельное тестирование было признано полезным. Рассмотрены результаты GPU компании Nvidia в разрешении 4K с включением технологии DLSS различных уровней качества сразу нескольких версий.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/8uycmoe3ykyyjelf83.png)
В режиме Performance изображение создаётся в низком разрешении, затем масштабируется до 4K и дополняется сгенерированными кадрами. При отключенном DLSS рендеринг выполняется в полном разрешении, что сильно снижает производительность. RTX 4090 выдаёт лишь 58 FPS в 4K, чего недостаточно для комфортной игры. RTX 5080 и RTX 4080 Super справляются ещё хуже. Включение DLSS 2 в «производительном» режиме обеспечивает достаточную частоту кадров для всех видеокарт. Новая RTX 5080 на 10% быстрее RTX 4080 Super, что не самое впечатляющее преимущество нового поколения.
Blackwell обладает собственным преимуществом: если в видеокартах Ada Lovelace появилась поддержка DLSS 3 с генерацией одного промежуточного кадра, то в Blackwell их может быть до трех. Подробности о технологии освещены в теоретической части статьи. На практике включение генерации промежуточных кадров придает RTX 5080 Super большое преимущество даже перед RTX 4090. С одним сгенерированным кадром новинка уступает предыдущему топовому решению, но включение DLSS 4 дает ей двукратное преимущество над RTX 4080 Super и полуторакратное — над RTX 4090.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/yaza2pulmnq8gtk6cz.png)
С активацией DLSS в режиме высокого качества все GeForce демонстрируют более 60 FPS. Новая модель без генерации кадров опережает RTX 4080 Super на 16%, что близко к другим результатам без включения DLSS, а до прежнего лидера RTX 4090 ей пока далеко. Генерация одного кадра повышает плавность изображения при незначительном увеличении задержек управления. Главное – «настоящий» FPS не должен быть ниже 30-40, иначе генерация кадров не добавит необходимой отзывчивости.
В режиме DLSS 3 с одним сгенерированным дополнительно кадром новая RTX 5080 приближается к производительности RTX 4090, поскольку Blackwell работает эффективнее с нейросетями. При увеличении количества дополнительных кадров до трёх новинка превосходит RTX 4080 Super вдвое и опережает RTX 4090 на 60%. Вопрос о «честности» сгенерированных кадров пока отложим, но плавность они безусловно увеличивают и могут быть полезны, хотя сравнивать их с количеством «настоящих» кадров сложно.
XeSS — метод повышения производительности, основанный на рендеринге в меньшем разрешении и масштабировании до высокого. Это аналог DLSS 2.0 от Intel, который использует искусственный интеллект для восстановления информации в кадре. В отличие от DLSS, XeSS работает на всех современных видеокартах, хотя наилучшую эффективность показывает на решениях Intel. Для тестирования использовался бенчмарк из пакета 3DMark с пониженным разрешением рендеринга.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/nsg3vs8sy6qvj1yxoi.png)
Включение XeSS повышает частоту кадров до двух раз и более. Технология универсальна и может составить конкуренцию DLSS, которая работает только на Nvidia, а FSR, хоть и самая универсальная, проста по функционалу. XeSS уступает DLSS как в качестве, так и в возможностях. В тесте GeForce RTX 5080 демонстрирует большую эффективность, чем GeForce RTX 4090 и GeForce RTX 4080 Super — вероятно, программисты Nvidia оптимизировали это в драйверах.
Производительность Radeon RX 7900 XTX выглядит неважно по сравнению с новой моделью, а в целом карта от AMD отстает в этом тесте. Улучшение архитектуры Blackwell позволило новой карте стать не только быстрее RTX 4080 Super, но и превзойти RTX 4090, хотя в родном разрешении проигрывала ей значительно. Но различий между версиями шины PCIe в этот раз нет.
FSR 2.0 от AMD — ещё одно решение для масштабирования рендеринга. Его добавили в список тестов 3DMark. Различия сцен в тестах разных технологий затрудняют их прямой сравнительный анализ, поэтому можно судить только по приросту производительности. Но необходимо учитывать реальное разрешение рендеринга и разницу в качестве, что усложняет задачу.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/iz8ap3xzu80iamuiek.png)
Технология FSR универсальна и работает примерно одинаково на разных графических процессорах, поэтому в тестах FSR 2.0 особых откровений не наблюдалось. Radeon RX 7900 XTX оказался менее эффективен по сравнению с видеокартами Nvidia. Без FSR эта модель была на уровне RTX 4080 Super, но при каждом снижении разрешения производительность Radeon относительно GeForce явно уменьшалась.
Новая GeForce RTX 5080 работает чуть быстрее прежней модели. Без FSR скорость была выше на 13%, а с включенной технологией масштабирования — на 15%-16%. В тестах этой технологии масштабирования ничего особенного не обнаружили. С многокадровой генерацией DLSS 4 новинка немного превосходит RTX 4080 Super, демонстрируя среднюю скорость на 15% выше. Далее перейдем к тестированию новой видеокарты Nvidia в реальных игровых тестах.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/0ec7wonh4u8o7btqyp.jpg)
Тестирование: игровые тесты
Конфигурация тестового стенда
Конфигурация тестового стенда
Список инструментов тестирования
В ходе игровых тестов применялась максимальная графика.
- Черная миф: Укунг (Игра Науки/ Игра науки).
- Cyberpunk 2077 от Софтклаба и CD Projekt RED, обновление 2.21 (январь 2025 года).
- Сага Сени: Ад II (Ниндзя Теори/Xbox Геймс).
- «Call of Duty: Modern Warfare II» от Infinity Ward/Activision (без трассировки и DLSS/FSR/XeSS!).
- Alan Wake 2 (Remedy/Epic Games)
- «Рачэт и Кленк: Разлом реальностей» от Insomniac Games, Sony и Софтклаба.
- Призрак Цусимы: Издание директора (Студия Sucker Punch Productions / Sony Interactive)
- Наследство Хогвартса (Аваланч Софтвэр/Warner Bros).
- Avatar: Frontiers of Pandora (Ubisoft)
- Atomic Heart (Mundfish/VK)
- Индиана Джонс и Великий круг (Machine Games / Bethesda Softworks) (с поддержкой RTX и DLSS / FSR / XeSS)!
Кратко о производительности в 3D-играх
Прежде чем представить подробные результаты тестов, публикуем краткое описание производительности семейства, к которому принадлежит протестированный ускоритель, а также его конкурентов. Все значения мы субъективно оцениваем на 7-балльной шкале.
Игры с классической растеризацией вместо трассировки лучей. :
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ux4aaecnbkotquwp37.jpg)
GeForce RTX 5080 занимает второе место среди протестированных карт (в ожидании GeForce RTX 5090). Такие топовые решения порой не раскрывают весь потенциал в классических играх, даже при разрешении 4K — общая производительность ограничена ресурсами системы, прежде всего CPU. В данном случае вывод простой: играть можно на самых высоких настройках графики в любом разрешении, включая 4K (2160p), а в некоторые игры — даже в 8K.
Игры, использующие трассировку лучей и DLSS/FSR/XeSS. :
![](https://digitalartspace.ru/wp-content/uploads/2025/02/n3hedyrij9nupcufmv.jpg)
В большинство игр можно играть с высокими настройками графики, включая трассировку лучей, даже при разрешении 4K. Применение динамического масштабирования не обязательно. DLSS 3, а тем более DLSS 4, добавит заметное количество кадров в секунду при разрешении 8K (правда, не во всех играх поддерживается DLSS в этом разрешении), и 16 ГБ видеопамяти станут обязательными.
По производительности в играх при включении RT и DLSS карта GeForce RTX 5080 оказывается самой быстрой, превосходя GeForce RTX 4090. Из десяти тестовых игр три уже поддерживают DLSS4 с MFG, показатели GeForce RTX 5080 в них заметно выше, что повлияло на общий итог.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/nde859u370akkttgzy.jpg)
Результаты тестирования в 3D-играх
Классические показатели тестирования при отсутствии программной отслеживания лучей на разрешениях 1920×1080, 2560×1440 и 3840×2160.
Black Myth: Wukong
![](https://digitalartspace.ru/wp-content/uploads/2025/02/8iqht1083w89ydg4iy.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/vx2suv079herlx65ce.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/g7t25fbc8kifg3oulf.png)
Cyberpunk 2077 v.2.21
![](https://digitalartspace.ru/wp-content/uploads/2025/02/nc5pxu6w9ydnsoa54p.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/72m1nh4r09x0k5rski.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/xbcjn2857ufkkilvs7.png)
Senua’s Saga: Hellblade II
![](https://digitalartspace.ru/wp-content/uploads/2025/02/xlsk5raj5y5mlqh617.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/cmwcsjmtn839sviqhp.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/2gywbthlinpixmrz5s.png)
Call of Duty: Modern Warfare II
![](https://digitalartspace.ru/wp-content/uploads/2025/02/w6qlmuvybs3lt02grt.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/a2nedh5g5329h3ayxx.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/zkbyu1ni6kcjovo31w.png)
Alan Wake 2
![](https://digitalartspace.ru/wp-content/uploads/2025/02/oli0b9mpg6mwqmu2x0.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/hgla101ld0b9h4ks5v.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ik55fwyagjnydg1eyp.png)
Ratchet and Clank: Rift Apart
![](https://digitalartspace.ru/wp-content/uploads/2025/02/4xl37rxkgkdi1810j4.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/8hdj371930iq0i5bc2.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/no7qfaznyd08btjclq.png)
Ghost of Tsushima Director’s Cut
![](https://digitalartspace.ru/wp-content/uploads/2025/02/7dt5aigekpmoc9xlq6.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/scin6fr9ag2asq7xcy.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/wbaj3aiejfauckumq2.png)
Hogwarts Legacy
![](https://digitalartspace.ru/wp-content/uploads/2025/02/0sri5kyhk7o7sff1o3.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/neqtkx0uc0mp2w4jxj.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/utixpxjy5pnmak965d.png)
Avatar: Frontiers of Pandora
![](https://digitalartspace.ru/wp-content/uploads/2025/02/921zu8evxem56e5v12.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/6c5yxai3fz9ibm5016.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/3ulvd6zba63wispk01.png)
Atomic Heart
![](https://digitalartspace.ru/wp-content/uploads/2025/02/hntu9plhtsfimmklt9.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/7zor16u8ojongr1bx3.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/5honvlffkatr1hh0ka.png)
Результаты тестов с аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160.
Black Myth: Wukong, RT+DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/bjaahamxihbqstojfw.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/nrswngjn11s25m18z6.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/61wgmhfdnd3wxwo0cy.png)
Cyberpunk 2077 v.2.21, RT
![](https://digitalartspace.ru/wp-content/uploads/2025/02/9jzxvgyz3jxreabbzg.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/yah649f2ihsknqu5fy.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/uzw3ldtegbvmggng2g.png)
Cyberpunk 2077 v.2.21, RT + DLSS/FSR
![](https://digitalartspace.ru/wp-content/uploads/2025/02/izg78a6y9oxixm65va.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/acwv73sv4t9ka1zupg.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/zi3pbh41bjpb7cg1vt.png)
Senua’s Saga: Hellblade II, DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ml4kj82laeepio4c5q.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/s1yhj59xk4d3jr5mw1.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/y0b51gd5ioel4phpp6.png)
Alan Wake 2, RT
![](https://digitalartspace.ru/wp-content/uploads/2025/02/b66dadrmjg276heu4x.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/mnrlcn5pttsbjn4c0n.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/es4rusaaxz8anr61g0.png)
Alan Wake 2, RT + DLSS/FSR
![](https://digitalartspace.ru/wp-content/uploads/2025/02/chlryj072jcz07vc82.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/l365jzp4gn5tcr7xh2.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/5709yyxtu433dxn3c7.png)
Ratchet and Clank: Rift Apart, RT
![](https://digitalartspace.ru/wp-content/uploads/2025/02/o5twdbrtb796o33hmh.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/iyn1npaclhoyxfmpf4.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/5mba3lbizi7yq0hmz5.png)
Ratchet и Кланк: Разлом Реальности с поддержкой RTX, DLSS, FSR и XeSS.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/t2h7jqxyu9flnex8ea.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/wpgnly5be6h5pbgy61.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/9rs7wyjladlql9v8eb.png)
Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/6tcs5rrytgn02jp022.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/dw42aefcwao9lzbhjq.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/gfrsfy2v5mi92r4ube.png)
Hogwarts Legacy, RT
![](https://digitalartspace.ru/wp-content/uploads/2025/02/lhe5y84w4utopfrquz.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/legakb4b30o2zgija5.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/35mym64u3zs8f8e692.png)
Hogwarts Legacy, RT + DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/mhjd0nh9qs60ly78eu.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/x2yrm6dkfuzpuvk480.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/asljismrv2zw5tctg7.png)
Avatar: Frontiers of Pandora, RT
![](https://digitalartspace.ru/wp-content/uploads/2025/02/vktyhfrucvmoh223ps.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/m2i79urmce98pn1v5t.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/t0f23kz2kjdfv3gjme.png)
Avatar: Frontiers of Pandora, RT + DLSS/FSR
![](https://digitalartspace.ru/wp-content/uploads/2025/02/r8lcv667kphrhbgxhw.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/8j5zkrkm8wb234aepo.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/nz5rsnyfsxr43bcy3v.png)
Atomic Heart, DLSS/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/z0qdrypmgbwm4laf8j.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/pljzhgibv9p4y9veb2.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/wtfp5ronrdjc6ptrwm.png)
Indiana Jones and the Great Circle, RT
![](https://digitalartspace.ru/wp-content/uploads/2025/02/qrbyruhwdr441mv8h0.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/g91e6eli6w6n6ovw4i.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/b1zfwye21dtvzj88gb.png)
Индиана Джонс и Великий круг, RTX + DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/ezye4fi4jc4mdp2i08.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/rpnmp44qvxo3z9ug0m.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/135x3071fjd0gx48zf.png)
Результаты тестов при работе с аппаратной трассировкой лучей и технологиями DLSS, FSR, XeSS в разрешении 7680×4320.
Cyberpunk 2077, RT + DLSS/FSR
![](https://digitalartspace.ru/wp-content/uploads/2025/02/yavvkd04rrplc5q4w0.png)
Senua’s Saga: Hellblade II, DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/twk7m7vj6vg8n6sayw.png)
Ratchet и Кланк: Разлом Реальности, RT с DLSS/FSR.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/flvke2r8ix9qr1qoru.png)
Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/hqsxjyoxt6jdm7for8.png)
Hogwarts Legacy, RT + DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/zszga5ri1zua1o9329.png)
Indiana Jones and the Great, RT + DLSS/FSR/XeSS
![](https://digitalartspace.ru/wp-content/uploads/2025/02/uuw8eci0b8fswp41g8.png)
![](https://digitalartspace.ru/wp-content/uploads/2025/02/9pfsb75y6sgpxlpjkg.jpg)
Рейтинг iXBT.com
Методика расчета рейтингов
Рейтинг ускорителей iXBT.com Показывает сравнительную производительность видеокарт в двух версиях.
- Вариант рейтинга iXBT.com без включения RT
Рейтинг формируется на основе всех тестов без применения технологий трассировки лучей. Нормирование рейтинга выполнено относительно наименее мощного ускорителя из группы карт — Arc A310 (скорость и возможности Arc A310 приняты за 100%). Ведение рейтингов осуществляется по 30 регулярно исследуемым нами акселераторам в рамках проекта. Лучшая видеокарта месяцаДля анализа была отобрана группа карт, состоящая из GeForce RTX 5080 и его соперников.
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
01 | RTX 4090 24 ГБ, 2520—2640/21000 | 5365 | 188 | 286 000 |
02 | Palit RTX 5080 GameRock 16 ГБ, 2617—2850/30000 | 4899 | 272 | 180 000 |
03 | RTX 4080 Super 16 ГБ, 2550—2705/23000 | 4484 | 356 | 126 000 |
04 | RX 7900 XTX 24 ГБ, 2500—2990/20000 | 4412 | 398 | 111 000 |
05 | RTX 4080 16 ГБ, 2505—2625/22400 | 4152 | 338 | 123 000 |
В разрешении 4K GeForce RTX 5080 превосходит GeForce RTX 4080 Super на 9,2%, GeForce RTX 4080 — на 18%, Radeon RX 7900 XTX — на 11%. От флагмана предыдущего поколения GeForce RTX 4090 его отстаёт на 8,6%.
Современные флагманы интересны в тяжелых режимах с RT; производительность в классических играх давно превышает потребности. Тем не менее, прирост производительности между поколениями карт невелик и скорее соответствует разнице между ускоренными версиями (Super или Ti) внутри одного поколения.
- Рейтинг iXBT.com, учитывающий RT/DLSS/FSR/XeSS.
Рейтинг основывается на результатах 10 тестов, где применяются технологии трассировки лучей вместе с Nvidia DLSS, AMD FSR или Intel XeSS. Таблица нормирована по наименее производительному ускорителю в каждой группе — Arc A310 (скорость и возможности Arc A310 приняты за 100%).
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
01 | Palit RTX 5080 GameRock 16 ГБ, 2617—2850/30000 | 12134 | 674 | 180 000 |
02 | RTX 4090 24 ГБ, 2520—2640/21000 | 10783 | 377 | 286 000 |
03 | RTX 4080 Super 16 ГБ, 2550—2705/23000 | 9184 | 729 | 126 000 |
04 | RTX 4080 16 ГБ, 2505—2625/22400 | 8542 | 694 | 123 000 |
07 | RX 7900 XTX 24 ГБ, 2500—2990/20000 | 6208 | 559 | 111 000 |
GeForce RTX 5080 возглавила группу благодаря поддержке DLSS4 с многокадровой генерацией в трех из десяти тестовых игр. Эта технология позволяет видеокартам GeForce RTX 50 значительно, иногда в разы, превосходить предшественников по производительности. Об убытках качества мы расскажем в отдельном материале. Пока никаких серьезных проблем в таких играх не обнаружено.
В наборе игр в разрешении 4K GeForce RTX 5080 превзошел GeForce RTX 4090 на 12,5%, GeForce RTX 4080 Super — на 32,1%, GeForce RTX 4080 — на 42%, Radeon RX 7900 XTX — на 95,4%. Здесь заметна смена поколений, прирост значительный. Стоит помнить, что этот рост связан с использованием DLSS4, а не исключительно аппаратными возможностями GeForce RTX 5080.
В связи с этим мы дополнительно проверили работоспособность GeForce RTX 5080 при использовании только DLSS 2/3, исключив DLSS 4 (генерация дополнительного кадра в играх с поддержкой DLSS 3 сохраняется, но сравнение GeForce RTX 50 и GeForce RTX 40 становится более корректным). GeForce RTX 5080 получает рейтинг iXBT.com 10065 Превосходит GeForce RTX 4080 Super на 9,6%, GeForce RTX 4080 — на 17,8%, Radeon RX 7900 XTX — на 62%, однако уступает GeForce RTX 4090 на 6,6%. Похоже на карту «GeForce RTX 4080 Ti Super» (или у Nvidia есть забытый суффикс Ultra), а не следующее поколение. Важно признать, что видеокарта — это программно-аппаратный комплекс, где программная часть столь же важна, как и аппаратная, а сейчас она вообще стала самой важной.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/3w3npfxwmpl0u5wpmt.jpg)
Рейтинг полезности
Рейтинг полезности Аналогичный рейтинг формируется при делении показателя прошлого рейтинга на стоимость указанных ускорителей. Расчет рейтинга полезности осуществлен с использованием розничных цен. на начало февраля 2025 года.
- Вариант рейтинга полезности без включения RT
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
06 | RX 7900 XTX 24 ГБ, 2500—2990/20000 | 398 | 4412 | 111 000 |
18 | RTX 4080 Super 16 ГБ, 2550—2705/23000 | 356 | 4484 | 126 000 |
20 | RTX 4080 16 ГБ, 2505—2625/22400 | 338 | 4152 | 123 000 |
26 | Palit RTX 5080 GameRock 16 ГБ, 2617—2850/30000 | 272 | 4899 | 180 000 |
28 | RTX 4090 24 ГБ, 2520—2640/21000 | 188 | 5365 | 286 000 |
Новинка GeForce RTX 5080 пользуется большим спросом, цены на эти карты завышены. Мало кто из покупателей, которые заплатили немалые деньги за такую видеокарту, ограничится играми без технологий RT и динамического масштабирования. В связи с этим актуальность рейтинга снижается.
- Рейтинг пользы с поддержкой RT, DLSS, FSR и XeSS.
Рейтинг приведен для разрешения 4K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
05 | RTX 4080 Super 16 ГБ, 2550—2705/23000 | 729 | 9184 | 126 000 |
07 | RTX 4080 16 ГБ, 2505—2625/22400 | 694 | 8542 | 123 000 |
08 | Palit RTX 5080 GameRock 16 ГБ, 2617—2850/30000 | 674 | 12134 | 180 000 |
13 | RX 7900 XTX 24 ГБ, 2500—2990/20000 | 559 | 6208 | 111 000 |
21 | RTX 4090 24 ГБ, 2520—2640/21000 | 377 | 10783 | 286 000 |
Что касается стоимости, применяем те же критерии, но используем рейтинг для определения цены на новинку с другой стороны. Тем не менее, GeForce RTX 5080 позиционируется именно как флагманская. игровая В связи с этим ситуация с GeForce RTX 4090, которая активно используется в серверах и дата-центрах для расчетов и построения нейронных сетей, к GeForce RTX 5080 неприменима. В нашем рейтинге GeForce RTX 5080 обошел бы соперников GeForce RTX 4080/Super (при сохранении их текущей стоимости) при цене 150 тысяч рублей.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/hehm4gp42r81l65333.jpg)
Выводы и сравнение энергоэффективности
Ускоритель Nvidia GeForce RTX 5080 (16 ГБ) — новый GeForce RTX 50, второй по уровню модели после GeForce RTX 5090, но флагманский вариант только для игр (GeForce RTX 5090 — не исключительно игровое устройство).
Для анализа пройдем краткий экскурс в историю. Посмотрим, насколько отличаются «предфлагманы» новых поколений от флагманов предыдущих, обратившись к обзорам и сводным таблицам рейтинга iXBT.com. Цены не будем рассматривать (курс рубля был другой). Безусловно, берем классические игры без трассировки лучей и технологий динамического масштабирования.
GeForce RTX 2080, занимающая второе место после GeForce RTX 2080 Ti, против GeForce GTX 1080 Ti, бывшего флагманом.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/zpt0r6wpxd703efx2n.jpg)
GeForce RTX 2080 в среднем показывал результат на 18% выше, чем GeForce RTX 1080 Ti.
GeForce RTX 3080, следующая за GeForce RTX 3090, противостоит GeForce GTX 2080 Ti, бывшему флагманом.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/28ixn75jzmgl73iq2c.jpg)
GeForce RTX 3080 превзошёл GeForce RTX 2080 Ti в среднем на 25%.
GeForce RTX 4080, следующая по уровню после GeForce RTX 4090, противостоит GeForce GTX 3090 Ti.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/o2g1crcbrfndeywk0t.jpg)
Разница производительности между GeForce RTX 4080, которая занимает второе место в линейке GeForce RTX 40, и GeForce RTX 3090 Ti, являющимся лидером линейки GeForce RTX 30, уменьшилась до 11%, но всё равно. Новый усовершенствованный ускоритель второго уровня превзошёл по скорости флагманский ускоритель первого уровня прошлого поколения. .
Наблюдаемое сейчас явление таково: GeForce RTX 5080 не превосходит по показателям производительности GeForce RTX 4090, а уступает ему достаточно ощутимо. Не случайно много рецензентов называют GeForce RTX 5080 «GeForce RTX 4080 Super Ti».
![](https://digitalartspace.ru/wp-content/uploads/2025/02/vm2i6dplhxirtg7q5y.jpg)
Цены — особый случай. Вряд ли кто-нибудь скоро сможет купить его по рекомендованной цене в 999 долларов, даже с учётом налогов (возможно, это будет возможно лишь перед выпуском новой модели). Два фактора существенно влияют на это.
- По подобным ценам (999 долларов плюс налоги) могут продаваться только карты самой Nvidia, потому что продукт не массовый, выпускается небольшими партиями (дизайн дорогой и очень сложный), а компания может себе позволить получать минимум прибыли от продажи Founders Edition (в основном такие карты работают на имидж производителя). Партнеры Nvidia не в состоянии продавать свои модели так же дешево, поскольку получают чипы по весьма высокой цене (здесь Nvidia должна зарабатывать, и много), плюс проблема с GDDR7, которая очень дорогая (хоть при покупке в комплекте с GPU у Nvidia, хоть при отдельном приобретении памяти у Samsung). Вероятно, стоимость карты на выходе с конвейера уже превышает 999 долларов. А еще надо зарабатывать дистрибьютерам и магазинам. Вот и получается, что это никакая не MSRP (рекомендованная производителем розничная цена).
- В Nvidia не могли не учитывать, что 29 января 2025 года начнется китайский Новый год. Это значит, что активность в КНР приостанавливается как минимум на две недели, а часто и за три-пять дней до праздника. 90% видеокарт производятся в Китае, там же начинаются логистические маршруты (и их обслуживанием занимаются китайцы, которые хотят праздновать). То есть что успели накопить до 20-22 января, то и отправили на прилавки, а следующие поставки начнутся не ранее 7 февраля. Вот почему ажиотаж, на радость спекулянтам. Зачем было назначать продажи именно на такие даты? Почему нельзя было перенести на 7 февраля, как минимум? Ответ очевиден: для Nvidia это шанс создать искусственный дефицит, который может закрыть их собственные промашки с производством чипов.
Карты появились в продаже с ценами от 170 до 220 тысяч рублей за модель GeForce RTX 5080. Цена в 170 тысяч была практически недоступна, но ожидается, что ажиотаж снизится, и цены стабилизируются около 180 тысяч рублей. Для рейтинга полезности использовалась именно такая цена. В обзорах серийно выпускаемых видеокарт рейтинг будет корректироваться с учетом актуальных цен. Ранее было отмечено, что GeForce RTX 5080 будут привлекательны при стоимости в 150 тысяч рублей, но имеются нюансы.
Переход к возможностям GeForce RTX 5080 и встроенным технологиям проходит плавно. Обзор спецификаций графического ядра и грубая оценка показывают, что само ядро немного увеличилось (по сравнению с предшественником AD103), но пропускная способность памяти возросла колоссально из-за использования GDDR7 со скоростью 30 Гбит/с (при той же шине обмена с памятью в 256 бит). Скорее всего, большая часть прироста производительности получена именно за счёт увеличения пропускной способности памяти. Проверить это невозможно: нельзя снизить частоту работы видеопамяти GeForce RTX 5080 до уровня GeForce RTX 4080 или повысить частоту работы видеопамяти GeForce RTX 4080 до уровня GeForce RTX 5080. Новое ядро не просто AD103 с увеличенным количеством блоков и быстрой памятью. Мы уже подробно рассказали о нюансах архитектуры Blackwell, включая особенности работы Blackwell с новой технологией мультикадровой генерации (MFG). Обратите внимание на первые тесты GeForce RTX 5080 с использованием технологии DLSS 4, особенно при генерации трёх и более кадров на основе разных моделей ИИ, и оцените, как GeForce RTX 5080 превосходит предыдущего флагмана GeForce RTX 4090 в таких тестах.
GeForce RTX 5080 соответствует общепринятой тенденции, когда ускорители второго уровня нового поколения превосходят флагманы предыдущего — но это достигается только с помощью MFG. Недавно Nvidia выпустила обновленный драйвер, в который включена новая версия фирменного приложения Nvidia App, позволяющая ускорителям GeForce RTX 50 принудительно включать MFG в играх, поддерживающих старую технологию генерации промежуточных кадров (DLSS 3), таких игр уже много. Это означает, что список игр, где карты GeForce RTX 50 могут значительно повысить производительность, резко увеличился.
Вопрос качества графики при использовании DLSS 4, а также возможных задержек и лагов мы разберем в отдельном материале, который появится вскоре. Этот аспект очень сложный и его нельзя исследовать в рамках обычного обзора видеокарты или текущего материала. В трех играх (Alan Wake 2, Cyberpunk 2077 и Hogwarts Legacy), где уже добавили поддержку DLSS 4 через патчи, явных нареканий на качество не было — встречались лишь мелкие артефакты, которые не портили впечатление при генерации 4 кадров. Предполагаем, что как и с первой версией DLSS, оптимизации под игры будут вестись непрерывно, и DLSS 4 можно будет пользоваться полноценно.
Тщательный анализ концепции MFG показывает значительное увеличение доли программной части в видеокарте как в аппаратно-программном комплексе. Несмотря на то, что GPU сохраняет традиционный набор аппаратных блоков, подобный предшественникам, но получил инструменты для работы с нейронными сетями, включая программные оптимизации, может считаться ускорителем нового поколения.
Развивающаяся программная составляющая ускорителей все активнее использует достижения в области искусственного интеллекта, а аппаратные части графических процессоров нуждаются в блоках для быстрых вычислений. Руководитель Nvidia неоднократно подчеркивал это в своих публичных выступлениях. Следует ли отсюда заключение о том, что игровая индустрия перейдет к генерации кадров и сцен во время игрового процесса? Время покажет, но мы считаем эти опасения преувеличенными. Вероятно, генерация будет ограничена несколькими кадрами, поскольку сложно предсказать поведение искусственного интеллекта при генерировании контента в игре. Кроме того, цензоры в некоторых странах могут запретить игры с использованием такого подхода, что невыгодно издателям. Будем наблюдать, но мы уже живем в интересное время, когда видеокарты могут превосходить флагманские решения исключительно за счет генеративного искусственного интеллекта.
Возвращаемся с небес на землю.
В классических играх без RT и прочих программных улучшений, а также в играх с RT и/или технологиями динамического масштабирования DLSS(1/2/3)/FSR/XeSS новый ускоритель GeForce RTX 5080 располагается между GeForce RTX 4080 Super и GeForce RTX 4090 (ближе к первому). В играх, где доступно DLSS 4 (Multi Frame Generation, MFG), производительность его резко возрастает, и новинка легко опережает GeForce RTX 4090.
Показатель энергоэффективности у GeForce RTX 5080 наилучший, Nvidia достойна похвалы за создание ядра с оптимальным сочетанием производительности и потребляемой энергии.
Выход GeForce RTX 5080 через неделю после GeForce RTX 5090 несколько омрачила её слабее выраженная привлекательность по сравнению с флагманом. Несмотря на то, что архитектура Blackwell сохранена, и второе решение в линейке предлагает те же улучшения, практически все они не окажут непосредственного влияния на пользовательский опыт в ближайшее время.
Улучшенная технология DLSS 4 – однозначно достоинство Blackwell. Это касается как многокадровой генерации (которая функционирует неплохо при достаточно высоком уровне производительности), так и новой модели ИИ с лучшим качеством, работающей также на GPU предыдущих поколений. Улучшения и нововведения, такие как нейрорендеринг и мегагеометрия, интересны и перспективны, но на GeForce RTX 5080 их реализация маловероятна в обозримом будущем, а платить придется сразу.
Ждем появления этих возможностей в DirectX и поддержки со стороны других участников рынка, а также игровых консолей. Однако отдельные разработчики игр могут внедрить некоторые из предложенных Nvidia технологий раньше этого, на что мы очень надеемся.
Нейронный рендеринг повышает качество изображения и производительность, компенсируя застой в производстве полупроводников. Технологии DLSS увеличивают частоту кадров, генерируя большинство пикселей при помощи искусственного интеллекта. Ray Reconstruction сокращает количество лучей для трассировки лучей, используя шумоподавление и реконструкцию деталей. ИИ постоянно совершенствуется: качество рендеринга растет, а вычислительные затраты и объем памяти уменьшаются. Технологии в Blackwell ускоряют использование ИИ разработчиками, включая реальное время рендеринга и моделирования на основе генеративного ИИ. Генеративный ИИ поможет создавать реалистичные ландшафты, физические симуляции и поведение персонажей. В будущем полная реконструкция лиц с помощью ИИ станет возможной, а профессиональные приложения для 3D-дизайна смогут использовать возможности Blackwell для ускорения создания контента.
Конкретная протестированная карта Palit GeForce RTX 5080 GameRock (16 ГБ) Модель имеет большие размеры 33×15 см и занимает 4 слота в системном блоке. Применение системы охлаждения (СО) умеренно тихое, карта может потреблять до 350 Вт (официальный лимит Nvidia — 360 Вт) и оснащена одним разъемом питания 12VHPWR (PCIe 5.0). У карты четыре видеовыхода: один HDMI 2.1b и три DisplayPort 2.1b. Последний обеспечивает пропускную способность до 80 Гбит/с в режиме передачи UHBR 20 и позволяет подключить 8K-монитор с частотой обновления 60 Гц по одному кабелю. Карта имеет роскошный кожух СО, названный производителем «хамелеоном», который впечатляет даже без подсветки, а с ней — ещё красивее, без «цыганщины», в которой обвиняли предыдущий вариант СО серии GameRock с кристаллами на кожухе. Единственный минус визуальной стороны этого решения — сильно контрастирующие чёрные круги вентиляторов: лопасти могли быть полупрозрачными, чтобы часть свечения подсветки попадала на них.
Компания Palit порадует комплектацией: помимо видеокарты в комплекте есть переходник питания, адаптер для синхронизации подсветки, раздвижная подставка, наклейки и коврик для мыши.
GeForce RTX 5080 обеспечит превосходный игровой опыт на максимальных настройках качества, как с включенным, так и без трассировки лучей и технологий масштабирования, в разрешениях до 2160p (4K). В некоторых играх при использовании DLSS/FSR/XeSS комфортная игровая производительность доступна и в разрешении 8K.
![](https://digitalartspace.ru/wp-content/uploads/2025/02/4i4fteda7ok65hrkla.jpg)
В номинации «Оригинальный дизайн» карта Palit GeForce RTX 5080 GameRock (16 ГБ) получила награду:
![](https://digitalartspace.ru/wp-content/uploads/2025/02/d16idn9zsfahckugph.png)