Обзор видеокарты Gigabyte GeForce RTX 5070 Gaming OC 12G

Общая информация о GeForce RTX 5070

Обзор видеокарты Palit GameRock RTX 5080 с объёмом памяти 12 ГБ.

Продолжаем изучать видеокарты Nvidia новой графической архитектуры Blackwell. Производитель начал выпуск новой серии GeForce RTX 50 с флагмана, постепенно снижая стоимость: после GeForce RTX 5090 и GeForce RTX 5080 вышла GeForce RTX 5070 Ti, а затем пришла очередь GeForce RTX 5070 — самой доступной видеокарты в линейке, которая обеспечивает достаточную производительность для игр в разрешении 2560×1440 с максимальными настройками качества, включая трассировку лучей. Мы максимально подробно разобрали все возможности новой архитектуры, ознакомиться с ними можно в обзоре первого представителя семейства, побывавшего у нас в руках.

Новая архитектура получила несколько модификаций. CUDA-ядра Blackwell получили улучшения: теперь возможно параллельное выполнение FP32- и INT32-вычислений на всех ядрах, ранее это было доступно лишь для половины ядер. Ядра для трассировки лучей четвертого поколения поддерживают ускорение дополнительных функций, включая увеличение геометрической сложности Mega Geometry. Тензорные ядра пятого поколения поддерживают новый формат данных FP4 для повышения производительности с потерей точности, допустимой для некоторых задач в сфере искусственного интеллекта. В технологии DLSS появилась многокадровая генерация, обеспечивающая большую частоту кадров и лучшее качество картинки за счет более эффективных ИИ-моделей. Nvidia предлагает перспективные методы нейронного рендеринга для отрисовки материалов и объектов с помощью возможностей нейросетей — Microsoft скоро добавит эту возможность в шейдеры DirectX.

Сегодня познакомимся с GeForce RTX 5070, появившейся на рынке 4 марта. Это уже четвертая видеокарта Nvidia в этом году и поддерживает все новейшие технологии архитектуры Blackwell, включая нейронный рендеринг и многокадровую генерацию в DLSS 4, при этом имеет сравнительно скромную рекомендованную цену в $549, что значительно ниже суммы в $749, назначенной для GeForce RTX 5070 Ti. Модель грозит стать наиболее массовой из выпущенных на данный момент. Это первое по-настоящему массовое предложение в серии, сменяющее довольно успешную модель GeForce RTX 4070, и на момент выхода — самая недорогая для тех, кто хочет опробовать новые функции архитектуры Blackwell.

Изображение: Nvidia

GeForce RTX 5070 основана на графическом процессоре GB205 архитектуры Blackwell для игровых систем. В GeForce RTX 5070 Ti используется урезанный чип GB203, известный по GeForce RTX 5080. GB205 значительно менее производительный, чем GB203: всего 6144 активных CUDA-ядра против 8960 у GeForce RTX 5070 Ti. В GeForce RTX 5070 используется почти полная версия чипа с 192-битной шиной GDDR7-памяти объемом 12 ГБ. Пропускная способность памяти увеличилась на треть по сравнению с GeForce RTX 4070 благодаря применению нового типа памяти GDDR7.

Запуск серии GeForce RTX 50 был неровным: первые драйверы приводили к проблемам с отображением, а новый 16-контактный разъем питания вызвал споры из-за повышенного энергопотребления топовой модели GeForce RTX 5090. Больше всего покупателей огорчила ситуация с недостаточным объемом производства, ограниченными партиями и высокими ценами на всю линейку. Nvidia постепенно исправляла программные проблемы, младшие модели не страдали от выгорания разъемов питания из-за меньшего энергопотребления. С производством и дефицитом было сложнее оперативно разобраться.

В последнее время цены на новые видеокарты взлетели почти у всех производителей: за доступными моделями сразу идёт охота, а реальные цены значительно превышают рекомендованные. Intel Arc B580 не удаётся купить по $249, GeForce RTX 5090, GeForce RTX 5080 и GeForce RTX 5070 Ti продаются за гораздо большие деньги, чем заявленные. Та же ситуация с GeForce RTX 5070 и Radeon RX 9070 (XT). Если в 2021 году дефицит графических процессоров был связан с майнинговым бумом, то сейчас причины скорее кроются в развитии искусственного интеллекта: большая часть мощностей используется для соответствующих продуктов, а не игровых GPU. Nvidia недавно сообщила о рекордной прибыли за прошедший финансовый год, и большую часть прироста приносят решения для центров обработки данных и ИИ. Игровые видеокарты всё ещё в портфеле компании, но явно перешли на… если не на вторые роли, то равноценные с вычислительными GPU — компания давно не чисто «игровая», и по финансовым показателям это всё более очевидно.

Благодаря ограниченному объему производства новейших техпроцессов производство продукции для вычислительных задач выгоднее, чем графических процессоров для игровых ПК. Nvidia не совсем отказалась от потребительских графических процессоров, однако их количество сократилось – вероятно, недостаточно для полного удовлетворения спроса, особенно в начале продаж.
Ситуация влияет и на видеокарты прошлых годов: большинство продается дороже стартовой цены, за исключением недорогих решений, таких как GeForce RTX 4060 и Radeon RX 7600. На вторичном рынке цены решений с уровня GeForce RTX 4070 и выше также значительно превышают рекомендованные на момент запуска продаж. Radeon также продаются выше рекомендуемой цены, и это касается даже вторичного рынка.
Пока нет предпосылок к изменению сложившейся ситуации. Перспективы для игровых GPU не радужны минимум на несколько месяцев вперед. В отличие от ситуации с майнингом, когда переход криптовалюты Ethereum на другой метод распределения спас всех, ИИ остается туманным направлением: индустрия находится в начале роста, и приоритетом является производство дорогих GPU для центров обработки данных.

Перейдем к рассмотрению GeForce RTX 5070. Графическая архитектура Blackwell не сильно отличается от предшествующей Ada Lovelace, которая сама по себе во многом напоминает Ampere. Все эти архитектуры имеют общие черты, поэтому изучить предыдущие статьи о них будет полезно.

  • [24.02.25] Обзор видеоускорителя Nvidia GeForce RTX 5070 Ti
  • [03.02.25] Обзор видеоускорителя Nvidia GeForce RTX 5080
  • [05.02.24] Анализ видеопроцессора Nvidia GeForce RTX 4070 Super.
  • [10.10.22] Теоретический обзор Nvidia GeForce RTX 4090 и RTX 4080
Изображение: Nvidia
Графический ускоритель GeForce RTX 5070
Кодовое имя чипа GB205
Технология производства 5 нм (TSMC 4N)
Количество транзисторов 31,1 млрд
Площадь ядра 263 мм²
Архитектура Стандартизированная система с массой процессоров для параллельной обработки всех типов данных: вершин, пикселей и подобных.
Аппаратная поддержка DirectX ДиректХ 12 Ультимейт поддерживает уровень возможностей «Feature Level» 12_2.
Шина памяти Архитектура включает 6 отдельных 32-битных контроллеров памяти, способных работать с памятью GDDR7.
Частота графического процессора до 2512 МГц
Вычислительные блоки Из 50 потоковых мультипроцессоров функционируют 48, имеющих 6144 (из 6400) CUDA-ядер для целочисленных расчётов INT32 и вычислений с плавающей запятой FP16/FP32/FP64.
Тензорные блоки 192 из 200 тензорных ядер для матричных вычислений с различными типами данных.
Блоки трассировки лучей 48 из 50 ядра RT используются для определения пересечения лучей с треугольниками и граничными объемами BVH.
Блоки текстурирования Текстурные адресация и фильтрация: 192 из 200 блоков, поддержка FP16/FP32-компонента, трилинейная и анизотропная фильтрация для всех форматов.
Блоки растровых операций (ROP) Система обладает десятью широкоформатными блоками ROP размером 80 пикселей. Блоки поддерживают различные режимы сглаживания, включая программируемые, и работают в форматах буфера кадра FP16/FP32.
Поддержка мониторов HDMI 2.1b и DisplayPort 2.1b
Спецификации видеокарты GeForce RTX 5070
Частота ядра 2325/2512 МГц
Количество универсальных процессоров 6144
Количество текстурных блоков 192
Количество блоков блендинга 80
Эффективная скорость памяти 28 Гбит/с
Тип памяти GDDR7
Шина памяти 192 бит
Объем памяти 12 ГБ
Пропускная способность памяти 672 ГБ/с
Вычислительная производительность (FP32) до 30,9 терафлопс
Теоретическая максимальная скорость закраски 201 гигапиксель/с
Теоретическая скорость выборки текстур 482 гигатекселя/с
Шина PCI Express 5.0 x16
Разъемы по выбору производителя
Энергопотребление до 250 Вт
Дополнительное питание один 16-контактный разъем
Количество доступных слотов в системном блоке. по выбору производителя
Рекомендуемая цена $549

Название новой модели соответствует принципу наименования решений компании — это GeForce RTX 5070, которая заменяет в линейке оригинальную GeForce RTX 4070 и вышедшую около года назад GeForce RTX 4070 Super. В новой линейке выше расположена GeForce RTX 5070 Ti на базе более мощного кристалла GB203 в урезанной версии, а ниже пока что нет ничего, хотя менее дорогие варианты типа GeForce RTX 5060 (Ti) вероятно выпустят в будущем.

GeForce RTX 5070 стоит $549, что на $50 меньше, чем GeForce RTX 4070. Однако купить ее по рекомендованной цене невозможно из-за дефицита. Продаётся она дороже — на 30%-40% и даже больше. GeForce RTX 5070 Ti стоит $750, но купить её дешевле $1000 вряд ли получится. Реальная цена GeForce RTX 5070 начинается с $700. Аналогичная ситуация с видеокартами AMD — их тоже нельзя купить по рекомендованной цене. Rivals для GeForce RTX 5070 — Radeon RX 9070 ($549) и Radeon RX 9070 XT ($599), выпущенные спустя пару дней после решения Nvidia. Если многокадровая генерация не нужна, можно рассмотреть GeForce RTX 4070 Ti Super с 16 ГБ памяти и более высокой производительностью.

Современные модели видеокарт GeForce RTX 50 и Radeon RX 9070 (XT) по заявленной цене купить практически невозможно. Первые партии предлагались по рекомендованным ценам, но их раскупили быстро. Сейчас новые видеокарты доступны только с наценкой от $150 до $200, а в некоторых случаях — больше (например, для GeForce RTX 5090). Рекомендованные цены соответствуют базовым моделям без разгона и улучшенных характеристик, а последующие партии имеют более высокие розничные цены. Фактически, рекомендованные цены являются маркетинговой уловкой для запоминания стоимости видеокарты, но при покупке приходится доплачивать сверху.

Ранее наблюдались похожие ситуации, вспомнить можно GeForce GTX 1060, которую долгое время не удавалось приобрести по рекомендованной цене. Radeon RX Vega с памятью HBM также продавались сначала заметно дороже MSRP. Пользователи часто обвиняют компании в том, что рекомендованные цены вводят в заблуждение, и это действительно так, хотя такой цели и не ставилось. Рекомендуем обращать внимание не на рекомендованные цены, а на реальные, по которым рассчитываются рейтинги видеокарт. В начале продаж определить реальную розничную цену сложно, но позже она стабилизируется, именно по ней стоит принимать решение о покупке — для этого и рассчитаны рейтинги производительности и полезности.

GeForce RTX 5070 оснащена видеопамятью объемом 12 ГБ, что является неоднозначным решением. Оно оправдано с технической точки зрения, поскольку при 192-битной шине следующий объем составлял бы 24 ГБ, что слишком дорого для GDDR7-памяти. Объем памяти соответствует GeForce RTX 4070, GeForce RTX 4070 Super и GeForce RTX 4070 Ti. GeForce RTX 4070 Ti Super и GeForce RTX 5070 Ti имеют уже 16 ГБ, как и Radeon RX 9070 (XT). В настоящее время 12 ГБ памяти достаточно для игр в разрешении 2560×1440 даже с включенной трассировкой лучей. Возможно, этого объема будет недостаточно в 4K-разрешении при генерации кадров и в будущих играх при 2560×1440. Однако решение оправдано тем, что увеличение объема памяти потребовало бы более широкой шины памяти и большего кристалла, что повысило бы себестоимость.

Модель GeForce RTX 5070 имеет версию Founders Edition от Nvidia, в отличие от GeForce RTX 5070 Ti. Поскольку FE-версии доступны в России редко, это мало актуально для большинства покупателей. Это собственная разработка компании, похожая на другие Founders Edition, но без светодиодной подсветки. Система охлаждения GeForce RTX 5070 FE использует четыре тепловые трубки и архитектуру двойного сквозного продувания Dual Flow-Through, как у GeForce RTX 5090 FE и GeForce RTX 5080 FE, но упрощенную. Карта компактна и внешне напоминает мини-версию GeForce RTX 5090 FE. Радиатор охлаждает графический процессор, микросхемы памяти и VRM, но конструкция проще, без жидкого металла и испарительной камеры. Двухслотовое исполнение проще для модели с потреблением 250 Вт, а не 575 Вт, как у GeForce RTX 5090.

Рассматриваемая модель потребляет до 250 Вт, на 50 Вт больше, чем GeForce RTX 4070, и на 30 Вт выше показателя GeForce RTX 4070 Super. Графические процессоры Blackwell используют тот же техпроцесс, что и Ada Lovelace, поэтому это не удивительно. Несмотря на то, что графический процессор в Founders Edition нагревается умеренно, пользователи отмечают заметный шум вентиляторов, так что карта пусть и не слишком громкая, но точно и не тихая. Для дополнительного питания используется 16-контактный разъем 12V-2×6 под углом для удобства, а новый переходник на пару 8-контактных разъемов имеет более продуманную конструкцию и надежность по сравнению с предыдущими версиями. У GeForce RTX 5070 потреблением до 250 Вт не должно возникнуть никаких проблем из-за возможного перегрева кабелей и разъемов. FE-карта имеет обычное количество выходов на дисплеи — три DisplayPort 2.1a с поддержкой UHBR20 (80 Гбит/с) и один HDMI 2.1b.

Нам важнее, что партнеры Nvidia уже представили на рынке множество GeForce RTX 5070 собственного дизайна: разогнанные модели с разными системами питания и охлаждения. Эти карты официально не продаются по рекомендованной цене, а имеют более высокую стоимость. Сразу после выхода в продажу видеокарты с новым графическим процессором стали доступны в рознице от таких компаний как Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, PNY, Zotac и других.

Особенности архитектуры

Графический процессор GB205 — последний из трёх представителей архитектуры Blackwell первой волны. GeForce RTX 5070 построена на модификации GB205-300-A1 и поддерживает все возможности флагманского GB202. GB205 имеет размер кристалла и количество SM, которых не было в предыдущем поколении Ada Lovelace. Nvidia не выпустила последователя AD104, так как GeForce RTX 5070 Ti основана на более крупном чипе GB203, а GeForce RTX 5070 — на пару ступеней меньшем GB205. Кристалл среднего размера с площадью 263 мм² содержит чуть больше 31 миллиарда транзисторов — это меньше, чем было у AD104, в котором отключили значительную часть блоков для модели GeForce RTX 4070. В этом поколении Nvidia решила сэкономить, выпустив для такого уровня немного другой чип, ведь GB205 по размеру намного меньше кристаллов, используемых в старших моделях.

Архитектура графических процессоров Nvidia серии Ampere остается прежней. Как и все графические процессоры компании, GB205 состоит из кластеров Graphics Processing Cluster (GPC), в которых объединены несколько кластеров Texture Processing Cluster (TPC). Каждый TPC содержит потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. GPC выполняет основные вычисления внутри кластера, имеет свой движок растеризации Raster Engine и несколько кластеров TPC, состоящих из вдвое большего количества мультипроцессоров SM.

Полная версия графического процессора GB205 имеет 5 кластеров GPC, состоящих из 25 кластеров TPC, которые включают 50 потоковых мультипроцессоров SM. В состав входят 6400 CUDA-ядер, 50 RT-ядер, 200 тензорных ядер, 200 текстурных TMU блоков и 80 блоков ROP.
В версии GB205-300-A1 для GeForce RTX 5070 используется почти полный кристалл, в котором отключен один TPC в одном из GPC, состоящий из пары мультипроцессоров — то есть активными остаются 48 SM, что дает 6144 CUDA-ядра, 192 тензорных ядра, 48 RT-ядра и 192 блока текстурирования TMU. В GeForce RTX 5070 активны все 80 ROP, имеющихся в GB205 — это отличие от видеокарты GeForce RTX 4070 предыдущего поколения, которая имела лишь 64 из 80 ROP в полном AD104, а в GeForce RTX 4070 Ti все были активны.

Графический процессор функционирует на базовой частоте 2325 МГц, которая может увеличиваться до турбо-частоты 2512 МГц. Система памяти включает шесть 32-битных контроллеров GDDR7-памяти, формируя общую 192-битную шину памяти. Память объемом 12 ГБ работает на эффективной скорости передачи данных 28 Гбит/с, обеспечивая общую пропускную способность 672 ГБ/с — больше на треть по сравнению с GeForce RTX 4070, имеющим GDDR6X-память со скоростью 21 Гбит/с. В GeForce RTX 5070 задействованы все 48 МБ L2-кэша, что еще повышает возможности работы с памятью, поскольку объем кэша превосходит 36 МБ в GeForce RTX 4070.

В обзоре GeForce RTX 5080 подробно рассказано о новом типе видеопамяти GDDR7 и изменениях в мультипроцессорах Blackwell. В новой архитектуре все 128 ядер CUDA на SM могут выполнять операции FP32 и INT32 параллельно, ранее такую возможность имела только половина ядер SM для INT32. Новые тензорные ядра получили возможность использования формата данных FP4 для повышения производительности с некоторой потерей точности. RT-ядра четвертого поколения включают больше аппаратных блоков для ускорения функций трассировки, самой впечатляющей из которых является Mega Geometry. Эта концепция резко повышает геометрическую сложность объектов 3D-сцены при трассировке лучей и большом количестве динамических объектов за счет более широкого использования иерархии в ускоряющих структурах BVH. RT-ядра четвертого поколения в Blackwell специально созданы для эффективной работы Mega Geometry, они имеют специальные кластерные движки для реализации новых схем и обработки ускоряющих структур.

В архитектуре Ada Lovelace и предыдущих версиях мультипроцессор был создан и отлажен для стандартных шейдеров. В Blackwell добавили оптимизации, необходимые для эффективного использования нейронных шейдеров. В обзоре GeForce RTX 5080 говорилось о том, что новая архитектура открывает возможности нейрорендеринга Neural Rendering. Это перспективные технологии в 3D-графике, позволяющие применять возможности генеративных нейросетей в привычных сценах с растеризацией и трассировкой лучей. Nvidia предлагает потенциал для более широкого использования ИИ в процессе рендеринга, хотя на данный момент это раскрыто лишь в работе технологий масштабирования DLSS. Новые возможности расширяют сравнительно простую реконструкцию деталей при масштабировании, а также генерацию дополнительных кадров. Для успешной работы нейрорендеринга в Blackwell внедрили новый аппаратный планировщик ИИ — AI Management Processor (AMP), который более эффективно распределяет задачи ИИ и рендеринга по блокам графического процессора.

В контроллере вывода на дисплеи и медиадвижках GeForce RTX 50 внесены важные изменения. Для вывода изображения графические процессоры Blackwell получили поддержку разъемов DisplayPort 2.1b, обеспечивающих пропускную способность до 80 Гбит/с в режиме передачи UHBR 20. Благодаря этому можно использовать дисплеи с высокими разрешением и частотой обновления: 8K при 165 Гц с DSC и 4K при 480 Гц с DSC. Такая пропускная способность позволяет подключить 8K-дисплеи с частотой обновления 60 Гц с использованием одного кабеля.

Новые видеокарты семейства GeForce RTX 50 получили поддержку кодирования и декодирования видео с цветовой субдискретизацией 4:2:2 для форматов H.264 и H.265. Несмотря на одинаковые возможности по обработке видео у всех GPU семейства Blackwell, производительность кодирования и декодирования видео данных различается. В топовом графическом процессоре GB202 три блока кодировщиков и два декодера, в GB203 по два таких блока каждого, а младший GB205 имеет по одному блоку NVEnc и NVDec. Тем не менее производительность при работе с видеоданными в формате H.264 всё равно увеличилась по сравнению с GeForce RTX 40, так как сами блоки были улучшены.

Вкратце поговорим и об улучшениях DLSS 4В новом поколении Blackwell нейросеть способна создавать до трёх лишних кадров с помощью технологии. Multi Frame Generation (MFG)Алгоритм генерации кадров стал быстрее и более эффективным в плане использования видеопамяти, что позволяет достичь значительно большей частоты кадров по сравнению с обычным рендерингом. Новые модели ИИ на основе трансформеров заменили предыдущие модели нейросетей при масштабировании разрешения и реконструкции лучей при трассировке, улучшая качество изображения. Эти возможности доступны для серий GeForce RTX 40 и GeForce RTX 30, а только для GeForce RTX 50 доступна генерация нескольких кадров одновременно.

Изображение: Nvidia

DLSS — одно из главных преимуществ решений Nvidia. В DLSS 4 появилась многокадровая генерация, которая может увеличить количество кадров в три или даже четыре раза по сравнению с DLSS 3. Задержка игры при этом не меняется. При базовой частоте кадров 40-50 FPS это позволяет добиться более плавной игры на мониторах с частотой обновления 144—180 Гц. Качество изображения сгенерированных кадров достаточно хорошее, хотя можно увидеть артефакты, но во время игры их вряд ли заметно.

Важно понимать: многокадровая генерация не обеспечит игровые 60 FPS при исходных 15-20 FPS без учета сгенерированных кадров. Визуально всё будет плавно, но ощущаться это будет вяло, как в желе, поскольку игра реагировать на действия всё равно со скоростью 15 FPS. Если же без генерации кадров получается хотя бы 40-50 FPS, то дополнительные сгенерированные кадры улучшают общий комфорт. Это полезная опция, которую нужно включать с умом, так как она сильно зависит от производительности и монитора, но польза набора технологий DLSS неоспорима.

Предварительная оценка производительности

Рассмотрим теоретические характеристики всех представленных графических карт серии GeForce RTX 50, построенных на трёх чипах семейства GB20x, чтобы понять различия между ними.

RTX 5090 RTX 5080 RTX 5070 Ti RTX 5070
Графический процессор GB202 GB203 GB203 GB205
Транзисторов, млрд 92,2 45,6 45,6 31,1
Площадь кристалла, мм² 750 378 378 263
Количество ядер CUDA 21760 10752 8960 6144
Количество блоков TMU 680 336 280 192
Количество блоков ROP 176 112 96 80
Количество RT-ядер 170 84 70 48
Количество тензорных ядер 680 336 280 192
Турбо-частота, ГГц 2,41 2,62 2,45 2,51
Объем памяти, ГБ 32 16 16 12
Шина памяти, бит 512 256 256 192
Пропускная способность, ГБ/с 1792 960 896 672
Энергопотребление, Вт 575 360 300 250
Цена, $ 1999 999 749 549

Флагманская модель GeForce RTX 5090 на чипе GB202 выделяется среди остальных решений: ей присущ ощутимый прирост сложности и производительности. Другие чипы семейства Blackwell получили менее впечатляющие характеристики. Кристалл GB203 почти вдвое меньше флагмана по всем параметрам, не говоря уже о самом мелком GB205. Разница между последними двумя GPU полуторакратная, что говорит о большой разнице производительности между GeForce RTX 5070 и GeForce RTX 5070 Ti.

Согласно теории, GeForce RTX 5070 может быть более чем на 40% медленнее GeForce RTX 5070 Ti как по вычислительной мощности, так и по большинству других показателей. Разница в производительности при одинаковой цене (ПСП) незначительная. Место GeForce RTX 5070 в линейке таково, что она существенно отстает от GeForce RTX 5070 Ti, между ними заметно просматривается разрыв. Для понимания прироста теоретических показателей в этом поколении рассмотрим основные характеристики новинки вместе с моделями уровня GeForce RTX xx70 из пары предыдущих поколений.

Видеокарта RTX 5070 RTX 4070 RTX 3070
Графический процессор GB205 AD104 GA104
Кол-во транзисторов, млрд 31,1 35,8 17,4
Площадь чипа, мм² 263 294 392
Количество ядер CUDA 6144 5888 5888
Количество тензорных ядер 192 184 184
Количество RT-ядер 48 46 46
Количество блоков TMU 192 184 184
Количество блоков ROP 80 64 96
Турбо-частота, ГГц 2,51 2,48 1,73
Объем памяти, ГБ 12 12 8
Шина памяти, бит 192 192 256
Скорость памяти, Гбит/с 28 21 14
Пропускная способность, ГБ/с 672 504 448
Объем L2-кэша, МБ 48 36 4
FP32-вычисления, Тфлопс 30,9 29,2 20,3
Текстурирование, Мтекс/с 482 455 317
Филлрейт, Мпикс/с 201 158 166
Энергопотребление, Вт 250 200 220
Цена, $ 549 599 499

Рассмотрим ключевые характеристики видеокарт одного класса из трёх поколений. Разница между GeForce RTX 4070 и GeForce RTX 3070 значительна: первая в полтора раза быстрее второй во всех аспектах, кроме закраски и пропускной способности памяти. Вычислительная производительность и скорость текстурирования выросли вдвое. Показатели GeForce RTX 5070 по отношению к GeForce RTX 4070 незначительны — одинаковый техпроцесс для GB205 и AD104, а также схожая сложность GPU сказываются на результатах.

GeForce RTX 4070 использует графический процессор AD104, который предлагает 46 из 60 доступных мультипроцессоров SM. GB205 имеет физически лишь 50 SM в чипе, из которых в GeForce RTX 5070 задействованы 48 мультипроцессоров. Тактовые частоты GeForce RTX 5070 немного выше по сравнению с GeForce RTX 4070, но реальные тактовые частоты могут быть выше заявленных у графических процессоров Nvidia. Более высокий предел энергопотребления у новой модели может способствовать этому. Но разница между этими GPU всё равно невелика.

GeForce RTX 5070 теоретически может достигать пиковой FP32-производительности в 30,9 терафлопс, немного превышая показатели GeForce RTX 4070 (29,2 терафлопс). Вместе с тем энергопотребление возросло с 200 Вт до 250 Вт, учитывая более быструю GDDR7-память.
Это может принести прирост производительности в 6% или даже 33%, по сравнению с GeForce RTX 4070. Но реальные показатели могут отличаться. Архитектура Blackwell также увеличила количество рассчитываемых пересечений лучей/треугольников за такт в RT-ядрах, тензорные ядра поддерживают новый формат FP4, а CUDA-ядра получили полноценную поддержку одновременного исполнения операций FP32 и INT32 всеми ядрами в мультипроцессоре. Увеличение числа вычислительных ядер также важно, и практика показывает, что прирост производительности в большинстве игр скорее близок к верхнему значению.

Nvidia указывает преимущество новой модели над GeForce RTX 4070 (не Super) в два раза больше, но этот прирост производительности не совсем честный, так как зачастую учитывает многокадровую генерацию, которая требовательна к начальной частоте кадров без работы MFG. Без указания конкретных значений FPS непонятно, позволят ли задержки ввода комфортно поиграть при 100+ FPS, так как реальная родная частота кадров может быть ниже уровня минимального комфорта. Лучше смотреть на тесты с реальными значениями FPS. Nvidia также указала на диаграмме игры без DLSS 4, по которым можно провести сравнение чистой производительности — по Resident Evil 4 и Horizon Forbidden West видно, что прирост невелик. Тема DLSS и частоты кадров с генерацией будет раскрыта в отдельном материале.

Изображение: Nvidia

Модель GeForce RTX 5070 продолжила тенденцию небольших приростов от поколения к поколению, характерную для серии GeForce RTX 50, за исключением флагманского решения. В презентации Nvidia был слайд, который многие истолковали как утверждение о том, что GeForce RTX 5070 по скорости догонит GeForce RTX 4090. Компания сама виновата в сложившейся ситуации, так как многие неправильно поняли маркетинговый слайд, хотя представители Nvidia, вероятно, указывали мелким шрифтом на то, что речь шла о скорости с учетом всех возможностей DLSS, таких как многокадровая генерация, которая не поддерживается предыдущим поколением. Однако это их не оправдывает — лукавство есть лукавство.

Реальность не соответствует маркетинговым обещаниям, что необходимо учитывать. В обычных условиях без преимуществ многокадровой генерации новинка на 20% быстрее GeForce RTX 4070 и незначительно опережает улучшенную модель GeForce RTX 4070 Super. Это неплохо для игр в разрешении 2560×1440, но заявления компании основаны на генерации кадров, а не существенных архитектурных улучшениях или увеличении числа исполнительных блоков. Причина подобной тактики Nvidia — застой в производстве полупроводников. Из-за него при производстве кристаллов Blackwell используется тот же техпроцесс, что и для Ada Lovelace. Архитектурных изменений в новом поколении не так много. Больших приростов получить невозможно, поэтому приходится их искать другими способами.

Сразу было понятно, что заявленное соответствие по скорости GeForce RTX 5070 и GeForce RTX 4090 выглядит как преувеличение, поскольку оно основано на появлении многокадровой генерации в DLSS 4. Серия GeForce RTX 50 поддерживает до четырех дополнительных кадров с DLSS 4, а GeForce RTX 4090 хоть и может использовать DLSS 4, но генерация кадров для нее ограничена двукратной. Неудивительно, что при учёте втрое больших возможностей GeForce RTX 5070 по генерации кадров она будет близка к GeForce RTX 4090 по частоте кадров — всех кадров, включая сгенерированные. Но при традиционном рендеринге GeForce RTX 4090 в среднем на 75% быстрее новинки. Многокадровая генерация делает смену кадров более плавной и комфортной, но если базовая частота низкая, то игра будет казаться вялой и не динамичной. Поэтому если включить многокадровую генерацию DLSS 4 на GeForce RTX 5070 в требовательной игре при разрешении 4K, при итоговых 75-100 FPS ощущения останутся на уровне 25 FPS, чего явно мало для комфортной игры. В таких условиях многокадровая генерация имеет больше смысла при более низком разрешении 2560×1440, так как базовая частота кадров при этом будет выше.

GeForce RTX 5070 превосходит GeForce RTX 4070 предыдущего поколения по производительности. Прирост составляет чуть более 20% по сравнению с GeForce RTX 4070, а в разрешении 4K — до 25%. Производительность сравнима с GeForce RTX 4070 Ti, на 5% выше, чем у GeForce RTX 4070 Super, и на 10% ниже, чем у GeForce RTX 4070 Ti Super. В конкуренции с AMD GeForce RTX 5070 находится между Radeon RX 7900 XT и Radeon RX 7900 GRE. Новая Radeon RX 9070 XT должна быть быстрее GeForce RTX 5070, а Radeon RX 9070 — примерно на том же уровне, исключая тяжелую трассировку.

С включенной трассировкой преимущество новинки перед GeForce RTX 4070 составляет порядка 15%-20%, и в таком случае GeForce RTX 5070 можно сравнить лишь с GeForce RTX 4070 Super. Новая модель быстрее даже Radeon RX 7900 XTX, но в серии Radeon RX 9070 заметно улучшили трассировку, что повышает конкуренцию в этом ценовом сегменте. Radeon RX 9070 конкурирует с GeForce RTX 5070 по рекомендованной розничной цене, и у неё есть шанс получить большее распространение и цену ниже из-за меньшего спроса на решения AMD. Radeon RX 9070 XT при цене на $50 выше вряд ли будет конкурировать с GeForce RTX 5070 Ti, зато эта видеокарта должна превзойти GeForce RTX 5070 за сравнительно небольшую прибавку к цене.

Цены на видеокарты напоминают расцвет криптомайнинга в 2021 году: большинство новых моделей стоят на 30%-50% дороже рекомендованной цены. На ситуацию влияет баланс спроса и предложения — последнего не хватает, чтобы удовлетворить высокий спрос. Не нужно покупать новые видеокарты без особой необходимости и возможности купить их по приемлемой цене. GeForce RTX 5070 за $549 было бы отличным предложением, но за 80 тысяч рублей и больше лучше подождать снижения цен.

GeForce RTX 5070 может столкнуться с проблемой недостаточного объема памяти в будущих играх при разрешении 4K. Уже сейчас некоторые игры испытывают проблемы производительности с 12 ГБ видеопамяти, а количество таких игр может увеличиться. Нехватка памяти не только снижает FPS, но и вызывает рывки и тормоза без возможности улучшить ситуацию, кроме как снизить качество изображения. Важно учитывать этот момент в связи с выходом Radeon RX 9070, который имеет схожую цену, более высокую производительность трассировки лучей и 16 ГБ видеопамяти.

В настоящее время на рынке игр победу одержит компания, способная произвести и поставить больше графических процессоров. Невысокий спрос на решения AMD в области вычислений может помочь им опередить конкурента. Nvidia же может пойти на уступки и перенаправить ресурсы с производства ИИ на выпуск GeForce, чтобы сохранить долю рынка видеокарт. В будущем ожидается расширение производственных мощностей, что приведёт к снижению дефицита и уменьшению цен на игровые GPU.

Преимущества видеокарты Gigabyte GeForce RTX 5070 Gaming OC с объемом памяти 12 ГБ.

Сведения о производителеКомпания Gigabyte Technology (торговая марка Gigabyte) была основана в 1986 году в Китайской Республике (Тайвань). Штаб-квартира находится в Тайбэе/Тайвань. Изначально это была группа разработчиков и исследователей. В 2004 году на базе компании был образован холдинг Gigabyte, куда вошли Gigabyte Technology (разработка и производство видеокарт и материнских плат для ПК); Gigabyte Communications (производство коммуникаторов и смартфонов под маркой GSmart с 2006 года).

Объект исследованияВидеокарта Gigabyte GeForce RTX 5070 Gaming OC с памятью GDDR7 объемом 12 ГБ и шиной 192 бит.

Gigabyte GeForce RTX 5070 Gaming OC с памятью на 12 ГБ и шиной 192 бит, использующей технологию GDDR7.
Параметр Значение Номинальное значение (референс)
GPU GeForce RTX 5070 (GB205)
Интерфейс PCI Express x16 5.0
Частота работы GPU (ROPs), МГц BIOS P: 2625(Boost)—2865(Max)
BIOS S: 2625(Boost)—2865(Max)
2512(Boost)—2790(Max)
Частота памяти (в физическом исполнении, МГц; эффективная, МТ/с). 2333 (28) 2333 (28)
Ширина шины обмена с памятью, бит 192
Число вычислительных блоков в GPU 48
Число операций (ALU/CUDA) в блоке 128
Суммарное количество блоков ALU/CUDA 6144
Число блоков текстурирования (BLF/TLF/ANIS) 192
Число блоков растеризации (ROP) 80
Число блоков Ray Tracing 48
Число тензорных блоков 192
Размеры, мм 330×130×56 310×120×40
Размер видеокарты для установки в системном блоке. 3 2
Цвет текстолита черный черный
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S) 257/250 250
Энергопотребление в режиме 2D, Вт 30 30
Энергопотребление в режиме «сна», Вт 10 10
Уровень шума при максимальной загрузке в режиме 3D, децибелы (BIOS P/BIOS S). 27,5/22,5 29,0
Уровень шума в 2D (просмотр видео), дБА 18,0 18,0
Уровень шума в 2D (в простое), дБА 18,0 18,0
Видеовыходы 1×HDMI 2.1b, 3×DisplayPort 2.1b 1×HDMI 2.1b, 3×DisplayPort 2.1b
Поддержка многопроцессорной работы нет
Максимальная число одновременно подключенных приемников/мониторов для отображения изображения. 4 4
Питание: 8-контактные разъемы 0 0
Питание: 6-контактные разъемы 0 0
Питание: 16-контактные разъемы 1 1
Вес карты с комплектом поставки (брутто), кг 2,0 1,8
Вес карты чистый (нетто), кг 1,3 1,0
Максимальное разрешение/частота, DisplayPort 3840×2160@240 Гц, 7680×4320@120 Гц
Максимальное разрешение/частота, HDMI 3840×2160@144 Гц, 7680×4320@120 Гц
Цена видеокарт с чипом GeForce RTX 5070 100 тысяч рублей

Память

Карта оснащена 12 гигабайтами оперативной памяти GDDR7 SDRAM, распределёнными по 8 микросхемам по 12 гигабит каждая на лицевой стороне печатной платы. Микросхемы производства Samsung . K4VAF325ZC-SC28Оперативная память рассчитана на номинальную частоту работы 2333 МГц (эффективная ПСП 28 Гбит/с). Для расчета эффективной ПСП GDDR6X физическую частоту нужно было умножать на 16, а для GDDR7 — на 12. В случае с GDDR6X применялась технология кодирования PAM4 (4 Pulse Amplitude Modulation), которая вместе с двойной передачей сигнала (DDR) и по двум каналам давала множитель 16. Для GDDR6 используется модуляция PAM2, поэтому финальный множитель физической частоты для получения эффективной ПСП — 8. Разработчик GDDR7, компания Samsung, использует PAM3, поэтому финальный множитель — 12, а физическая частота работы таких микросхем значительно выше, чем у предшественников.

Характеристики карты и сравнение с Gigabyte GeForce RTX 5070 Ti Eagle OC Ice SFF 16Гб.

Gigabyte GeForce RTX 5070 Gaming OC 12G (12 ГБ) Gigabyte GeForce RTX 5070 Ti Eagle OC Ice SFF 16G (16 ГБ) вид спереди
вид сзади

Новинка подвергается сравнению с продуктом от того же производителя, но более высокого уровня (GeForce RTX 5070 Ti).

Ядра GB203 (GeForce RTX 5070 Ti) и GB205 (GeForce RTX 5070) существенно различаются по размерам кристаллов, но размер подложек (упаковок) практически одинаков. Обзор печатных плат свидетельствует о том, что для GeForce RTX 5070 инженеры Gigabyte использовали PCB от старшей модели, уменьшив шину обмена с памятью с 256 до 192 бит (не установив две микросхемы памяти, и общее количество памяти сократившись с 16 до 12 ГБ). PCB не полностью идентичны: в системе питания видны некоторые изменения, а размеры печатных плат немного отличаются.

Ядро изготовлено в 50-й неделе 2024 года (кристалл создан по технологии TSMC 4N, что по разным оценкам равно 5 наномам). Маркировка — GB205-300 (-300 обычно обозначает урезанный чип, а -400 — полнофункциональный, то есть все блоки активны).

Карта Gigabyte GeForce RTX 5070 Gaming OC 12G имеет 13 фаз питания (10+3).

На схеме питанием ядра обозначено зелёным, памятью — красным цветом.

ШИМ-контроллер AOZ71031QI от Alpha&Omega Semiconductor управляет десятью фазами питания ядра. Контроллер рассчитан на максимум десять фаз и установлен с обратной стороны платы.

В преобразователе питания ядра и микросхем памяти применены транзисторные сборки DrMOS от фирмы A&O модели AOZ5310NQI, способные пропускать ток до 60 ампер.

Питание микросхем памяти регулирует ШИМ-контроллер A&O AOZ71031QI, установленный на передней панели платы.

На обратной стороне платы размещён контроллер uPI Semi для контроля напряжений и температур.

Gigabyte доверяет управление подсветкой своих видеокарт контроллеру производства Holtek.

Карта функционирует в двух режимах, заданных двумя вариантами BIOS, доступными посредством переключателя на верхней части карты. P (performance / производительный) и S (silent / тихий)Различие между режимами обусловлено лишь скоростью вращения вентиляторов, максимальное потребление энергии в каждом случае равно 250 Вт.

Частоты памяти совпадают с референсными значениями, а частота работы ядра в обоих режимах BIOS превышает референсное значение на 4,5%. Максимальная частота GPU у Gigabyte превосходит референсную на 2,7%. Исследования показали, что в среднем при разрешении 2.5K карта Gigabyte демонстрирует производительность на 3% выше, чем референсная карта.

Расход энергии карты Gigabyte во время тестов достигал 257 Вт в режиме BIOS P и до 250 Вт в режиме BIOS S.

Предельный расход можно повысить до 120%, поэтому мы попытались разогнать процессор вручную, увеличив частоту ядра и памяти на 214 и 175 МГц соответственно. Это позволило достичь стабильных максимальных рабочих частот 3075/2506 МГц (30 МТ/с).

Питание материнской платы Gigabyte поступает по разъему питания формата PCIe 5.0 с шестнадцатью контактами.

Индикатор на разъеме сигнализирует об ошибках подачи энергии.

Комплект поставки карт включает переходник на этот разъем с двух стандартных 8-контактных разъемов (PCIe 2.0).

Габариты карты соответствуют современным стандартам: 33 сантиметра в длину, 13 сантиметров в высоту и 5,6 сантиметра в толщину. Карта занимаёт три слота в корпусе компьютера.

GeForce RTX 5070 не Карта поддерживает мультиграфическую конфигурацию, то есть технологию SLI, и не имеет специального разъема на верхней грани.

Карта оснащена тремя выходами DP версии 2.1b и одним выходом HDMI версии 2.1b.

Исследуя информацию о GPU GeForce RTX 50 в серийно выпускаемых картах, где количество блоков растеризации (ROP) может быть недостаточным, мы временно будем проверять этот параметр у испытуемых видеокарт. корректное количество ROP.

Работа карты регулируется с помощью утилиты Gigabyte Control Center. Программа позволяет управлять вентиляторами, частотой работы, пределом потребления и подсветкой.

Нагрев и охлаждение

Видим кулер с вентиляцией задней части радиатора. В основе системы охлаждения – многосекционный пластинчатый радиатор из никеля с тепловыми трубками, передающими тепло на ребра радиатора.

Восемь трубок припаяны к большой медной никелированной платформе, которая охлаждает как ядро, так и микросхемы памяти с помощью специального теплопроводящего геля — жидких термопрокладок. Для охлаждения ядра применяется термопаста (не жидкий металл!).

На радиаторе предусмотрены отдельные площадки для охлаждения преобразователей питания VRM. Задняя пластинка выполняет роль защитного элемента для печатной платы.

Радиатор закрыт кожухом с тремя вентиляторами диаметром 100 мм, каждый из которых имеет семь лопастей и работает на одинаковой частоте (по умолчанию. Настройку работы каждого вентилятора отдельно можно выполнить через программу Gigabyte Control Center).

Вентиляторы оснащены лопатками с особым ребристым рисунком и направляющими на краях. По утверждению создателя, это конструктивное решение повышает силу воздушного потока на 1,2 раза при неизменном уровне шума системы охлаждения.

В Gigabyte следуют традиции: средний вентилятор крутится против направления крайних, образуя эффект «шестерен» и уменьшая хаотичность воздушных потоков.

При малой нагрузке на видеокарту вентиляторы останавливаются, если температура GPU снижается до 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. При запуске ПК вентиляторы функционируют. После загрузки видеодрайвера выполняется опрос рабочей температуры, после чего вентиляторы выключаются. видеоролик на эту тему.

Мониторинг температурного режима:

Важно ещё раз отметить, что инженеры Nvidia исключили из отслеживаемых показателей информацию о температуре самой горячей точки ядра.

Режим BIOS P:

Даже при полной нагрузке максимальная температура процессора не поднялась выше 65 градусов, а микросхем памяти — 64 градуса. Это отличный результат для данной модели видеокарты. Мощность потребления достигала 257 Вт.

Мы засняли и ускорили в 50 раз 8-минутный прогрев

Нагрев был максимальным в районе VRM, возле графического процессора и у разъема питания карты.

Ручной разгон:

При ручном разгоне до 3075 МГц по ядру и 2506 МГц по памяти (эффективная частота 30072 МГц, что обеспечивает 30 МТ/с) нагрев ядра достиг 72 градусов, а микросхем памяти — 66 градусов. Скорость вращения вентиляторов превысила 2100 оборотов в минуту, потребление электроэнергии составило 300 Вт. Такой разгон повысил производительность примерно на 8% при разрешении 2.5K.

Режим BIOS S:

Максимальная температура процессора и памяти при нагрузке не превысила 68/66 градусов, что тоже хороший показатель. Карта потребляла до 250 Вт энергии.

Шум

Процесс измерения шума предполагает, что комната изолирована и звукопоглощающая среда снижает эхо. В системе, в которой исследуется шум видеокарт, отсутствуют вентиляторы, исключая механические шумы. Уровень фонового шума 18 дБА соответствует уровню шума в комнате и уровням шумов самого измерительного прибора. Измерения проводятся на расстоянии 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • В режиме простоя 2D функционирует браузер с сайтом iXBT.com, открыто окно Microsoft Word, а также ряд интернет-коммуникаторов.
  • В режиме 2D для просмотра фильмов применяют аппаратное декодирование и вставка промежуточных кадров с помощью SmoothVideo Project.
  • Трёхмерный режим с максимальным использованием графического процессора: проводится тестирование с помощью программы FurMark.

Классификация уровней шума выглядит следующим образом:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В штатном режиме при двумерной работе температура не превышала 45 градусов по Цельсию, вентиляторы останавливались, уровень шума составлял 18 децибел — как у фона.

Во время просмотра фильма с аппаратной обработкой видео изображение оставалось прежним.

Режим BIOS P:

При полной нагрузке температура графического ускорителя в режиме трёхмерной графики составляла 65/64 градуса Цельсия (ядро/память). Вентиляторы вращались со скоростью 1727 оборотов в минуту, шум достигал 27,5 децибел: это тихое значение.

Аудиозапись шума — здесьСпектр шума показал отсутствие явных проблем (низкочастотные пики обычно не оказывают заметного влияния на восприятие шума).

Режим BIOS S:

При максимальной нагрузке трехмерной графики температура составляла 68/66 градусов Цельсия (ядро/память). Вентиляторы раскручивались до 1217 оборотов в минуту, шум достигал 22,5 децибел: это очень тихо.

Подсветка

Карта имеет два элемента подсветки.

На верхней части устройства расположена световая полоска. При перемещении подвижного элемента с логотипом организации подсветка переключается на него.

Фирменная подсветка вентиляторов Gigabyte Halo — ключевой элемент освещения. Светодиоды, установленные на внутренней стороне кожуха по периметру каждого вентилятора, вместе с вращающимися лопастями создают увлекательные световые эффекты.

Режимы подсветки можно регулировать, включая отключение, с помощью программы Gigabyte Control Center.

Подсветку можно синхронизировать только с материнскими платами Gigabyte при помощи Control Center.

Комплект поставки и упаковка

Помимо карты, краткого руководства пользователя и переходника питания в комплект входит также разборная подставка для видеокарты с возможностью регулировки высоты упора.

Крепление подставки осуществляется с помощью комплектных элементов к видеокарте, обеспечивая жесткость конструкции.

Внутри упаковки, когда видеокарта извлекается из антистатического пакета, на глаза сразу бросается надпись, которая находится на ленте, приклеенной к защитной пленке сзади платы. Благодаря этой ленте снять пленку очень просто.

Тестирование: синтетические тесты

Провели тестирование новой видеокарты Nvidia на штатных частотах в наборе синтетических тестов, который постоянно обновляется: появляются новые тесты, а устаревшие удаляются. Хотелось бы добавить больше примеров с вычислениями, но это непросто. Постоянно совершенствуем набор синтетических тестов и будем рады чётким предложениям по улучшениям в комментариях к статье или от авторов.

В работе с новыми бенчмарками внесли изменения: добавили тесты для оценки производительности трассировки лучей, масштабирования разрешения и повышения производительности (DLSS, FSR и XeSS). В качестве полусинтетических тестов применяют набор подтестов из 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. Приложения DirectX 11 и 12 из различных SDK исключили – результаты всё чаще оказывались некорректными. Новые тесты ИИ появились, используя возможности современных GPU, включая тензорные ядра.

На перечисленных видеокартах выполнялись синтетические тесты.

  • GeForce RTX 5070 со стандартными параметрами (RTX 5070)
  • GeForce RTX 5070 Ti со стандартными параметрами (RTX 5070 Ti)
  • GeForce RTX 4070 Super со стандартными параметрами (RTX 4070 Super)
  • GeForce RTX 4070 со стандартными параметрами (RTX 4070)
  • Radeon RX 7900 XTX со стандартными параметрами (RX 7900 XTX)

Для оценки производительности новой видеокарты GeForce RTX 5070 изучили ранее представленную RTX 5070 Ti на базе графического процессора GB203 в урезанном виде, а также две модели предыдущего поколения с аналогичным рыночным местом. Это пара моделей с цифровым индексом 4070, включая версию Super, вышедшую около года назад. По результатам сравнения этих видеокарт можно будет понять, насколько новая архитектура Blackwell ускорила решения данного ценового сегмента.

Сравнение новой модели проводим с текущей флагманской видеокартой Radeon — RX 7900 XTX. Несмотря на разницу в позиционировании на рынке, это топовая модель AMD, позволяющая оценить преимущества новинки по сравнению со стареньким Radeon. На момент тестов у нас не было новейших моделей линейки Radeon RX 9070 (XT), но мы скоро их рассмотрим.

Тесты 3DMark Vantage

В течение длительного времени мы используем не самые новые синтетические тесты из пакета 3DMark Vantage, так как в них можно обнаружить интересную информацию, отсутствующую в более современных тестах. Тесты Feature этого пакета поддерживают DirectX 10 и по сей день остаются актуальными. Анализируя результаты новых видеокарт с их помощью, мы всегда делаем ценные выводы.

Feature Test 1: Texture Fill

Первый тест оценивает эффективность модулей обработки текстур. Для этого используется заполнение прямоугольников данными из малой текстуры при помощи большого числа изменяющихся на каждом кадре текстурных координат.

Производительность видеокарт AMD и Nvidia в текстурном тесте Futuremark обычно высока, результаты близки к теоретическим, хотя иногда несколько занижены для некоторых графических процессоров. RTX 5070 показала результат ниже ожидаемого — разница с RTX 5070 Ti понятна из-за разницы в количестве исполнительных блоков. Неожиданно оказалась более слабая производительность новинки по сравнению с RTX 4070 Super.

Сравнение рассматриваемой сегодня видеокарты с единственной моделью компании AMD не очень информативно, стоит ожидать новых решений RX 9070 (XT). Предыдущие поколения AMD показывали лучшие результаты в этом тесте, а RX 7900 XTX тоже неплоха. Однако эффективная скорость текстурирования решений предыдущего семейства Radeon немного снизилась, и близкие по цене решения Nvidia их приблизились — например, RTX 5070 Ti против RX 7900 XTX.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нём используется простой пиксельный шейдер, не влияющий на производительность. Интерполированное значение цвета записывается во внеэкранный буфер с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, часто применяемый в играх с HDR-рендерингом, поэтому такой тест является актуальным.

Результаты второго подтеста 3DMark Vantage демонстрируют производительность блоков ROP независимо от пропускной способности видеопамяти. Данный тест измеряет именно производительность подсистемы ROP, на которую влияние ПСП обычно не оказывает заметного эффекта. У новой видеокарты GeForce RTX 5070 наблюдается соответствие теории: показатели хуже, чем у модели более высокого уровня RTX 5070 Ti с большим чипом, но новинка по скорости подсистемы ROP чуть опережает старую модель такого же ценового уровня, хотя преимущество оказалось ниже ожидаемого.

В данном испытании все видеокарты Nvidia существенно уступают решениям AMD, представленным моделью Radeon RX 7900 XTX, которая превосходит даже RTX 4090 в данной задаче. Видеокарты GeForce по пиковой скорости заполнения сцены всегда отставали от конкурентов, поэтому подобные результаты в синтетическом тесте не вызывают удивления.

Тест функции 3: Параллаксное затенение

Данный вид теста выделяется своей интересной концепцией, поскольку такая техника давно применяется в играх. В нём формируется один четырёхугольник (точнее, два треугольника) с использованием специальной техники Parallax Occlusion Mapping, которая имитирует сложную геометрию. Для этого применяются ресурсоёмкие операции по трассировке лучей и карта глубины высокого разрешения. Поверхность также затеняется с помощью алгоритма Strauss. Данный тест представляет собой серьёзное испытание для видеочипа пиксельного шейдера, содержащего многочисленные выборки текстур при трассировке лучей, динамические ветвления и сложные вычисления освещения по Strauss.

Результаты теста из пакета 3DMark Vantage зависят не только от скорости математических вычислений, эффективности выполнения ветвлений и скорости текстурных выборок, а от нескольких параметров одновременно. Для высокой скорости важен баланс GPU и эффективность выполнения сложных шейдеров. Это полезный тест, так как результаты часто коррелируют с результатами игровых тестов с чистой растеризацией.

Важно и математическая, и текстурная производительность, и в этом тесте из 3DMark Vantage новая модель GeForce RTX 5070 снова показала результат ниже ожидаемого. Отставание в 38% от модели RTX 5070 Ti понятно, но минус 11% от RTX 4070 Super неожиданно — это уже второй тест с такими сравнительными результатами. Понятно, что так как архитектурных улучшений немного, и приросты скорости не могут быть большими, но чтобы новинка уступала предыдущей модели… Флагманская видеокарта конкурента показала результат более чем на 60% выше — примерно на уровне RTX 5080, но рассматриваемая сегодня видеокарта и не конкурент ей.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем вычисляются физические взаимодействия (имитация ткани) с помощью GPU. Применяется вершинная симуляция с использованием комбинированной работы вершинных и геометрических шейдеров в несколько проходов. Для переноса вершин из одного прохода симуляции в другой используется stream out. Таким образом, проверяется производительность исполнения вершинных и геометрических шейдеров, а также скорость stream out.

Скорость рендеринга теста зависит от нескольких параметров: производительности обработки геометрии и эффективности выполнения шейдеров. Сильные стороны чипов Nvidia должны проявляться в этом тесте, но мы получаем не самые корректные результаты, поэтому серьезно оценивать видеокарты по ним не стоит. Ранее это касалось только GeForce, но со временем Radeon также оказались в той же ситуации — более новые решения и драйверы AMD показывают низкие результаты из-за драйверов, которые давно не оптимизируют для старого тестового пакета.

Новая RTX 5070 в данном тесте приблизилась по производительности к RTX 5070 Ti (и даже к отсутствующей на диаграмме RTX 5080), поэтому бенчмарк не тестирует скорость основных вычислительных блоков, а скорее фокусируется на возможностях геометрических блоков. Все видеокарты с чипами Blackwell показали незначительное ускорение по сравнению с Ada Lovelace, а RTX 5070 заметно опережает RTX 4070 Super. Radeon RX 7900 XTX демонстрирует еще худшие результаты и занимает последнее место в этом тесте.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов с использованием систем частиц, вычисляемых графическим процессором. Применяется вершинная симуляция, где каждая вершина символизирует отдельную частицу. Stream out используется для того же, что и в предыдущем тесте. Вычисляются сотни тысяч частиц, каждое из которых анимируется индивидуально, а также учитываются их столкновения с картой высот. Частицы отображаются геометрическим шейдером, который из каждой точки создает четыре вершины, формирующие частицу. Больше всего нагружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage получаются далекие от теории результаты, которые упираются во что-то непонятное, судя по результатам. Если считать их корректными, то рассматриваемая сегодня новая видеокарта снова позади RTX 5070 Ti, что нормально, и снова проиграла RTX 4070 Super, что неожиданно. Возможно, новые драйверы хуже оптимизированы для DirectX 10 и для этого бенчмарка конкретно. Топовая видеокарта Radeon RX 7900 XTX, условно конкурирующая со всеми решениями Nvidia, и тут проиграла всем представленным в сравнении видеокартам соперника, что также можно объяснить скорее плохой оптимизацией драйверов, так как раньше результаты GPU обоих производителей в этом подтесте были заметно выше.

Feature Test 6: Perlin Noise

Последний тестовый пакет Vantage проверяет производительность GPU с помощью математически сложного теста. Тест рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждому цветовому каналу соответствует собственная функция шума, что увеличивает нагрузку на видеочип. Алгоритм Perlin noise — стандартный метод, применяемый в процедурном текстурировании, основанный на многочисленных математических вычислениях.

Этот математический тест показывал производительность решений, которая хоть и не всегда соответствовала теории, но часто близка к пиковой производительности видеочипов при решении сложных задач. В тесте использовались операции с плавающей запятой, и новые архитектуры могли продемонстрировать часть своих возможностей в двойном запуске соответствующих команд. Однако из-за устаревшей природы теста, он не может полностью раскрыть возможности современных GPU по результатам их работы.

Новая модель GeForce RTX 5070 ожидаемо уступила RTX 5070 Ti более чем на треть. При этом ее результат приблизительно равен показателю супер-предшественницы, что интересно и не совсем согласуется с теорией. Флагманская Radeon RX 7900 XTX от AMD опережает новинку семейства RTX 50 по понятным причинам, ведь ее ценовой конкурент — скорее RTX 5070 Ti. Давайте проверим, что получается в более современных синтетических тестах с повышенной нагрузкой на GPU.

Тесты Direct3D 12

В наших тестах исключены примеры из DirectX SDK Microsoft и AMD, применяющие API Direct3D12, так как они преимущественно демонстрируют некорректные результаты. Единственным остающимся тестом с поддержкой Direct3D12 стал бенчмарк Time Spy из 3DMark. Его мы используем для сравнения мощности GPU и оценки разницы производительности при включенной и отключенной возможности асинхронных вычислений DirectX 12. Для достоверности тестирование выполнено в двух графических тестах.

С этого теста сравниваем новинку не только с Super-моделью аналогичного уровня из поколения RTX 40, но и с базовым решением без дополнительных индексов. Производительность новой модели GeForce RTX 5070 в этой задаче по сравнению с видеокартами предыдущего поколения того же уровня оказалась явно выше, что соответствует теории. Неудивительно, что RTX 5070 Ti на основе урезанной версии более мощного GB203 тут явно быстрее.

Видеокарты Radeon в этом тесте демонстрируют лучшую производительность по сравнению с GeForce аналогичной стоимости. Это особенно заметно, если учесть, что прошлый топовый RX 7900 XTX не является конкурентом для RTX 5070. Следовательно, результаты рассматриваемой видеокарты ожидаемо ниже, чем у RX 7900 XTX. В реальных играх результаты этого теста не всегда точно отражают производительность, но в задачах растеризации решения AMD показывают существенное преимущество. Переходим к тестам трассировки лучей.

Тесты трассировки лучей

Бенчмарк Port Royal, разработанный создателями тестов серии 3DMark, является одним из первых тестов производительности трассировки лучей.
Тет работает на всех видеокартах с поддержкой DirectX Raytracing API. Авторы проверили несколько видеокарт в разрешении 2560×1440 при разных настройках: отражения рассчитывались с помощью трассировки лучей двумя способами, а также традиционным для растеризации методом.

Бенчмарк демонстрирует новые применения трассировки лучей с помощью DXR API. В нем применяются алгоритмы отрисовки отражений и теней с использованием трассировки лучей, но сам тест не слишком оптимизирован и сильно нагружает даже мощные видеокарты. Тем не менее, для сравнения производительности различных видеокарт в этой конкретной задаче тест может подойти.

Новая GeForce RTX 5070 достигла результата, приблизительно равного показателю предыдущего теста. Модель обогнала RTX 4070 и оказалась быстрее Super-модели прошлого поколения, хотя в обычном режиме разница между ними незначительна. В более сложных условиях новинка отстает от GPU прошлого поколения немного сильнее. Единственное решение AMD в сравнении, флагман прошлого поколения, показало в этом тесте приличный результат, даже опередив новинку. Не совсем корректно прямое сравнение, так как ждем обзоров Radeon RX 9070 (XT).

Новый подтест 3DMark тестирует производительность трассировки лучей DirectX Raytracing. В отличие от предыдущего, этот не гибридный и не использует растеризацию, работая только с трассировкой лучей. Это позволяет лучше оценить скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке знакома из других подтестов 3DMark и невелика — BVH-структура может поместиться в большой кэш, что может помочь новым видеокартам.

GeForce существенно превосходит Radeon в данном случае, поскольку выделенные RT-ядра Nvidia выполняют большую часть работы и обладают большей универсальностью. При включении трассировки они не теряют производительности так сильно, как ядра Ray Accelerator + обычные SIMD-ядра у конкурента. В большинстве игр с применением трассировки лучей нагрузка на RT-блоки заметно ниже, и положение Radeon не столь бесперспективно. Тем не менее, в данном тесте видеокарты Nvidia сохраняют явное преимущество.

Обзор RTX 5080 показал явно низкий результат новой видеокарты, но Nvidia исправила проблему в новых драйверах, и результаты Blackwell улучшились. RTX 5070 почему-то всё равно уступила Super-решению прошлого поколения около 9% — вероятно, тест на новых GPU ещё неоптимален. Урезанный GB203 быстрее, а единственное решение конкурента отстаёт, даже флагман AMD из прошлого проиграл новинке.

В 2022 году в пакет 3DMark был добавлен тест Speed Way с высокой нагрузкой на трассировку лучей в связи с выпуском новых поколений графических процессоров Nvidia и AMD. Этот тест по своей нагрузке на разные блоки GPU больше напоминает распространенные игры, где активно используется трассировка лучей, что делает его для нас привлекательным.

Приемлемые частоты кадров в обоих разрешениях обычно демонстрируют только топовые графические процессоры, GeForce RTX 5070 до этого уровня не подходит. Разница между Radeon и GeForce есть, но она явно меньше – единственная видеокарта AMD в сравнении очень близка к рассматриваемой сегодня RTX 5070, что очень неплохо для нее, особенно с учетом того, что в RX 9070 (XT) трассировку ускорили еще раз. Новое решение семейства Blackwell, которое мы сегодня рассматриваем, на 28% медленнее RTX 5070 Ti в этом тесте, что нормально, но зато RTX 4070 Super отстает от новинки на 17%, а RTX 4070 — аж на 36%, что приятно радует – скорее всего, новый аппаратный планировщик лучше справляется с распределением работы ALU и RT-ядер.

Рассмотрим ещё один полусинтетический бенчмарк, созданный на базе реального игрового движка. Boundary — китайский игровой проект с поддержкой DXR и DLSS. Бенчмарк обладает высокой нагрузкой на видеокарту, трассировка лучей в нём активно используется для сложных отражений с несколькими отскоками луча, мягких теней и глобального освещения. В тестах Radeon технология DLSS использовать невозможно.

В Full HD без DLSS приемлемую производительность демонстрируют только относительно мощные видеокарты, а в 4K без масштабирования играбельные показатели показывают лишь топовые модели. Новая RTX 5070 даже в 4K не достигла 25 FPS и уступила RTX 5070 Ti более чем на 38%, что объяснимо меньшим объемом видеопамяти. Рассматриваемая модель обошла RTX 4070 Super всего на пару процентов, а RTX 4070 — на 20%-21%, что мало для смены поколения. Предыдущие предположения о том, что скорость может ограничиваться пропускной способностью видеопамяти, не подтвердились, ведь ПСП у Blackwell намного выше. Показатели единственной представленной в сравнении Radeon оказались даже хуже новинки — в тестах трассировки лучей решения AMD прошлого поколения не могут конкурировать с Nvidia.

С использованием масштабирования разрешения DLSS видеокарты Nvidia в тестах даже при 4K обеспечили приемлемый показатель частоты кадров. В таких условиях DLSS позволяет играть в играх с максимальными настройками при 4K, и RTX 5070 демонстрирует 44 FPS, что обеспечивает комфортную игру. Результаты новинки на 32%-34% уступают RTX 5070 Ti, что является обычным явлением, но всё же она опережает оба предыдущих решения с индексом 4070, хотя супер-модель очень близка к ней.

Ещё один полуигровой бенчмарк основан на китайской игре Bright Memory. Тесты похожи по результатам и качеству изображения, хотя по тематике разные. Этот бенчмарк чуть более требователен к производительности трассировки лучей. Видеокарты AMD не поддерживаются, требуется GeForce RTX.

В этом тесте RTX 5070 на базе графического процессора GB205 показала результат на 25%-35% хуже, чем RTX 5070 Ti на основе полной версии GB203 из-за разницы в количестве исполнительных блоков. Базовую RTX 4070 новинка обошла всего на 15%, а RTX 4070 Super — на 5%-6%. Невысокий результат нового поколения объясняется также тем, что в этом тесте важен объем видеопамяти, которой у новинки всего 12 ГБ.

Вычислительные тесты

Продолжается поиск бенчмарков с использованием OpenCL для актуальных задач, которые включат в пакет синтетических тестов. Пока что в этом разделе представлен старый и недостаточно оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Видеокарта GeForce RTX 5070 имеет немного больше вычислительных блоков по сравнению с RTX 4070 (Super) и работает на близкой частоте, поэтому небольшое преимущество перед ними вполне объяснимо. В среднем из трёх тестов разница составила более ожидаемой: RTX 5070 оказалась быстрее на 20% и 37% по сравнению с моделью Super и обычной видеокартой того же уровня поколения RTX 40. Даже топовая карта конкурента уступила новинке в двух из трёх подтестов, а в самом сложном подтесте разница почти полуторакратная.

Проанализируем еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark. Это также трассировка лучей без использования аппаратного ускорения. Тест на базе рендерера V-Ray демонстрирует возможности GPU в сложных расчетах и может показать преимущества новых видеокарт. В работе используется разные версии бенчмарка, которые выдают результат в виде времени, затраченного на рендеринг, и количества миллионов просчитанных путей за секунду.

Тест демонстрирует программную трассировку лучей, и в нем новая модель GeForce RTX 5070 оказалась на уровне RTX 4070 Super (так же, как RTX 5070 Ti с RTX 4070 Ti Super). Обе видеокарты отстали от RTX 5070 Ti на 14%, что меньше ожиданий и не впечатляет для видеопроцессора нового поколения. Единственный Radeon прошлого поколения, который можно назвать конкурентом, показал еще более слабый результат; практически все более-менее современные видеокарты Nvidia его опережают — даже RTX 4070.

В Cinebench 2024 и OctaneRender 2020.1.5 новинка пока что не функционирует. Вероятно, эти приложения получат обновления с оптимизацией под серию GeForce RTX 50, но временно их заменили версиями бенчмарка V-Ray с более продвинутыми возможностями. К сожалению, в этих бенчмарках видеокарты AMD тоже не работают.

Новая модель GeForce RTX 5070 по результатам теста находится на уровне RTX 4070 Super, что вызывает разочарование из-за отсутствия заметных улучшений архитектурной реализации в многопроцессорах SM. RTX 5070 превзошла RTX 4070 на 15%, но это не существенная разница. Более производительная RTX 5070 Ti быстрее на 21%, но и это нельзя назвать большим преимуществом. Результаты V-Ray показывают отсутствие заметных приростов по сравнению с решениями RTX 40. Рассмотрим еще один вариант с аппаратным ускорением трассировки лучей.

Отсутствуют результаты многих моделей видеокарт для этого теста, поэтому на диаграмме остались только три решения. Новая модель GeForce RTX 5070 в этом тесте отстала от RTX 5070 Ti с более мощным чипом GB203 всего на 13%-15%, что мало по сравнению с теорией. Модель из прошлого семейства с тем же цифровым индексом, что и у новинки, заметно медленнее — на 21% при включенном аппаратном ускорении RTX и на 25% в режиме CUDA. Такая разница в приростах повторяется для RTX 5080 с RTX 4080 Super и RTX 5070 Ti с RTX 4070 Ti Super.

Чтобы измерить работоспособность видеопроцессора в задачах искусственного интеллекта, применяем набор тестов MLPerf. Это семейство тестов машинного обучения, разработанное специалистами из Гарвардского, Стэнфордского университетов, Nvidia, Google и других организаций. MLPerf используется для оценки производительности Large Language Model (LLM) — языковой модели нейронной сети с большим числом параметров, являющейся ключевой технологией генеративного ИИ. MLPerf измеряет эффективность генерации текста с помощью искусственного интеллекта на разные входные данные. Тесты используют модель Llama2-7B и измеряют время обработки запроса и получения первого токена в четырех типах тестов, а также количество токенов в секунду после этого — то есть устойчивую производительность далее.

Производительность различных GPU оценивается в объединенной категории, которая представляет собой геометрическое среднее всех подтестов. Nvidia, AMD и Intel сотрудничают в разработке теста. Графические процессоры от Nvidia и AMD могут использовать только DirectML, а у Intel ещё и OpenVINO, который позволяет Intel Arc демонстрировать более высокие результаты.

Время получения первого токена свидетельствует о скорости реакции ИИ. По этому показателю видеокарты Nvidia превосходят даже флагман AMD прошлого поколения. Даже RTX 4070 отвечает в полтора раза быстрее. Разница между RTX 5070 и RTX 5070 Ti составляет 22%, новая модель обошла RTX 4070 на 23% и соответствующую Super-модель на 10%. RX 7900 XTX почти вдвое медленнее.

Скорость выдачи второго и последующих токенов отличается: разница между RTX 4070 Super и RTX 4070 почти незаметна, а новая RTX 5070 лишь на 11%-12% быстрее их. заметно более мощная RTX 5070 Ti опережает новинку почти на треть. Единственная представленная в сравнении видеокарта AMD в виде прошлого флагмана RX 7900 XTX уже опережает RTX 5070 на 11%. Будет интересно сравнить новую модель Nvidia с Radeon RX 9070 (XT), что произойдет в самое ближайшее время.

Тесты технологий DLSS/XeSS/FSR

Здесь рассматриваются дополнительные тесты технологий повышения производительности. Сначала это были лишь технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), затем добавилась технология генерации промежуточных кадров — DLSS 3, а позже — DLSS 4. Прежде тестовые материалы содержали отдельный тест технологии DLSS, хотя уже проводились тесты с её применением в приложениях с трассировкой лучей, но решили провести и отдельное тестирование. Рассмотрим результаты GPU компании Nvidia в разрешении 4K с включением технологий DLSS разных уровней качества нескольких версий.

Изначально функционирует режим Performance, где рендеринг выполняется с меньшей детализацией, а затем изображение масштабируется до 4K и дополняется генерируемыми кадрами в соответствующих режимах. При отключенном DLSS рендеринг производится в полном разрешении, что отрицательно сказывается на производительности: видеокарты демонстрируют лишь 27—41 FPS при разрешении 4K, чего недостаточно для комфортной игры. Включение DLSS в «производительном» режиме повышает частоту кадров до уровня, достаточного для всех видеокарт. Новинка RTX 5070 в таком режиме на 30% медленнее RTX 5070 Ti и быстрее RTX 4070 Super на 7% — прирост есть, но не слишком впечатляющий.

В случае DLSS у Blackwell есть свое преимущество: если в видеокартах архитектуры Ada Lovelace появилась поддержка DLSS 3 с генерацией одного промежуточного кадра, то в Blackwell может быть до трех. Подробнее о технологии было рассказано в теоретических частях статей по RTX 5080 и RTX 5070 Ti, а на практике включение генерации промежуточных кадров дает RTX 5070 весомое преимущество над RTX 4070 Super. Включение DLSS 4 при максимуме возможностей по генерации кадров дает новинке более чем двукратное преимущество над аналогичной по позиционированию видеокартой семейства RTX 40 — даже в Super-варианте.

При активации технологии DLSS в качественном режиме все три GeForce обеспечивают более 50 FPS, что вполне достаточно для базовой частоты и включения генерации кадров. Новая модель без генерации кадров уступает RTX 5070 Ti примерно на 36%, но опережает RTX 4070 Super на 11%, что немного выше результатов в других тестах. Генерация одного дополнительного кадра повышает плавность изображения при незначительном увеличении задержек управления, а увеличение до трех дополнительных кадров дает модели RTX 5070 более чем двукратное преимущество над RTX 4070 Super. Можно спорить о «честности» таких сгенерированных кадров, но плавность изображения они улучшают, и если количество «настоящих» кадров с DLSS (без учета генерации) превышает 40—50 FPS, то играть будет комфортно — при наличии монитора с высокой частотой обновления.

XeSS — это метод повышения производительности, использующий рендеринг в меньшем разрешении и масштабирование до более высокого. Этот аналог DLSS 2.0 от Intel также использует искусственный интеллект для восстановления информации в кадре. В отличие от DLSS, XeSS работает на всех современных видеокартах, хотя и не так эффективно, как на решениях Intel. Для тестирования использовали бенчмарк из пакета 3DMark с уменьшенным разрешением рендеринга.

Включение XeSS позволяет существенно увеличить частоту кадров — до двух раз и более. Благодаря своей универсальности технология может конкурировать с DLSS, FSR и быть достойной альтернативой. Модель GeForce RTX 5070 в данном тесте демонстрирует более высокую эффективность по сравнению с решениями предыдущего поколения GeForce RTX 40 — разработчики Nvidia оптимизировали работу XeSS.

В данном тестировании Radeon RX 7900 XTX по эффективности уступает Nvidia, даже без включения XeSS эта флагманская модель лишь на 8% превосходит RTX 5070, а активация XeSS предоставляет до 16% преимущества уже новой GeForce. Общий прирост производительности Blackwell позволил сегодняшней новинке стать более чем на 40% производительнее RTX 4070 и почти на четверть быстрее Super-варианта, хотя в родном разрешении разница составляла 30% и 11%, соответственно.

FSR 2.0 от AMD — ещё одно представитель технологии масштабирования рендеринга. Технология появилась в списке специализированных подтестов 3DMark. Сцены разных технологий масштабирования отличаются, поэтому сравнение не всегда прямое. Можно только посмотреть на рост производительности, но нужно учесть реальное разрешение рендеринга и разницу в качестве, что усложнит задачу.

FSR — технология, работающая на разных графических процессорах схожим образом. Это не принесло особых открытий в тестах FSR 2.0. Radeon RX 7900 XTX оказался менее эффективным по сравнению с решениями Nvidia. При отсутствии FSR этот графический процессор был значительно быстрее RTX 5070, но при уменьшении разрешения его производительность относительно GeForce снижалась до 13%.

При сравнении GeForce RTX 5070 с более производительной моделью из того же семейства и предшественниками, FSR делал ее на треть медленнее RTX 5070 Ti, на 23% быстрее RTX 4070 и на 4% — Super-модели, что согласуется с теорией. С включением технологии масштабирования FSR разница в скорости осталась приблизительно такой же — в тестах этой технологии масштабирования мы не обнаружили ничего необычного. Переходим к тестированию очередной новинки архитектуры Blackwell в реальных игровых тестах — это должно быть интереснее и полезнее.

Тестирование: игровые тесты

Конфигурация тестового стенда

Конфигурация тестового стенда

Список инструментов тестирования

В ходе испытаний игр применялись наивысшие настройки графики.

  • Черный Миф: Укунг (Гейм Сайенс/Гейм Сайенс)
  • Cyberpunk 2077 от Софтклаб и CD Projekt RED, обновление 2.21 (январь 2025 года).
  • Сага Сенуа: Адская битва 2 (Ниндзя Теори/Xbox Геймс)
  • Call of Duty: Modern Warfare II, разработанная Infinity Ward и изданная Activision. (без трассировки и DLSS/FSR/XeSS!)
  • Alan Wake 2 (Remedy/Epic Games)
  • «Рэтчет и Клэнк: Разлом Миров» от Insomniac Games, Sony и Софтклаб.
  • Призрак Цусимы. Специальное издание (Разработчики Sucker Punch Productions, издатель Sony Interactive).
  • Наследие Хогвартса (Авангард Софтвеар/Warner Bros).
  • Avatar: Frontiers of Pandora (Ubisoft)
  • Atomic Heart (Mundfish/VK)
  • Индиана Джонс и Великий круг (Мэшин Геймс/Бетхезда) (трассировка лучей включена по умолчанию!)

Кратко о производительности в 3D-играх

Перед проведением подробных тестов публикуем краткую информацию о производительности серии, в которую входит изучаемый ускоритель, и его конкурентов. Все это мы субъективно оцениваем по семибалльной системе.

Игры с классической растеризацией. :

GeForce RTX 5070 занимает четвертую позицию в списке новинок Nvidia и расположена между GeForce RTX 4070 Super и GeForce RTX 4070 Ti. В AMD конкурент новым ускорителям представлен Radeon RX 7900 GRE.

В итоге вывод ясен: игры можно запускать с максимальными настройками графики в любых разрешениях, даже в 4K. Стоит помнить, что это касается традиционных игр, не использующих трассировку лучей.

Игровые технологии с трассировкой лучей и DLSS/FSR/XeSS. :

Включение RT вместе с DLSS (или FSR/XeSS) позволяет играть во все игры на высоких настройках графики, даже в разрешении 4K, а некоторые игры могут обойтись без динамического масштабирования. Использование DLSS 4 с MFG даёт заметное повышение FPS.

Кроме того, при активации DLSS 4 (с многокадровой генерацией MFG) GeForce RTX 5070 может сравняться с GeForce RTX 4080, а иногда и превзойти его, включая GeForce RTX 4080 Super. Из десяти тестовых игр четыре уже поддерживают DLSS 4 с MFG, в них показатели GeForce RTX 5070 значительно выше, что повлияло на общий результат. Оценить ли такую производительность как «честную», оставляем решению читателям. На наш взгляд, технология заслуживает внимания и применения.

Результаты тестирования в 3D-играх

Результаты тестирования без аппаратной трассировки лучей в разрешениях 1920×1080, 2560×1440 и 3840×2160.

Black Myth: Wukong

Cyberpunk 2077 v.2.21

Senua’s Saga: Hellblade II

Call of Duty: Modern Warfare II

Alan Wake 2

Ratchet and Clank: Rift Apart

Ghost of Tsushima Director’s Cut

Hogwarts Legacy

Avatar: Frontiers of Pandora

Atomic Heart

Результаты тестирования с активированной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS при разрешениях 1920×1080, 2560×1440 и 3840×2160.

Black Myth: Wukong, RT+DLSS/FSR/XeSS

Cyberpunk 2077 v.2.21, RT

Cyberpunk 2077 v.2.21, RT + DLSS/FSR

Senua’s Saga: Hellblade II, DLSS/FSR/XeSS

Alan Wake 2, RT

Alan Wake 2, RT + DLSS/FSR

Ratchet and Clank: Rift Apart, RT


«Ratchet & Clank: Rift Apart» с поддержкой RT, DLSS/FSR/XeSS.

Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS

Hogwarts Legacy, RT

Hogwarts Legacy, RT + DLSS/FSR/XeSS

Avatar: Frontiers of Pandora, RT

Avatar: Frontiers of Pandora, RT + DLSS/FSR

Atomic Heart, DLSS/XeSS

Indiana Jones and the Great Circle, RT


Индиана Джонс и большая круговая линия, RTX + DLSS/FSR/XeSS.

Рейтинг iXBT.com

Методика расчета рейтингов

Рейтинг ускорителей iXBT.com Показать возможности видеокарт по сравнению друг с другом можно двумя способами.

  1. Вариант рейтинга iXBT.com без включения RT

Рейтинг основан на результатах всех тестов, не используя технологии трассировки лучей. Нормирование рейтинга выполнено по наименее производительному ускорителю из группы карт — Arc A310 (скорость и функции Arc A310 приняты за 100%). Рейтинги формируются на базе 30 регулярно исследуемых нами акселераторов в рамках проекта. Лучшая видеокарта месяцаДля анализа выделена группа видеокарт, включающая GeForce RTX 5070 и аналогичные модели.

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
08 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 МТ/с 1594 150 106 000
09 Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 МТ/с 1593 152 105 000
10 RX 7900 XT 20 ГБ, 2400—2900 МГц/20 МТ/с 1521 171 89 000
11 Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 МТ/с 1520 145 105 000
12 RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 МТ/с 1466 158 93 000
13 RTX 5070 12 ГБ, 2512—2790 МГц/28 МТ/с 1463 148 99 000
14 RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 МТ/с 1323 161 82 000
15 RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 МТ/с 1316 171 77 000

GeForce RTX 5070 в разрешении 2.5K незначительно уступает GeForce RTX 4070 Ti и на 8% — GeForce RTX 4070 Ti Super, превосходит GeForce RTX 4070 Super на 11%, а Radeon RX 7900 GRE — на 10%. От более бюджетного Radeon RX 7900 XT новинка отстает на 4%. Увеличенные частоты карты Gigabyte позволили ей сравняться с Radeon RX 7900 XT.

В рейтинге учитываются результаты игр без RTX и DLSS. Ускоритель на базе GeForce RTX 5070 превзошёл предшественника GeForce RTX 4070 и оказался на 11% быстрее, чем GeForce RTX 4070 Super. Даже в классических играх новинка показывает хорошие результаты. Вопрос лишь в завышенных розничных ценах, которые сильно отличаются от рекомендованных Nvidia и кажутся несоразмерными с ценами видеокарт прошлого поколения.

  1. Рейтинг iXBT.com с включёнными RT, DLSS, FSR и XeSS.

Рейтинг основан на результатах десяти тестов, применяющих трассировку лучей совместно с технологиями Nvidia DLSS, AMD FSR или Intel XeSS. Нормирование рейтинга выполнено по наименее мощному ускорителю в группе — Arc A310 (скорость и возможности Arc A310 приняты за 100%).

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
06 Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 МТ/с 5073 483 105 000
07 RTX 4080 16 ГБ, 2505—2625 МГц/22,4 МТ/с 4911 372 132 000
08 Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 МТ/с 4862 463 105 000
09 RTX 5070 12 ГБ, 2512—2790 МГц/28 МТ/с 4684 473 99 000
10 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 МТ/с 4473 422 106 000
11 RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 МТ/с 4143 446 93 000
12 RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 МТ/с 3765 489 77 000
15 RX 7900 XT 20 ГБ, 2400—2900 МГц/20 МТ/с 3041 342 89 000
16 RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 МТ/с 2603 317 82 000

GeForce RTX 5070 занял второе место в своей группе, уступив GeForce RTX 4080. Это связано с поддержкой DLSS 4 с многокадровой генерацией в 4 из 10 тестовых игр. Технология позволяет картам серии GeForce RTX 50 значительно, иногда в разы, превосходить предшественников по производительности. Добавим, что пока никаких серьезных проблем из-за применения MFG в таких играх не обнаружено.

В разрешении 2.5K GeForce RTX 5070 в среднем превзошел GeForce RTX 4070 Ti Super на 4,7%, GeForce RTX 4070 Ti — на 13%, GeForce RTX 4070 Super — на 22%, Radeon RX 7900 XT — на 54%. Прирост производительности по сравнению с лучшими моделями прошлого поколения весьма значительный. Важно помнить, что этот прирост обусловлен использованием MFG, а не исключительно аппаратными возможностями GeForce RTX 5070.

Высокие тактовые частоты карты Gigabyte привели её близко к GeForce RTX 4080, а ручной разгон позволил ей занять лидирующую позицию.

Рейтинг полезности

Рейтинг полезности Такие же карты получаются, разделив показатель прошлого рейтинга на цены указанных акселераторов. Для расчёта рейтинга полезности применялись розничные цены. на март 2025 года.

  1. Вариант рейтинга полезности без включения RT

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
13 RX 7900 XT 20 ГБ, 2400—2900 МГц/20 МТ/с 171 1521 89 000
14 RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 МТ/с 171 1316 77 000
15 RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 МТ/с 161 1323 82 000
16 RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 МТ/с 158 1466 93 000
17 Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 МТ/с 152 1593 105 000
18 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 МТ/с 150 1594 106 000
19 RTX 5070 12 ГБ, 2512—2790 МГц/28 МТ/с 148 1463 99 000
21 Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 МТ/с 145 1520 105 000

Цены GeForce RTX 5070, как и у всех ранее выпущенных GeForce RTX 50, завышены. Многие продвинутые пользователи, заплатившие 90-100 тысяч рублей за такую видеокарту, не будут ограничиваться играми без RT и/или динамического масштабирования, поэтому актуальность рейтинга сегодня сомнительна.

  1. Рейтинг полезности с использованием RT/DLSS/FSR/XeSS.

Рейтинг приведен для разрешения 2.5K.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
03 RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 МТ/с 489 3765 77 000
04 Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 МТ/с 483 5073 105 000
06 RTX 5070 12 ГБ, 2512—2790 МГц/28 МТ/с 473 4684 99 000
08 Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 МТ/с 463 4862 105 000
09 RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 МТ/с 446 4143 93 000
11 RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 МТ/с 422 4473 106 000
19 RX 7900 XT 20 ГБ, 2400—2900 МГц/20 МТ/с 342 3041 89 000
21 RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 МТ/с 317 2603 82 000

Если руководствоваться рекомендованной Nvidia розничной ценой в 550 долларов (без налогов), то с учетом всех надбавок (НДС плюс торговая наценка) справедливой стоимостью подобных карт было бы около 80 тысяч рублей. Даже при более высоких реальных ценах на GeForce RTX 5070 (100—105 тысяч рублей по состоянию на момент публикации обзора), новинка опережает конкурентов в своей ценовой категории за исключением GeForce RTX 4070 Super, стоимость которого существенно снизилась. Но это верно только при использовании многокадровой генерации MFG в рамках DLSS 4 в играх.

Все показатели производительности, оценки iXBT.com и польза доступны в таблице Excel для скачивания. здесь (Zip-архив)Желающие смогут определить рейтинги, используя актуальные для своего региона цены.

Выводы и сравнение энергоэффективности

Ускоритель Nvidia GeForce RTX 5070 (12 ГБ) Новый представитель линейки GeForce RTX 50, модель четвертого уровня по счёту (или третьего, если не учитывать GeForce RTX 5090, которая не предназначена для игр).

Немало людей знакомы с особенностями архитектуры Blackwell, в частности с новой технологией мультикадровой генерации (MFG). Наши тесты с применением DLSS 4, в особенности при создании трех и более кадров на основе разных моделей ИИ, демонстрируют, что GeForce RTX 5070 не только превосходит модели аналогичного уровня прошлого поколения, но и способна приблизиться к производительности GeForce RTX 4080.

GeForce RTX 5070 с трудом соответствует установленной временем тенденции: новые ускорители превосходят карты старшего поколения (GeForce RTX 5070 опередила GeForce RTX 4070 Super, но догнала лишь GeForce RTX 4070 Ti), если говорить о классических играх без использования MFG. С включением MFG GeForce RTX 5070 значительно обгоняет даже GeForce RTX 4080.

Недавно Nvidia представила обновлённую версию приложения Nvidia App, которое даёт возможность ускорителям GeForce RTX 50 Series включать MFG в играх с поддержкой старой технологии генерации промежуточных кадров (DLSS 3). Таких игр немало. Из-за этого список игр, где карты GeForce RTX 50 могут получить существенное повышение производительности, сразу увеличился.

Остался вопрос качества графики при использовании DLSS 4, возможных задержек и лагов. Всё это рассмотрим в отдельном материале. Это сложный аспект, его нельзя исследовать в рамках обычного обзора видеокарты или текущего материала. Пока лишь отметим, что в четырёх играх (Alan Wake 2, Senua’s Saga: Hellblade II, Cyberpunk 2077 и Hogwarts Legacy), где уже внедрена поддержка DLSS 4 через патчи, явных нареканий на качество не было — встречались лишь мелкие артефакты. Мы полагаем, что, как и с первой версией DLSS, оптимизация под разные игры будет вестись непрерывно, и DLSS 4 можно будет пользоваться полноценно.

Важно подчеркнуть, что доля программной работы при использовании видеокарт (аппаратно-программного комплекса) значительно возросла. Даже если графический процессор обладает не слишком отличающимся от предшественника традиционным набором аппаратных блоков, но при этом получил ряд инструментов для активной работы с нейронными сетями, включая программные оптимизации, он может считаться ускорителем нового поколения.

Программные компоненты ускорителей всё больше набирают вес, активно применяют достижения в области ИИ (нейронных сетей), а графические процессоры должны быть укомплектованы блоками, оптимизированными для быстрых вычислений. В настоящее время наблюдается любопытная тенденция: видеокарты могут превосходить флагманские модели прошлых поколений исключительно благодаря генеративной ИИ.

В классических играх без RT, а также в играх с RT и/или технологиями динамического масштабирования DLSS(1/2/3)/FSR/XeSS новый графический процессор GeForce RTX 5070 располагается между GeForce RTX 4070 Super и GeForce RTX 4070 Ti (почти на уровне второго). В играх, где возможно задействовать DLSS 4 (Multi Frame Generation, MFG), его производительность существенно возрастает, и новинка может сравниться с GeForce RTX 4080.

GeForce RTX 5070 занимает второе место по энергоэффективности, проигрывая только GeForce RTX 5070 Ti.

Показать исходные данные
Показать исходные данные

В прошлом материале по GeForce RTX 5070 Ti уже говорилось о росте производительности новых видеокарт. Многим кажется, что прирост недостаточным, энтузиасты желали бы увидеть не 15%-30%, а 150%-300% увеличения мощности в новом поколении за меньшие деньги. Такое раньше случалось редко, сейчас это и вовсе невозможно, поскольку прогресс процессоров общего назначения замедлился. В предыдущие десятилетия рост вычислительной мощности был лавинообразным, всем казалось, что этому не будет конца. Быстрый прогресс объяснялся постоянными улучшениями в микроэлектронном производстве, которые позволяли размещать всё большее количество транзисторов на той же площади кристалла, работающих на всё более высокой тактовой частоте. Однако со временем появились физические ограничения кремниевого производства. Пока ученые не найдут решения этой проблемы, каждый скачок производительности сложнее и требует всё больше средств. В итоге плотность размещения транзисторов и производительность процессоров сейчас растут очень медленно.

Изготовители нашли решение в развитии функциональности аппаратных ускорителей искусственного интеллекта — машинного обучения и нейросетей, используемых для преодоления проблем техпроцессов, включая графические процессоры. В этом есть смысл: вместо расчета каждого пикселя можно эффективно использовать информацию из соседних пикселей, формируя реалистичную картинку. Искусственный интеллект уже позволяет рисовать реалистичные изображения по текстовому описанию за несколько секунд, а через несколько лет это станет доступно и в динамике. Для создания 3D-графики можно использовать больше информации о кадре и объектах, чем простое текстовое описание сцены. Правильно обученный ИИ способен делать с этой информацией многое, как показывает Nvidia, продвигая «нейронный рендеринг» в качестве одной из главных фишек архитектуры Blackwell. Новые графические процессоры лучше приспособлены для такой работы, чем предыдущие, а ускорение классического рендеринга явно замедлилось из-за описанной проблемы.

Тонкие техпроцессы с нормой 3 нм или 4 нм ограничены технологиями, а массовое производство больших кристаллов GPU с необходимыми характеристиками пока сложно и дорого.
Вероятно, себестоимость такого производства была бы высокой, и пока нет лучших путей развития, чем нейронный рендеринг.
«Честные» кадры, отрендеренные традиционными методами, кажутся более «правильными», но новые ИИ-модели поднимают качество масштабированных кадров выше, чем у «честных», а генерация кадров добавляет плавности на мониторах с большой частотой обновления.
Это уже делает GeForce RTX 50 лучше, чем GeForce RTX 40.

Конкретная протестированная карта Gigabyte GeForce RTX 5070 Gaming OC 12G (12 ГБ) Габариты карты составляют 33×13 см, занимая 3 слота в системном блоке. Используемый кулер работает тихо. При этом карта потребляет до 250 Вт или чуть больше и имеет один 16-контактный разъем питания 12VHPWR (PCIe 5.0). У карты 4 видеовыхода: 1 HDMI 2.1b и 3 DisplayPort 2.1b — последний обеспечивает пропускную способность до 80 Гбит/с в режиме передачи UHBR 20 и позволяет подключить 8K-дисплей с частотой обновления 60 Гц по одному кабелю. Карта оснащена фирменной подсветкой вентиляторов Halo, которую можно настраивать и отключать через ПО.

GeForce RTX 5070 обеспечит комфортную игру на высоких настройках без трассировки лучей и технологий масштабирования до разрешения 4К. В разрешении 4К при использовании RT рекомендуется включить DLSS.