Общая информация о GeForce RTX 5070
Рассматриваем видеокарты Nvidia с графической архитектурой Blackwell. Выпуск новой серии GeForce RTX 50 начался с флагмана, постепенно переходя к более доступным моделям: после GeForce RTX 5090 и GeForce RTX 5080 появилась GeForce RTX 5070 Ti, а затем — GeForce RTX 5070, наименее дорогой моделью в линейке. Она обеспечивает достаточную производительность для игр в разрешении 2560×1440 с максимальными настройками качества, включая трассировку лучей. Подробный обзор всех возможностей новой архитектуры доступен в обзоре первого представителя семейства.
В новой архитектуре внесены несколько модификаций. Новые вычислительные CUDA-ядра Blackwell получили улучшения, включая возможность параллельного выполнения FP32- и INT32-вычислений на всех ядрах. Ядра для аппаратного ускорения трассировки лучей четвертого поколения поддерживают дополнительные функции, такие как увеличение геометрической сложности Mega Geometry. Тензорные ядра пятого поколения поддерживают новый формат данных FP4 для повышения производительности с потерей точности, допустимой в некоторых задачах искусственного интеллекта. Технология DLSS получила многокадровую генерацию для увеличения частоты кадров и качества изображения за счет более эффективных ИИ-моделей.
Nvidia предлагает перспективные методы нейронного рендеринга для отрисовки материалов и объектов с помощью нейросетей, которые Microsoft скоро добавит в шейдеры DirectX.
Сегодня рассмотрим GeForce RTX 5070, которая появилась на рынке 4 марта. Это четвертая видеокарта Nvidia в этом году. Модель поддерживает передовые технологии архитектуры Blackwell, включая нейронный рендеринг и многокадровую генерацию в DLSS 4, при этом её рекомендованная цена составляет $549 – значительно ниже $749 для GeForce RTX 5070 Ti. Это может сделать рассматриваемую модель самой доступной из существующих. Она является первым массовым предложением серии, заменяя довольно успешную GeForce RTX 4070. На данный момент это самая недорогая модель для тех, кто хочет испытать новые функции архитектуры Blackwell.
Интересно, что GeForce RTX 5070 построена на графическом процессоре GB205 архитектуры Blackwell для игровых систем, в то время как в GeForce RTX 5070 Ti применяется урезанный чип, аналогичный GeForce RTX 5080. GB205 менее производительный, чем GB203, с 6144 активными CUDA-ядрами против 8960 у GeForce RTX 5070 Ti — разница почти полуторакратная. В других блоках также заметен масштабный отказ. В GeForce RTX 5070 используется почти полная версия этого чипа с 192-битной шиной GDDR7-памяти объемом 12 ГБ. По сравнению с GeForce RTX 4070 объем памяти остался прежним, но пропускная способность увеличилась на треть благодаря новому типу памяти GDDR7.
Запуск серии GeForce RTX 50 сопровождался проблемами: нестабильные первые драйверы вызывали черные экраны, новый 16-контактный разъем питания приводил к сложностям, особенно в топовой модели GeForce RTX 5090 с повышенным энергопотреблением. Однако главная претензия покупателей — недостаточная производительность и дефицит новых видеокарт, что привело к завышенным ценам. Nvidia исправляла программные ошибки, а младшие модели не испытывали проблем с разъемами питания из-за меньшего потребления энергии, но ситуация с производством и дефицитом оставалась сложной.
За последние месяцы доступность и ценообразование новых видеокарт стали проблемой. По низким ценам их распродают мгновенно, а реальные цены значительно возрастают.
Intel Arc B580 просто невозможно купить за $249. GeForce RTX 5090, GeForce RTX 5080 и GeForce RTX 5070 Ti продаются по куда более высоким ценам, чем рекомендованные. То же самое случилось и с GeForce RTX 5070, да и с Radeon RX 9070 (XT).
В 2021 году дефицит графических процессоров был обусловлен майнинговым бумом, а сейчас причины скорее в широком развитии искусственного интеллекта. Большая часть производственных мощностей используется для соответствующих продуктов, а не игровых GPU.
Nvidia недавно отчиталась о рекордных прибылях за прошедший финансовый год, и большинство прироста приходится на решения для центров обработки данных и ИИ.
Более совершенные технологии производства выпускают ограниченное количество продукции, поэтому более целесообразно использовать их для производства процессоров для вычислительных задач, чем графических карт для игровых компьютеров. Nvidia не отказывается от потребительских графических процессоров, но их стало меньше — вероятно, даже недостаточно для полного удовлетворения спроса, по крайней мере на старте продаж.
Ситуация влияет и на видеокарты предыдущих поколений: сейчас большинство продаётся дороже рекомендованной цены (MSRP), за исключением недорогих решений типа GeForce RTX 4060 и Radeon RX 7600. Даже на вторичном рынке цены на модели начиная с уровня GeForce RTX 4070 держатся значительно выше первоначальной. Radeon также продаются существенно дороже рекомендованной цены, в том числе на вторичном рынке.
На данный момент нет никаких предпосылок для изменения сложившейся ситуации, и перспективы для игровых GPU не очень хорошие как минимум на несколько месяцев вперед. В отличие от ситуации с майнингом, когда всех спас переход криптовалюты Ethereum на другой метод распределения, после чего майнинг на GPU стал не особенно выгодным, с ИИ всё пока что неясно — индустрия в начале роста, и понятно, что производство дорогих GPU для центров обработки данных является приоритетным.
Перейдем к GeForce RTX 5070. Так как архитектура Blackwell не сильно отличается от предшествующей Ada Lovelace, которая во многом схожа с Ampere, и все эти архитектуры имеют много общего, рекомендуем ознакомиться с нашими предыдущими статьями по теме.
- [24.02.25] Обзор видеоускорителя Nvidia GeForce RTX 5070 Ti
- [03.02.25] Обзор видеоускорителя Nvidia GeForce RTX 5080
- [05.02.24] Анализ видеокарты Nvidia GeForce RTX 4070 Super.
- [10.10.22] Теоретический обзор Nvidia GeForce RTX 4090 и RTX 4080
Графический ускоритель GeForce RTX 5070 | |
---|---|
Кодовое имя чипа | GB205 |
Технология производства | 5 нм (TSMC 4N) |
Количество транзисторов | 31,1 млрд |
Площадь ядра | 263 мм² |
Архитектура | Обладает единой структурой и большим числом процессоров для обработки различных данных: точек, пикселей и подобных. |
Аппаратная поддержка DirectX | DirectX 12 Ultimate включает поддержку уровня возможностей Feature Level 12_2. |
Шина памяти | Архитектура включает 6 отдельных 32-битных контроллеров памяти, работающих совместно для управления памятью GDDR7. |
Частота графического процессора | до 2512 МГц |
Вычислительные блоки | Из 50 потоковых мультипроцессоров функционируют 48, включая 6144 из 6400 CUDA-ядер для целочисленных расчётов INT32 и вычислений с плавающей запятой FP16/FP32/FP64. |
Тензорные блоки | 192 из 200 тензорных ядер предназначены для матричных операций с типами данных INT4, INT8, FP4, FP8, FP16, FP32, BF16 и TF32. |
Блоки трассировки лучей | 48 из 50 ядер RT для вычисления пересечений лучей с треугольниками и границами BVH. |
Блоки текстурирования | 192 из 200 блоков текстурной адресации и фильтрации, поддерживающие компоненты FP16 и FP32, а также трилинейную и анизотропную фильтрацию для всех форматов текстур. |
Блоки растровых операций (ROP) | Система содержит десять широкополосных блоков ROP размером 80 пикселей, работающих в разных режимах сглаживания, включая программируемые, и поддерживающих форматы буфера кадра FP16/FP32. |
Поддержка мониторов | HDMI 2.1b и DisplayPort 2.1b |
Спецификации видеокарты GeForce RTX 5070 | |
---|---|
Частота ядра | 2325/2512 МГц |
Количество универсальных процессоров | 6144 |
Количество текстурных блоков | 192 |
Количество блоков блендинга | 80 |
Эффективная скорость памяти | 28 Гбит/с |
Тип памяти | GDDR7 |
Шина памяти | 192 бит |
Объем памяти | 12 ГБ |
Пропускная способность памяти | 672 ГБ/с |
Вычислительная производительность (FP32) | до 30,9 терафлопс |
Теоретическая максимальная скорость закраски | 201 гигапиксель/с |
Теоретическая скорость выборки текстур | 482 гигатекселя/с |
Шина | PCI Express 5.0 x16 |
Разъемы | по выбору производителя |
Энергопотребление | до 250 Вт |
Дополнительное питание | один 16-контактный разъем |
Количество используемых слотов в системном блоке. | по выбору производителя |
Рекомендуемая цена | $549 |
Новинка получила название в соответствии с принципом наименования решений компании — это GeForce RTX 5070, которая заменяет в линейке оригинальную GeForce RTX 4070 и вышедшую около года назад GeForce RTX 4070 Super. Выше новинки в новой линейке расположена GeForce RTX 5070 Ti на базе более мощного кристалла GB203 в урезанном варианте, а снизу пока что ничего нет, хотя менее дорогие варианты типа GeForce RTX 5060 (Ti) наверняка выпустят в будущем.
Рекомендованная цена GeForce RTX 5070 составляет $549, что ниже рекомендованной цены GeForce RTX 4070 на $50. Однако купить модель по этой цене невозможно из-за дефицита, и её продают по завышенным ценам — на 30%-40% выше и даже дороже. Несмотря на рекомендованную цену GeForce RTX 5070 Ti в $750, найти её дешевле $1000 проблематично, поэтому реальная цена скорее начинается с $700. Новые решения AMD тоже не продаются по рекомендованной цене — наценка ниже, но всё равно присутствует. Соперниками GeForce RTX 5070 являются Radeon RX 9070 ($549) и Radeon RX 9070 XT ($599), вышедшие через пару дней после решения Nvidia. Если многокадровая генерация не нужна, можно обратить внимание на GeForce RTX 4070 Ti Super с 16 ГБ памяти и более высокой производительностью.
Приобрести практически любую модель из актуальных серий по цене, указанной производителями, невозможно. Это касается и видеокарт GeForce RTX 50, и новых Radeon RX 9070 (XT). Первые поставки этих семейств видеокарт действительно предлагались по рекомендованным ценам, но партии были малы и раскуплены за считанные минуты. Сейчас купить новые видеокарты можно только с наценкой на MSRP в $150-$200, а то и больше (в случае GeForce RTX 5090 — намного). Не только рекомендованные цены соответствуют лишь базовым моделям без разгона и улучшенных характеристик, но и последующие партии видеокарт имеют повышенные розничные цены. Фактически, указанные производителями цены являются маркетинговой уловкой для того, чтобы пользователь запомнил стоимость, но при покупке приходится доплачивать сверху.
Ранее наблюдались подобные ситуации: GeForce GTX 1060 долгое время была не доступна по рекомендованной цене, а Radeon RX Vega с памятью HBM продавались дороже MSRP. Часто пользователи обвиняют компании в обмане, так как реальные цены отличаются от рекомендованных, хотя такой цели не ставилось. Пользователям советуем обращать внимание на реальные цены, по которым рассчитываются рейтинги видеокарт. В начале продаж определить реальную розничную цену сложно, но со временем она стабилизируется. Именно по ней стоит принимать решение о покупке — для этого мы и рассчитываем рейтинги производительности и полезности.
Видеокарта GeForce RTX 5070 имеет 12 ГБ видеопамяти. Такое решение можно назвать неоднозначным, но оно оправдано с технической точки зрения. Следующим вариантом при 192-битной шине был бы сразу 24 ГБ памяти, что слишком дорого при использовании GDDR7.
Обьем памяти соответствует GeForce RTX 4070, GeForce RTX 4070 Super и GeForce RTX 4070 Ti. GeForce RTX 4070 Ti Super и GeForce RTX 5070 Ti имеют уже 16 ГБ, как и Radeon RX 9070 (XT).
В настоящее время 12 ГБ видеопамяти достаточно для игр в разрешении 2560×1440 даже с включенной трассировкой лучей. Однако этого может не хватать в 4K-разрешении при генерации кадров, а будущим играм может быть мало этого объема и в 2560×1440. Тем не менее, увеличение объема памяти потребовало бы более широкой шины памяти, что увеличило бы себестоимость.
GeForce RTX 5070 имеет версию Founders Edition от Nvidia, чего нельзя сказать о GeForce RTX 5070 Ti по неизвестным причинам. В России FE-издания доступны только в редких серых поставках, поэтому для большинства покупателей это не имеет значения. Это разработка компании, похожая на другие модели Founders Edition, но без светодиодной подсветки.
Система охлаждения GeForce RTX 5070 FE использует четыре тепловые трубки и архитектуру двойного сквозного продувания Dual Flow-Through, как у GeForce RTX 5090 FE и GeForce RTX 5080 FE, но упрощенную. Карта компактнее и внешне напоминает мини-версию GeForce RTX 5090 FE. Радиатор охлаждает графический процессор, микросхемы памяти и VRM, но это более простая конструкция без жидкого металла и испарительной камеры. Двухслотовую конструкцию проще сделать для модели с потреблением 250 Вт, чем для GeForce RTX 5090 с потреблением 575 Вт.
Максимальная энергоемкость рассматриваемой модели составляет 250 Вт, на 50 Вт больше, чем у GeForce RTX 4070, и на 30 Вт превышает показатель GeForce RTX 4070 Super. Семья графических процессоров Blackwell использует тот же техпроцесс, что и Ada Lovelace, поэтому это не удивительно. В то время как GPU в Founders Edition не перегревается слишком сильно, пользователи отмечают заметный шум вентиляторов. Данная карта не слишком громкая, но и не тихая. Для дополнительного питания используется 16-контактный разъем 12V-2×6, расположенный под углом для удобства, а новый переходник на пару 8-контактных разъемов обладает более продуманной конструкцией и надежностью по сравнению с предыдущими версиями. GeForce RTX 5070 с потреблением до 250 Вт не должен испытывать проблем из-за теоретически возможного перегрева кабелей и разъемов. Выходов на дисплеи у FE-карты стандартное количество — три DisplayPort 2.1a с поддержкой UHBR20 (80 Гбит/с) и один HDMI 2.1b.
Нам важнее то, что партнёры Nvidia уже выпустили на рынок множество вариантов GeForce RTX 5070 собственного дизайна.
В ассортименте присутствуют разогнанные модели с различными системами питания и охлаждения, относящиеся к модификациям, продающимся по цене выше рекомендованной. С момента выхода в продажу видеокарты с новым графическим процессором доступны в рознице в виде разных модификаций таких компаний, как Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, PNY и Zotac.
Особенности архитектуры
Географический процессор GB205 — последний из трёх представителей графической архитектуры Blackwell первой волны. GeForce RTX 5070 построена на модификации GB205-300-A1 и поддерживает все возможности и особенности флагманского GB202. GB205 имеет размер кристалла и количество SM, аналогичных предыдущему поколению Ada Lovelace, в этот раз Nvidia не выпустила преемника AD104. GeForce RTX 5070 Ti основана на более крупном чипе GB203, а GeForce RTX 5070 — на пару ступеней меньшем GB205. Кристалл среднего размера площадью 263 мм² содержит чуть больше 31 миллиарда транзисторов — это меньше, чем было у AD104, в котором отключили значительную часть блоков для модели GeForce RTX 4070. В этом поколении Nvidia решила сэкономить, выпустив для решения такого уровня уже немного другой чип, ведь GB205 по размеру намного меньше кристаллов, используемых в старших моделях.
Структура графических процессоров Nvidia остаётся неизменной с архитектуры Ampere. Как и все графические процессоры компании, GB205 состоит из кластеров Graphics Processing Cluster (GPC), включающих несколько кластеров Texture Processing Cluster (TPC). Внутри каждого TPC находятся потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. GPC выполняет основные вычисления внутри кластера, включая собственный движок растеризации Raster Engine, несколько кластеров TPC и вдвое большее количество мультипроцессоров SM.
Графический процессор GB205 состоит из 5 кластеров GPC, где каждый содержит 25 кластеров TPC и по 50 потоковых мультипроцессоров SM. В его составе – 6400 CUDA-ядер, 50 RT-ядер, 200 тензорных ядер, 200 текстурных TMU блоков и 80 блоков ROP.
В версии GB205-300-A1 для GeForce RTX 5070 используется почти полный кристалл. В нем отключен один TPC в одном из GPC, состоящий из пары мультипроцессоров. Таким образом, активны 48 SM, что даёт 6144 CUDA-ядра, 192 тензорных ядра, 48 RT-ядра и 192 блока текстурирования TMU. В GeForce RTX 5070 активны все 80 ROP, имеющихся в GB205. Это отличие от видеокарты GeForce RTX 4070 предыдущего поколения, которая имела лишь 64 из 80 ROP в полном AD104, а в GeForce RTX 4070 Ti – все были активны.
Графический процессор функционирует на базовой частоте 2325 МГц, которая может достигать турбо-частоты в 2512 МГц. Подсистема памяти состоит из шести 32-битных контроллеров GDDR7-памяти, формирующих общую 192-битную шину памяти. Память объемом 12 ГБ работает с эффективной скоростью передачи данных в 28 Гбит/с, обеспечивая пропускную способность в 672 ГБ/с — на треть больше, чем у GeForce RTX 4070 с GDDR6X-памятью на скорости 21 Гбит/с. В GeForce RTX 5070 задействованы все 48 МБ L2-кэша, что еще более повышает возможности работы с памятью, так как объем кэша превышает 36 МБ в GeForce RTX 4070.
В обзоре GeForce RTX 5080 подробно рассказано о новом типе видеопамяти GDDR7 и изменениях в мультипроцессорах Blackwell. В новой архитектуре все 128 ядер CUDA на SM могут выполнять операции FP32 и INT32 параллельно, ранее эту возможность имело лишь половина ядер SM. Новые тензорные ядра получили поддержку формата данных FP4 для повышения производительности с небольшой потерей точности. RT-ядра четвертого поколения включают больше аппаратных блоков для ускорения функций трассировки лучей, например Mega Geometry. Это новая концепция, позволяющая увеличить геометрическую сложность объектов 3D-сцены при трассировке лучей и большом количестве динамических объектов за счет использования иерархии в ускоряющих структурах BVH. RT-ядра четвертого поколения Blackwell специально созданы для эффективной работы Mega Geometry с помощью кластерных движков для реализации схем обработки ускоряющих структур.
Мультипроцессор в Ada Lovelace и предыдущих архитектурах оптимизирован для стандартных шейдеров, а в Blackwell дополнительно сделали оптимизации для эффективного применения нейронных шейдеров. В обзоре GeForce RTX 5080 уже писали о возможности нейрорендеринга Neural Rendering — новых технологиях в 3D-графике, позволяющих использовать генеративные нейросети в сценах с растеризацией и трассировкой лучей. Nvidia предлагает большее использование возможностей ИИ в процессе рендеринга, хотя на сегодня раскрыты лишь в масштабировании DLSS. Новые возможности расширяют реконструкцию деталей при масштабировании и генерацию дополнительных кадров. Для успешной работы нейрорендеринга в Blackwell внедрили новый аппаратный планировщик ИИ — AI Management Processor (AMP), который эффективно распределяет задачи ИИ и рендеринга по блокам графического процессора.
В контроллере вывода на дисплеи и медиадвижках GeForce RTX 50 внесены важные изменения. Для вывода изображения графические процессоры Blackwell получили поддержку разъемов DisplayPort 2.1b, обеспечивающих пропускную способность до 80 Гбит/с в режиме передачи UHBR 20. Это позволяет использовать дисплеи с высокими разрешением и частотой обновления: 8K при 165 Гц с DSC и 4K при 480 Гц с DSC. Такая пропускная способность также позволяет подключить 8K-дисплеи с частотой обновления 60 Гц с использованием одного кабеля.
Новые видеокарты серии GeForce RTX 50 поддерживают кодирование и декодирование видео с цветовой субдискретизацией 4:2:2 для форматов H.264 и H.265. Несмотря на одинаковые возможности по обработке видео у всех GPU семейства Blackwell, производительность кодирования и декодирования данных различается. В топовом графическом процессоре GB202 три блока кодирования видео и два блока декодирования, в чипе GB203 по два блока каждого, а младший GB205 имеет по одному блоку NVEnc и NVDec. Тем не менее производительность при работе с H.264 выросла по сравнению с GeForce RTX 40 благодаря улучшенным самим блокам.
Вкратце поговорим и об улучшениях DLSS 4В новой версии Blackwell нейросеть способна создать до трёх лишних кадров благодаря этой технологии. Multi Frame Generation (MFG)Изменён алгоритм генерации кадров: теперь он работает быстрее, потребляя меньше видеопамяти, и позволяет достичь в несколько раз большей частоты кадров по сравнению с традиционным рендерингом. Также появились новые модели ИИ на основе трансформера, заменяющие предыдущие модели генеративных нейросетей при масштабировании разрешения и реконструкции лучей при трассировке, что повышает качество изображения. Эти возможности доступны в решениях GeForce RTX 40 и GeForce RTX 30, а для GeForce RTX 50 добавлена возможность генерации сразу нескольких кадров.
Технология DLSS является одним из главных преимуществ решений Nvidia. В DLSS 4 появилась многокадровая генерация, которая не просто удваивает частоту кадров, как в DLSS 3, а может утроить или даже учетверить общее количество кадров на дисплее. При этом игровой задержка не меняется. При базовой частоте кадров (без включения генерации) 40—50 FPS это позволяет добиться более плавной игры на мониторах с частотой обновления 144—180 Гц. Качество изображения сгенерированных кадров вполне нормальное, хотя иногда можно обнаружить артефакты в виде ореолов и ошибок интерполяции на отдельных кадрах. В процессе игры их вряд ли заметят.
Важно понимать: многокадровая генерация не обеспечит игровых 60 FPS при исходных 15-20 FPS без учёта сгенерированных кадров. В таком случае игра будет выглядеть плавно, но ощущаться вяло — как в желе, потому что реакция на действия всё равно будет со скоростью 15 FPS. Если же без генерации кадров получается хотя бы 40-50 FPS, то дополнительные сгенерированные кадры улучшают общий комфорт во многих случаях. Это полезная опция, которую нужно включать с умом, так как она сильно зависит от производительности и монитора, но польза набора технологий DLSS неоспорима.
Предварительная оценка производительности
Рассмотрим теоретические характеристики всех анонсированных видеокарт GeForce RTX 50, выпущенных на базе трёх чипов серии GB20x, для оценки различий между ними.
RTX 5090 | RTX 5080 | RTX 5070 Ti | RTX 5070 | |
---|---|---|---|---|
Графический процессор | GB202 | GB203 | GB203 | GB205 |
Транзисторов, млрд | 92,2 | 45,6 | 45,6 | 31,1 |
Площадь кристалла, мм² | 750 | 378 | 378 | 263 |
Количество ядер CUDA | 21760 | 10752 | 8960 | 6144 |
Количество блоков TMU | 680 | 336 | 280 | 192 |
Количество блоков ROP | 176 | 112 | 96 | 80 |
Количество RT-ядер | 170 | 84 | 70 | 48 |
Количество тензорных ядер | 680 | 336 | 280 | 192 |
Турбо-частота, ГГц | 2,41 | 2,62 | 2,45 | 2,51 |
Объем памяти, ГБ | 32 | 16 | 16 | 12 |
Шина памяти, бит | 512 | 256 | 256 | 192 |
Пропускная способность, ГБ/с | 1792 | 960 | 896 | 672 |
Энергопотребление, Вт | 575 | 360 | 300 | 250 |
Цена, $ | 1999 | 999 | 749 | 549 |
Лидер линейки GeForce RTX 5090 с чипом GB202 выделяется увеличенным сложностью и производительностью по сравнению с остальными решениями. Остальные чипы семейства Blackwell показывают не такие впечатляющие характеристики: даже кристалл GB203 почти вдвое меньше флагмана по всем параметрам, не говоря уже о самом маленьком GB205. Разница между последними двумя GPU составляет полтора раза, что указывает на значительную разницу производительности между GeForce RTX 5070 и GeForce RTX 5070 Ti.
Согласно теории, GeForce RTX 5070 может быть на более чем 40% медленнее GeForce RTX 5070 Ti как по вычислительной мощности, так и по большинству других теоретических параметров, хотя разница в ПСП незначительна. Положение GeForce RTX 5070 в линейке такое, что она довольно далеко от GeForce RTX 5070 Ti, между ними просматривается значительная разница. Для понимания прироста теоретических показателей в этом поколении рассмотрим основные характеристики новинки вместе с решениями уровня GeForce RTX xx70 из пары предыдущих поколений.
Видеокарта | RTX 5070 | RTX 4070 | RTX 3070 |
---|---|---|---|
Графический процессор | GB205 | AD104 | GA104 |
Кол-во транзисторов, млрд | 31,1 | 35,8 | 17,4 |
Площадь чипа, мм² | 263 | 294 | 392 |
Количество ядер CUDA | 6144 | 5888 | 5888 |
Количество тензорных ядер | 192 | 184 | 184 |
Количество RT-ядер | 48 | 46 | 46 |
Количество блоков TMU | 192 | 184 | 184 |
Количество блоков ROP | 80 | 64 | 96 |
Турбо-частота, ГГц | 2,51 | 2,48 | 1,73 |
Объем памяти, ГБ | 12 | 12 | 8 |
Шина памяти, бит | 192 | 192 | 256 |
Скорость памяти, Гбит/с | 28 | 21 | 14 |
Пропускная способность, ГБ/с | 672 | 504 | 448 |
Объем L2-кэша, МБ | 48 | 36 | 4 |
FP32-вычисления, Тфлопс | 30,9 | 29,2 | 20,3 |
Текстурирование, Мтекс/с | 482 | 455 | 317 |
Филлрейт, Мпикс/с | 201 | 158 | 166 |
Энергопотребление, Вт | 250 | 200 | 220 |
Цена, $ | 549 | 599 | 499 |
Проанализируем ключевые характеристики графических процессоров одной модели из разных поколений. Разница между GeForce RTX 4070 и GeForce RTX 3070 существенна: первая в полтора раза превосходит вторую во всех аспектах, кроме заполнения кадров и пропускной способности памяти — вычислительная производительность и скорость текстурирования возросли вдвое. Показатели GeForce RTX 5070 по сравнению с GeForce RTX 4070 незначительно улучшились — это результат использования схожих техпроцессов для GB205 и AD104, а также сходной сложности GPU, о чем уже неоднократно говорилось.
Для GeForce RTX 4070 использовался графический процессор AD104, предлагающий из 60 доступных мультипроцессоров SM всего 46. GB205 имеет лишь 50 SM в чипе физически, из которых в GeForce RTX 5070 задействованы 48 мультипроцессоров. Тактовые частоты GeForce RTX 5070 немного выше по сравнению с GeForce RTX 4070, но нужно смотреть на реальные тактовые частоты, поскольку графические процессоры Nvidia обычно работают на более высоких частотах, чем заявлены. Более высокий предел энергопотребления у новинки поможет в этом деле. Но разница между этими GPU всё равно невелика.
GeForce RTX 5070 теоретически обладает пиковой FP32-производительностью 30,9 терафлопс, немного превышая 29,2 терафлопс у GeForce RTX 4070. Энергопотребление выросло до 250 Вт при помощи GDDR7-памяти, которая на треть быстрее предшественницы. По этим показателям производительность GeForce RTX 5070 может быть на 6% или 33% выше, чем у GeForce RTX 4070. Однако реальная производительность зависит от архитектуры Blackwell с увеличенным количеством рассчитываемых пересечений лучей/треугольников в RT-ядрах и поддержкой нового формата FP4. Также важно отметить удвоение ПСП, которое в большинстве игр приближает прирост производительности к верхнему значению.
Компания Nvidia заявляет о преимуществе новой модели над GeForce RTX 4070 (не Super) примерно вдвое и больше, однако этот прирост производительности не совсем честный, так как часто учитывает многокадровую генерацию, которая требовательна к начальной частоте кадров без работы MFG. Без указания конкретных значений FPS невозможно сказать, позволят ли задержки ввода комфортно играть при 100+ FPS и больше, так как реальная родная частота кадров может быть ниже уровня минимального комфорта. Поэтому лучше обращать внимание на тесты с реальными значениями FPS. Nvidia также указала на диаграмме игры без DLSS 4, по которым можно провести сравнение чистой производительности — по Resident Evil 4 и Horizon Forbidden West видно, что прирост небольшой. Тема DLSS и частоты кадров с генерацией будет рассмотрена в отдельном материале.
К нашему сожалению, модель GeForce RTX 5070 продолжила тенденцию небольших приростов производительности от поколения к поколению в серии GeForce RTX 50, за исключением флагманского решения. В презентации Nvidia был слайд, который многие поняли как утверждение о том, что GeForce RTX 5070 по скорости сравнится с GeForce RTX 4090! Компания сама виновата в сложившейся ситуации, поскольку представители Nvidia могли бы более ясно разъяснить, что речь идет о скорости с учетом всех возможностей DLSS, например многокадровой генерации, которой не поддерживается предыдущее поколение.
Реальность далека от маркетинговых обещаний, это нужно учитывать. Без преимуществ многокадровой генерации новинка лишь на 20% быстрее GeForce RTX 4070 и на незначительные проценты быстрее GeForce RTX 4070 Super. Это неплохо для игр в разрешении 2560×1440, но заявления компании основаны на генерации кадров, а не на архитектурных улучшениях или большем количестве исполнительных блоков. Nvidia вынуждена использовать подобные методы из-за застоя в производстве полупроводников: при изготовлении кристаллов Blackwell применяется тот же техпроцесс, что и для Ada Lovelace. Архитектурных изменений в новом поколении не так много. Прирост производительности приходится «изыскивать».
Скорость GeForce RTX 5070 и GeForce RTX 4090, с учётом многокадровой генерации DLSS 4, может показаться сопоставимой. Серия GeForce RTX 50 поддерживает до четырех дополнительных кадров с DLSS 4, в то время как у GeForce RTX 4090 ограничение на два дополнительных кадра.
Это объясняет близость частоты кадров между моделями при учёте сгенерированных кадров. Однако при традиционном рендеринге GeForce RTX 4090 быстрее новинки почти на 75%.
Многокадровая генерация делает смену кадров более плавной, но при низкой базовой частоте игра может казаться вялой. В требовательных играх при разрешении 4K включение многокадровой генерации DLSS 4 при итоговых 75-100 FPS создаст ощущение игры на уровне 25 FPS, что недостаточно для комфортного игрового опыта.
В подобных ситуациях многокадровая генерация эффективнее при разрешении 2560×1440 из-за более высокой базовой частоты кадров.
GeForce RTX 5070 демонстрирует незначительный прирост производительности по сравнению с GeForce RTX 4070 предыдущего поколения, достигающий около 20% в Full HD и 25% в разрешении 4K. По производительности новая модель сравнима с GeForce RTX 4070 Ti, превосходит GeForce RTX 4070 Super на 5%, но уступает GeForce RTX 4070 Ti Super примерно на 10%. В контексте конкуренции с AMD GeForce RTX 5070 располагается между Radeon RX 7900 XT и Radeon RX 7900 GRE. Новая Radeon RX 9070 XT должна превзойти GeForce RTX 5070, а Radeon RX 9070 будет находиться на примерно таком же уровне без учета трассировки.
С включенной трассировкой преимущество новинки над GeForce RTX 4070 меньше — порядка 15%-20%, и в таком случае GeForce RTX 5070 можно сравнить лишь с GeForce RTX 4070 Super. Новая модель быстрее, чем даже Radeon RX 7900 XTX, но в серии Radeon RX 9070 заметно улучшили трассировку. Это прекрасно — борьба в этом ценовом сегменте будет жесткой. В отличие от более дорогих решений, которые AMD не предлагает. Radeon RX 9070 напрямую конкурирует с GeForce RTX 5070 по рекомендованной розничной цене. Так как решения AMD традиционно пользуются несколько меньшим спросом, у них есть шанс получить несколько большее распространение и цену ниже чем у конкурентов. Radeon RX 9070 XT при цене на $50 выше вряд ли будет конкурировать с GeForce RTX 5070 Ti, зато эта видеокарта должна превзойти GeForce RTX 5070 за сравнительно небольшую прибавку к цене.
К сожалению, большинство цен на видеокарты напоминают расцвет криптомайнинга в 2021 году — удвоения или утроения сверх рекомендованной цены нет, но новые поколения продаются на 30%-50% дороже MSRP. Это результат естественного баланса рыночного спроса и предложения — последнего недостаточно для высокого спроса, поэтому цены растут. Как и в 2021 году, рекомендуется не покупать новые видеокарты при отсутствии особой необходимости и возможности купить их за приемлемые деньги. Если бы GeForce RTX 5070 стоил $549 (60-65 тысяч рублей), это было бы отличным предложением. Но за 80 тысяч и дороже покупать новинку не нужно, лучше подождать снижения цен.
GeForce RTX 5070 может столкнуться с проблемой в будущих играх при разрешении 4K из-за наличия лишь 12 ГБ видеопамяти. В некоторых играх уже возникают проблемы производительности, хотя их количество пока невелико. Но в будущих проектах недостаток памяти может стать серьёзным ограничением. Низкий объем видеопамяти часто приводит не только к снижению FPS, но и к неприятным рывкам и тормозам без возможности улучшить ситуацию, кроме как уменьшить качество картинки. Важно учитывать этот момент с учетом появления Radeon RX 9070 — с похожей ценой, серьёзно улучшенной производительностью трассировки лучей и 16 ГБ видеопамяти.
В текущем году пересуды о преимуществах определённых продуктов, необходимости трассировки лучей, превосходстве DLSS 4 над FSR 4 или объёме видеопамяти утратили смысл. Сейчас на рынке победит тот, кто сможет произвести и доставить больше графических процессоров. AMD, имея невысокий спрос на свои вычислительные решения, может получить преимущество, захватив долю игрового рынка. Nvidia же, возможно, откажется от части прибыли в сфере ИИ и вычислений, сосредоточившись на производстве GeForce, чтобы сохранить свою позицию на рынке графики. Предполагается также расширение производственных мощностей, что позволит ликвидировать дефицит GPU и в конечном итоге привести к насыщению рынка и снижению цен.
Характеристики видеокарты Gigabyte GeForce RTX 5070 Gaming OC с объемом памяти 12 ГБ.
Сведения о производителеКомпания Gigabyte Technology (торговая марка Gigabyte) была основана в 1986 году в Китайской Республике (Тайвань). Штаб-квартира расположена в Тайбэе/Тайвань. Изначально она представляла собой группу разработчиков и исследователей. В 2004 году на базе компании был образован холдинг Gigabyte, куда вошли Gigabyte Technology (разработка и производство видеокарт и материнских плат для ПК) и Gigabyte Communications (производство коммуникаторов и смартфонов под маркой GSmart с 2006 года).
Объект исследованияВидеокарта Gigabyte GeForce RTX 5070 Gaming OC с 12 гигабайтами памяти GDDR7.
Gigabyte GeForce RTX 5070 Gaming OC с памятью на 12 ГБ и шиной GDDR7 шириной 192 бита. | ||
---|---|---|
Параметр | Значение | Номинальное значение (референс) |
GPU | GeForce RTX 5070 (GB205) | |
Интерфейс | PCI Express x16 5.0 | |
Частота работы GPU (ROPs), МГц | BIOS P: 2625(Boost)—2865(Max) BIOS S: 2625(Boost)—2865(Max) |
2512(Boost)—2790(Max) |
Частотный показатель работы памяти (в физическом режиме, МГц; эффективный режим, ГГц) | 2333 (28) | 2333 (28) |
Ширина шины обмена с памятью, бит | 192 | |
Число вычислительных блоков в GPU | 48 | |
Число операций (ALU/CUDA) в блоке | 128 | |
Суммарное количество блоков ALU/CUDA | 6144 | |
Число блоков текстурирования (BLF/TLF/ANIS) | 192 | |
Число блоков растеризации (ROP) | 80 | |
Число блоков Ray Tracing | 48 | |
Число тензорных блоков | 192 | |
Размеры, мм | 330×130×56 | 310×120×40 |
Число разъемов на материнской плате для видеокарты. | 3 | 2 |
Цвет текстолита | черный | черный |
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S) | 257/250 | 250 |
Энергопотребление в режиме 2D, Вт | 30 | 30 |
Энергопотребление в режиме «сна», Вт | 10 | 10 |
Уровень шума при максимальной нагрузке на 3D графику, децибелы (BIOS P / BIOS S). | 27,5/22,5 | 29,0 |
Уровень шума в 2D (просмотр видео), дБА | 18,0 | 18,0 |
Уровень шума в 2D (в простое), дБА | 18,0 | 18,0 |
Видеовыходы | 1×HDMI 2.1b, 3×DisplayPort 2.1b | 1×HDMI 2.1b, 3×DisplayPort 2.1b |
Поддержка многопроцессорной работы | нет | |
Максимально одновременно работающих приемников/мониторов. | 4 | 4 |
Питание: 8-контактные разъемы | 0 | 0 |
Питание: 6-контактные разъемы | 0 | 0 |
Питание: 16-контактные разъемы | 1 | 1 |
Вес карты с комплектом поставки (брутто), кг | 2,0 | 1,8 |
Вес карты чистый (нетто), кг | 1,3 | 1,0 |
Максимальное разрешение/частота, DisplayPort | 3840×2160@240 Гц, 7680×4320@120 Гц | |
Максимальное разрешение/частота, HDMI | 3840×2160@144 Гц, 7680×4320@120 Гц | |
Примерная цена видеокарт с чипом GeForce RTX 5070. | 100 тысяч рублей |
Память
Карта оборудована 12 гигабайтами оперативной памяти GDDR7 SDRAM, организованными в шесть микросхем по 16 гигабит каждая. Микросхемы размещены на лицевой стороне платы и выполнены компанией Samsung. K4VAF325ZC-SC28Память рассчитана на номинальную частоту работы 2333 МГц (эффективная ПСП 28 Гбит/с или 28 ГТ/с). Для расчета эффективной ПСП GDDR6X физическую частоту умножали на 16, а для GDDR7 — на 12. Технология кодирования PAM4 (4 Pulse Amplitude Modulation) в сочетании с двойной передачей сигнала (DDR) и двумя каналами давала множитель 16 для GDDR6X. GDDR6 использует модуляцию PAM2, поэтому финальный множитель физической частоты для получения эффективной ПСП — 8. Для производства GDDR7 компания Samsung использует PAM3, поэтому финальный множитель — 12, а физическая частота работы таких микросхем значительно выше, чем у предшественников.
Характеристика карты и её различие с Gigabyte GeForce RTX 5070 Ti Eagle OC Ice SFF 16G (16 ГБ).
Новый продукт оценивается по сравнению с моделью от одного и того же разработчика, которая находится на более высоком уровне (GeForce RTX 5070 Ti).
Ядра GB203 (GeForce RTX 5070 Ti) и GB205 (GeForce RTX 5070) заметно различаются по размеру кристаллов, но подложки практически одинаковы. При осмотре печатных плат видно, что для GeForce RTX 5070 Gigabyte использовали PCB старшего решения, уменьшив шину обмена с памятью с 256 до 192 бит (не установив две микросхемы памяти и снизив объем до 12 ГБ). Несмотря на то, что PCB не полностью идентичны, есть различия в системе питания, а размеры печатных плат незначительно отличаются.
Ядро выпущено на пятидесятой неделе 2024 года (кристалл изготовлен по технологии TSMC 4N — по разным оценкам это 5 нм). Обозначение — GB205-300 (-300 обычно означает сокращенный в той или иной степени чип, а -400 — полнофункциональный, то есть все блоки активны).
Карта Gigabyte GeForce RTX 5070 Gaming OC 12G имеет тринадцать фаз питания, распаренных на десять и три.
На схеме питание ядра обозначено зелёным цветом, а памяти — красным.
ШИМ-контроллер AOZ71031QI от Alpha&Omega Semiconductor управляет питанием ядра в десять фаз. Его максимальная мощность составляет десять фаз, и он размещён на обратной стороне платы.
В преобразователях питания ядра и микросхем памяти применяются транзисторные сборки DrMOS от фирмы A&O модели AOZ5310NQI, рассчитанные на ток 60 ампер.
Питание микросхем памяти регулирует ШИМ-контроллер A&O AOZ71031QI, который установлен на лицевой стороне платы.
На обратной стороне печатной платы установлен контроллер uPI Semi для отслеживания напряжений и температур.
Gigabyte доверяет управление подсветкой своих видеокарт контроллерам от компании Holtek.
Карта функционирует в двух режимах, определённых двумя вариантами BIOS, доступными при помощи переключателя на её верхней части. P (performance / производительный) и S (silent / тихий)Различия между режимами заключаются главным образом в скорости работы вентиляторов. Максимальное потребление энергии обоих режимов равно 250 Вт.
Начальные частоты памяти совпадают с рекомендуемыми значениями, а значение Boost для частоты работы ядра в обоих режимах BIOS превышает референсное на 4,5%. Максимальная частота GPU у карты Gigabyte больше референсной на 2,7%. Исследования показали, что средняя производительность Gigabyte в разрешении 2.5K выше референсной на 3%.
Расход энергии карты Gigabyte во время тестов достигал … . 257 Вт в режиме BIOS P и до 250 Вт в режиме BIOS S.
Потребительский лимит можно увеличить до 120%, поэтому мы провели ручной разгон, повысив частоту ядра и памяти на 214 и 175 МГц соответственно. В результате удалось добиться стабильной работы с максимальными частотами 3075/2506 МГц (30 ГТ/с).
Питание для карты Gigabyte поступает через разъём питания типа PCIe 5.0 с шестнадцатью контактами.
Разъем оснащен ярким индикатором, который сигнализирует о проблемах с подачей энергии.
Комплект поставки карт включает переходник на указанный разъём из двух обычных 8-контактных разъёмов PCIe 2.0.
Длина карты составляет 33 см, высота — 13 см, а толщина — 5,6 см. В системном блоке карта занимать три слота.
GeForce RTX 5070 не Модель поддерживает многокарточную конфигурацию по технологии SLI, для чего не предусмотрено специальное гнездо на верхней части корпуса.
Карта оборудована тремя входами DP 2.1b и одним входом HDMI 2.1b.
Из-за появившейся в интернете информации об использовании в выпускаемых графических картах на базе GPU GeForce RTX 50 ядер с неполным количеством блоков растеризации (ROP) некоторое время будем проверять этот параметр у видеокарт, проходящих наше тестирование. В данном случае… корректное количество ROP.
Gigabyte Control Center управляет работой карты, позволяя регулировать вентиляторы, частоту работы, пределы потребления и подсветку.
Нагрев и охлаждение
Перед нами кулер с проточкой воздуха в хвостовой части радиатора. Системе охлаждения служит многосекционный пластинчатый никелированный радиатор с тепловыми трубками, передающими тепло на ребра радиатора.
Восемь трубок припаяны к большой медной никелированной платформе, которая охлаждает как ядро, так и микросхемы памяти с помощью специального теплопроводящего геля — жидких термопрокладок. Для охлаждения ядра применяется термопаста (не жидкий металл!).
На радиаторе расположены подошвы для охлаждения преобразователей питания VRM. Задняя пластина защищает плату.
Радиатор закрыт кожухом с тремя вентиляторами диаметром 100 миллиметров, каждый из которых имеет семь лопастей и работает на одинаковой частоте вращения. По умолчанию это так, но через программу Gigabyte Control Center можно задать работу каждого вентилятора индивидуально.
Вентиляторы оснащены лопастями с особым рифлением и краями с направляющими. Согласно заявлению разработчика, такая конструкция повышает силу воздушного потока на 1,2 раза без увеличения шума системы охлаждения.
В соответствии с обычаями Gigabyte, средний вентилятор работает в обратном направлении по сравнению с боковыми, образуя эффект «шестеренки» и уменьшая турбулентность воздушных потоков.
При невысокой нагрузке на видеокарту вентиляторы останавливаются при температуре GPU меньше 50 градусов и нагреве микросхем памяти ниже 80 градусов. При запуске ПК вентиляторы функционируют, но после загрузки драйвера для видеокарты происходит проверка рабочей температуры, и вентиляторы отключаются. видеоролик на эту тему.
Мониторинг температурного режима:
Важно отметить, что инженеры Nvidia исключили из отчетов о мониторинге данные о температуре самой нагретой области ядра.
Режим BIOS P:
Во время тестирования под нагрузкой максимальная температура процессора не превысила 65 градусов, а микросхем памяти — 64 градуса, что является хорошим показателем для видеокарты такого класса. Потребляемая мощность достигала 257 Вт.
Мы засняли и ускорили в 50 раз 8-минутный прогрев
Нагрев был наибольшим в районе VRM, рядом с видеочипом, и возле разъёма подключения питания.
Ручной разгон:
Ручной разгон до 3075 МГц по ядру и 2506 МГц по памяти (эффективная частота 30072 МГц, что даёт 30 ГТ/с) привёл к повышению температуры ядра до 72 градусов и микросхем памяти — до 66 градусов. Скорость вращения вентиляторов превысила 2100 оборотов в минуту, а потребление электроэнергии составило 300 Вт. Такой разгон увеличил производительность примерно на 8% в разрешении 2.5K.
Режим BIOS S:
В режиме нагрузки максимальная температура процессора и памяти составила 68/66 градусов Цельсия, что показатель отлично. Уровень энергопотребления видеокарты достигал 250 Вт.
Шум
Процесс измерения шума предполагает герметичное помещение, исключающее реверберации. Исследуемый системный блок лишен вентиляторов и не генерирует механических шумов. Базовый уровень шума в 18 дБА включает шум помещения и самого измерительного прибора. Измерения выполняются на расстоянии 50 см от видеокарты, у ее системы охлаждения.
Режимы измерения:
- В двухмерном режиме ожидания открыт веб-браузер с ресурсом iXBT.com, окно программы Microsoft Word и несколько программ для интернет-связи.
- Режим двухмерного просмотра фильмов использует аппаратное декодирование с вставкой промежуточных кадров по технологии SmoothVideo Project.
- В режиме 3D при полной загрузке графического процессора выполняется тест FurMark.
Разрядка уровней шума выглядит так:
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
Температура при простое в двухмерном режиме не превышала 45 градусов Цельсия, вентиляторы были отключены, уровень шума составлял 18 децибел и соответствовал фоновому.
Во время просмотра фильма с аппаратной кодировкой никаких изменений не наблюдалось.
Режим BIOS P:
При максимальной нагрузке трёхмерного режима температура составляла 65/64 градуса по Цельсию (ядро/память). Вентиляторы достигали скорости 1727 оборотов в минуту, шум увеличивался до 27,5 децибел: это тихо.
Аудиозапись шума — здесьАнализ спектра шума не показал видимых недостатков (низкочастотные пики обычно не беспокоят человека).
Режим BIOS S:
При максимальной нагрузке трехмерной графики температура составляла 68/66 градусов по Цельсию (ядро/память). Вентиляторы работали на максимальных оборотах — 1217 в минуту, шум достигал 22,5 децибел: это очень тихо.
Подсветка
Карта имеет два элемента подсветки.
На верхней части есть световая полоса. Сдвигаем подвижную деталь с фирменным знаком, и полоса закрывается, а светится становится логотип.
Основным элементом подсветки являются фирменные вентиляторы Gigabyte Halo: светодиоды находятся на внутренней части кожуха по краю каждого вентилятора. Вращающиеся лопасти вместе с ними создают необычные световые эффекты.
Геймберг-утилита Gigabyte Control Center управляет режимами подсветки, включая отключение.
Подсветку можно синхронизировать только с материнскими платами от Gigabyte, используя утилиту Control Center.
Комплект поставки и упаковка
Кроме карты, краткого руководства пользователя и переходника питания в комплект входит разборная подставка для видеокарты с возможностью регулировки высоты упора.
Подставку крепят к видеокарте (к комплекте поставки идет крепеж), благодаря чему конструкция становится прочной и устойчивой.
В момент первого открытия упаковки и извлечения видеокарты из статического пакета встречается любопытное указание, нанесенное непосредственно на ленту, приклеенную к защитной плёнке с тыльной стороны платы.
Тестирование: синтетические тесты
Провели тестирование новой видеокарты Nvidia на штатных частотах в комплексе синтетических тестов. Комплекс постоянно развивается: добавляются новые тесты, а устаревшие удаляются. Хотелось бы добавить больше примеров с вычислениями, но это затруднительно. Все время стараемся расширять и совершенствовать набор тестов, поэтому предлагайте свои идеи в комментариях к статье или авторам.
Внедрили дополнительные тесты для оценки производительности трассировки лучей, масштабирования разрешения и повышения производительности: DLSS, FSR и XeSS. Помимо этого, применяем набор подтестов из 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. Заменили приложения DirectX 11 и 12 из SDK на тесты ИИ, которые используют возможности современных GPU, такие как тензорные ядра.
Синтетические тесты выполнялись на этих видеокартах.
- GeForce RTX 5070 со стандартными параметрами (RTX 5070)
- GeForce RTX 5070 Ti со стандартными параметрами (RTX 5070 Ti)
- GeForce RTX 4070 Super со стандартными параметрами (RTX 4070 Super)
- GeForce RTX 4070 со стандартными параметрами (RTX 4070)
- Radeon RX 7900 XTX со стандартными параметрами (RX 7900 XTX)
Для оценки производительности новой видеокарты GeForce RTX 5070 в качестве опорных использовались ранее выпущенная RTX 5070 Ti на базе графического процессора GB203 в урезанном варианте, а также две видеокарты предыдущего поколения с аналогичным рыночным позиционированием. В сравнение взяты модели с цифровым индексом 4070, одна из которых имеет приставку Super, представленная около года назад. По результатам анализа производительности этих видеокарт станет ясно, насколько новая архитектура Blackwell ускорила решения в данном ценовом сегменте.
Для сравнения новой видеокарты опять-таки использована топовая модель прошлого поколения — Radeon RX 7900 XTX. Несмотря на разное рыночное позиционирование, она остаётся флагманом компании AMD. Сравнение с ней покажет, насколько хороша новинка по сравнению с устаревшим Radeon. На момент тестирования у нас не было новейших моделей линейки Radeon RX 9070 (XT), но вскоре мы их рассмотрим.
Тесты 3DMark Vantage
В течение длительного времени изучаем синтетические тесты из пакета 3DMark Vantage, поскольку в них можно обнаружить ценную информацию, отсутствующую в более современных тестах. Тесты Feature с поддержкой DirectX 10 по-прежнему актуальны, и анализ результатов новых видеокарт позволяет делать важные выводы.
Feature Test 1: Texture Fill
Первый тест оценивает эффективность блоков, осуществляющих выборку текстур. Для этого выполняется заполнение прямоугольников значениями из малой текстуры при помощи большого количества текстовых координат, которые меняются с каждым кадром.
Эффективность видеокарт AMD и Nvidia в текстурном тесте Futuremark обычно высока, результаты близки к теоретическим параметрам, хотя иногда немного занижены для некоторых GPU. Производительность графического процессора GB205 в урезанной версии в этом тесте оказалась ниже ожидаемой. RTX 5070 заметно проигрывает RTX 5070 Ti из-за разницы в количестве исполнительных блоков, но проигрыш новинки и более старой RTX 4070 Super оказался неожиданным.
Сравнение с единственной моделью AMD сейчас не имеет смысла, стоит подождать новых решений RX 9070 (XT). Предыдущие поколения AMD показывали лучшие результаты в этом тесте, а RX 7900 XTX тоже неплоха, хоть скорость текстурирования новых решений Radeon несколько снизилась, и близкие по цене решения Nvidia их уже догнали — RTX 5070 Ti против RX 7900 XTX.
Feature Test 2: Color Fill
Вторая задача — проверка скорости заполнения пикселей. В ней применяется простой шейдер, не влияющий на производительность. Интерполированное значение цвета записывается во внеэкранный буфер с помощью альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, часто применяемый в играх с HDR-рендерингом, поэтому этот тест актуален.
Результаты второго теста 3DMark Vantage показывают производительность блоков ROP без учета пропускной способности видеопамяти. Данный тест измеряет именно производительность подсистемы ROP, на которую обычно не оказывает явного влияния ПСП. У новой видеокарты GeForce RTX 5070 наблюдается соответствие теории — производительность хуже, чем у модели более высокого уровня RTX 5070 Ti с большим чипом. Новая модель немного опережает более старый GPU этого же ценового уровня по скорости подсистемы ROP, хотя преимущество оказалось ниже ожидаемого.
Все видеокарты Nvidia в данном тесте заметно проигрывают решениям AMD, в частности флагманской модели Radeon RX 7900 XTX, которая превосходит даже RTX 4090. Видеокарты GeForce по пиковой скорости заполнения сцены традиционно уступают конкурентам, поэтому подобные результаты в данном синтетическом тесте не являются неожиданностью.
Тест функции 3: Параллаксное заслонение карт.
Этот вид feature-теста интересен тем, что подобная техника уже давно применяется в играх. В нем путем Parallax Occlusion Mapping формируется один четырехугольник (точнее, два треугольника), имитирующий сложную геометрию. Для этого используются ресурсоемкие операции по трассировке лучей и карта глубины высокого разрешения. Поверхность освещается с помощью алгоритма Strauss. Этот тест – настоящая нагрузка для видеочипа пиксельного шейдера, так как в нем множество текстурных выборок при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Результаты этого теста из пакета 3DMark Vantage определяются не только скоростью математических вычислений, эффективностью исполнения ветвлений или скоростью текстурных выборок, а несколькими параметрами одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU и эффективность выполнения сложных шейдеров. Этот тест довольно полезен, так как результаты в нем часто коррелируют с результатами игровых тестов с использованием чистой растеризации.
Важно и математическая, и текстурная производительность, и в «синтетике» 3DMark Vantage новая модель GeForce RTX 5070 снова показала результат ниже ожидаемого. Если ее отставание от модели RTX 5070 Ti понятно, то минус 11% от RTX 4070 Super был неожиданным — это уже второй тест с такими сравнительными результатами. Понятно, что так как архитектурных улучшений в новом семействе немного, и приросты скорости не могут быть большими, но чтобы новинка уступала предыдущей модели… Флагманская видеокарта конкурента показала результат более чем на 60% выше — примерно на уровне RTX 5080, но рассматриваемая сегодня видеокарта и не конкурент ей.
Feature Test 4: GPU Cloth
Четвертый тест привлекателен тем, что в нем рассчитываются физические взаимодействия (симуляция ткани) с помощью графического процессора. Для этого применяется вершинная симуляция, которая реализуется комбинацией работы вершинных и геометрических шейдеров в нескольких проходах. Перенос вершин из одного прохода симуляции к другому осуществляется посредством stream out. Таким образом проверяется производительность выполнения вершинных и геометрических шейдеров, а также скорость stream out.
Скорость рендеринга в этом тесте зависит от нескольких параметров: производительности обработки геометрии и эффективности выполнения шейдеров. Nvidia должна показать сильные стороны в этом тесте, но мы получаем не совсем корректные результаты, поэтому их видеокарты лучше не оценивать слишком серьезно. Ранее подобная ситуация касалась только GeForce, но со временем Radeon тоже оказались в той же ситуации — более новые решения и драйверы AMD показывают низкие результаты из-за драйверов, которые никто давно не оптимизирует для старого тестового пакета.
Новая RTX 5070 показала результат, близкий к уровню RTX 5070 Ti (и отсутствующей на диаграмме RTX 5080). Это указывает, что бенчмарк не тестирует скорость основных вычислительных блоков, а скорее обращает внимание на возможности геометрических блоков. Все видеокарты с чипами Blackwell работают немного быстрее, чем модели Ada Lovelace, и RTX 5070 заметно опережает RTX 4070 Super. Radeon RX 7900 XTX демонстрирует худшие результаты и занимает последнее место в этом тесте.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на основе систем частиц, рассчитанных графическим процессором. Применяется вершинная симуляция: каждая вершина символизирует отдельную частицу. Stream out используется аналогично предыдущему тесту. Вычисляется несколько сотен тысяч частиц, каждая анимируется отдельно, и учитываются их столкновения с картой высот. Частицы отрисовываются геометрическим шейдером, который из каждой точки создает четыре вершины, формирующие частицу. Наиболее нагружен шейдерными блоками расчет вершин, также тестируется stream out.
Во втором геометрическом тесте из 3DMark Vantage получаются далекие от теории результаты, которые упираются во что-то непонятное, судя по результатам. Если считать их корректными, то рассматриваемая сегодня новая видеокарта снова позади RTX 5070 Ti, что нормально, и снова проиграла RTX 4070 Super, что неожиданно. Возможно, новые драйверы хуже оптимизированы для DirectX 10 и для этого бенчмарка конкретно. Условно конкурирующая со всеми решениями Nvidia топовая видеокарта Radeon RX 7900 XTX и тут проиграла всем представленным в сравнении видеокартам соперника, что также можно объяснить скорее плохой оптимизацией драйверов, так как раньше результаты GPU обоих производителей в этом подтесте были заметно выше.
Feature Test 6: Perlin Noise
Последний тесты пакета Vantage является математически-интенсивным тестом графического процессора; этот тест рассчитывает несколько октав алгоритма Перлина шума в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Алгоритм Перлина шума — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
Результаты математического теста показывают, что производительность решений не всегда соответствует теоретическим ожиданиям, однако близка к пиковой производительности видеочипов при выполнении сложных задач. Тест использует операции с плавающей запятой, и новые архитектуры могли бы продемонстрировать преимущества двойного запуска команд, но устаревшая конструкция теста не позволяет в полной мере оценить возможности современных GPU.
Новая модель GeForce RTX 5070 ожидаемо проиграла RTX 5070 Ti более чем на треть. Причина такого же результата, как у ее супер-предшественницы, интересна и не совсем соответствует теории. Флагманская Radeon RX 7900 XTX от AMD опережает новую модель семейства RTX 50 по понятным причинам: ее ценовой конкурент — скорее RTX 5070 Ti. Проверим результаты в более современных синтетических тестах с повышенной нагрузкой на GPU.
Тесты Direct3D 12
Мы исключили из тестов примеры из SDK Microsoft и AMD, применяющие Direct3D12, поскольку они часто показывают неточную информацию. Единственным оставшимся тестом с поддержкой Direct3D12 стал бенчмарк Time Spy из 3DMark. Цель – оценить не только общую производительность видеокарт, но и влияние асинхронных вычислений, появившихся в DirectX 12. Для проверки использовались два графических теста.
С этого теста сравниваем новинку не только с Super-моделью из поколения RTX 40 аналогичного уровня, но и с базовым решением без дополнительных индексов. Производительность новой модели GeForce RTX 5070 в этой задаче по сравнению с видеокартами предыдущего поколения того же уровня оказалась явно выше, что соответствует теории. Неудивительно, что RTX 5070 Ti на основе урезанной версии более мощного GB203 тут явно быстрее.
Видеокарты Radeon в данном тесте демонстрируют более высокую производительность по сравнению с GeForce, особенно если учитывать их стоимость. RX 7900 XTX, являясь прошлогодним флагманом, не может сравниться с RTX 5070. Поэтому результаты рассматриваемой сегодня видеокарты оказались ниже, чем у RX 7900 XTX. В реальных играх корреляция результатов теста не всегда высока, но в задачах растеризации решения AMD выигрывают. Теперь переходим к тестам трассировки лучей.
Тесты трассировки лучей
Бенчмарк Port Royal от создателей тестов серии 3DMark – один из первых тестов производительности трассировки лучей. Тест функционирует на всех графических процессорах с поддержкой DirectX Raytracing API. В разрешении 2560×1440 при разных настройках проверили несколько видеокарт, когда отражения рассчитывались с помощью трассировки лучей в двух режимах и традиционным для растеризации методом.
Тест демонстрирует новые применения трассировки лучей через DXR API с помощью алгоритмов отрисовки отражений и теней. Несмотря на то, что тест не оптимизирован и сильно загружает даже мощные видеокарты, он подходит для сравнения производительности разных видеокарт в этой конкретной задаче.
Новая GeForce RTX 5070 показала результат близкий к предыдущему тесту, обойдя RTX 4070 и оказавшись быстрее Super-модели прошлого поколения. В обычном режиме разница между ними небольшая, а в более сложных условиях новинка опережает GPU прошлого поколения сильнее. В этом тесте флагман прошлого поколения от AMD оказался на вполне приличном уровне, даже опередив новенькую модель, однако сравнивать их напрямую не совсем корректно — ждем обзоров Radeon RX 9070 (XT).
Вышел новый подтест 3DMark для проверки производительности трассировки лучей DirectX Raytracing. В отличие от предыдущего, он не гибридный и не использует растеризацию, а только трассировку лучей, поэтому точнее покажет скорость GPU по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке — та же самая, что использовалась в других подтестах 3DMark, небольшая: BVH-структура может поместиться в большой кэш, что может помочь новым видеокартам.
GeForce ощутимо опережает Radeon в этих условиях: выделенные RT-ядра Nvidia выполняют большую часть работы и более универсальны, сохраняя производительность при включении трассировки лучше, чем ядра Ray Accelerator + обычные SIMD-ядра у конкурента. В большинстве игр с применением трассировки лучей нагрузка на RT-блоки меньше, и положение Radeon не так безрадостно, хотя в данном тесте видеокарты Nvidia всё ещё демонстрируют заметное преимущество.
В обзоре RTX 5080 наблюдался необычно низкий результат новой видеокарты, но Nvidia исправила проблему в новых драйверах, и показатели Blackwell улучшились. RTX 5070 почему-то всё равно уступает Super-решению прошлого поколения примерно на 9%, вероятно, тест выполняется на новых GPU не оптимально. Понятно, что сокращенный GB203 ещё быстрее, а единственное решение конкурента как всегда отстаёт, даже флагман AMD прошлого поколения проиграл новинке.
В 2022 году в пакет 3DMark был добавлен новый тест Speed Way с высокой нагрузкой на трассировку лучей, подготовленный к выходу новых поколений графических процессоров Nvidia и AMD. По своей нагрузке на различные блоки GPU тест больше напоминает популярные игры, активно использующие трассировку лучей, что делает его весьма интересным для нас.
Приемлемую частоту кадров в обоих разрешениях обычно демонстрируют лишь топовые видеокарты, GeForce RTX 5070 такому уровню не соответствует. Разница между Radeon и GeForce здесь есть, но она меньше — единственная видеокарта AMD в сегодняшнем сравнении очень близка к рассматриваемой сегодня RTX 5070, что отлично для нее, особенно с учетом того, что в RX 9070 (XT) трассировку ускорили вновь. Новое решение семейства Blackwell, которое мы сегодня рассматриваем, на 28% медленнее RTX 5070 Ti в этом тесте, что нормально, но зато RTX 4070 Super отстает от новинки на 17%, а RTX 4070 — аж на 36%, что приятно радует — скорее всего, новый аппаратный планировщик лучше справляется с распределением работы ALU и RT-ядер.
Рассмотрим полусинтетический бенчмарк Boundary, разработанный на реальном игровом движке. Проект из Китая поддерживает DXR и DLSS. Бенчмарк предъявляет серьезные требования к GPU, активно использует трассировку лучей для сложных отражений с несколькими отскоками, мягких теней и глобального освещения. В тестах Radeon не можем использовать технологию DLSS.
Даже при разрешении Full HD без DLSS комфортно играют только достаточно мощные видеокарты, 4K без масштабирования доступен разве что на топовых устройствах. Новая RTX 5070 в 4K показала менее 25 FPS и уступила RTX 5070 Ti более 38%, что много, но объяснимо — ей меньше памяти. Рассматриваемая модель обошла RTX 4070 Super на пару процентов, а RTX 4070 — на 20%-21%, что мало для смены поколения. Раньше предполагалось, что скорость ограничивается пропускной способностью видеопамяти, но теперь ясно, что это не так, ведь ПСП у Blackwell значительно выше. Показатели единственной сравниваемой видеокарты Radeon немного хуже новинки — в тестах трассировки лучей решения AMD прошлого поколения не конкурируют с Nvidia.
С включением масштабирования разрешения качественным методом DLSS видеокарты Nvidia даже в 4K обеспечили минимально приемлемую частоту кадров. При такой нагрузке DLSS позволяет играть в 4K-разрешении при максимальных настройках в ресурсоемких играх, и RTX 5070 показала 44 FPS, что позволяет довольно комфортно играть. Результаты новинки на 32%-34% хуже, чем у RTX 5070 Ti, зато она обошла оба предыдущих решения с индексом 4070, хотя супер-модель очень близка к ней.
Внимания заслуживает ещё один полуигровой бенчмарк, созданный на базе китайской игры Bright Memory. Стоит отметить, что оба теста демонстрируют схожие результаты и качество изображения, несмотря на разницу тематики. При этом данный бенчмарк более требователен к производительности трассировки лучей. Несмотря на то, что видеокарты AMD не поддерживают его работу, этот тест предназначен исключительно для GeForce RTX.
В данном тестировании RTX 5070 на базе графического процессора GB205 продемонстрировала результаты на 25%-35% ниже, чем RTX 5070 Ti с полной версией GB203, что обусловлено значительной разницей в количестве исполнительных блоков. Новая модель обошла базовую RTX 4070 всего на 15%, а RTX 4070 Super — на 5%-6%, что не является большим показателем для видеокарты нового поколения. Такой результат частично объясняется тем, что в этом тесте важен объем видеопамяти, который у новой модели составляет всего 12 ГБ.
Вычислительные тесты
Поиск бенчмарков с применением OpenCL для современных вычислительных задач продолжается, чтобы включить их в набор синтетических тестов. На данный момент в этом разделе сохранился достаточно старый и не всегда оптимально оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Это кроссплатформенный тест, основанный на LuxRender и использующий OpenCL.
GeForce RTX 5070 имеет чуть больше вычислительных блоков по сравнению с RTX 4070 (Super) и работает на близкой частоте. Неудивительно, что её преимущество небольшое, но объяснима теорией. В среднем из трех тестов разница оказалась выше ожидаемой: RTX 5070 быстрее на 20% и 37% по сравнению с Super-моделью и обычной видеокартой того же уровня поколения RTX 40. Даже топовая видеокарта конкурента уступила новинке в двух из трёх подтестов, и в самом сложном подтесте разница почти полуторакратная!
Проанализируем еще один тест производительности графических процессоров — V-Ray Benchmark — трассировка лучей без использования аппаратного ускорения. Тест основан на рендере V-Ray, демонстрирующем возможности GPU в сложных вычислениях и потенциал новых видеокарт. Для сравнения применяем разные версии бенчмарка, результаты которых выдаются как время рендеринга, так и количество миллионов просчитанных путей за секунду.
Тест продемонстрировал программную трассировку лучей и сравнил новые модели GeForce RTX 5070 и RTX 5070 Ti с RTX 4070 Super, RTX 4070 Ti Super соответственно. Обе новинки оказались на уровне своих предшественниц. Отставание от RTX 5070 Ti составило 14%, что меньше прогнозов и не впечатляет для видеокарты нового поколения. Флагман прошлого поколения Radeon продемонстрировал слабее результат, уступая большинству современных Nvidia, в том числе RTX 4070.
В Cinebench 2024 и OctaneRender 2020.1.5 новая модель не заработала. Возможно, приложения в будущем получат обновления с оптимизацией под серию GeForce RTX 50. Пока пришлось временно заменить их версиями бенчмарка V-Ray с более продвинутыми возможностями. Видеокарты AMD в этих приложениях тоже не работают.
Новая модель GeForce RTX 5070 снова лишь на уровне RTX 4070 Super, что неудивительно — где результаты архитектурных изменений в мультипроцессорах SM? Лишь RTX 4070 проигрывают на 15%, и это всё. Более мощная RTX 5070 Ti превосходит его на 21%, но и это не значительная разница. Пока что результаты V-Ray продолжают нас разочаровывать, особых приростов к решениям RTX 40 не видно. Давайте рассмотрим ещё один вариант — уже с аппаратным ускорением трассировки лучей.
В этом тесте отсутствуют результаты многих видеокарт, поэтому на диаграмме остались только три решения — обычную RTX 4070 в нём не тестировали. Новая модель GeForce RTX 5070 отстала от RTX 5070 Ti с более мощным GB203 всего на 13%-15%, что мало по теории. Модель Super из прошлого поколения с таким же цифровым индексом, как у новинки, заметно медленнее — на 21% при включенном аппаратном ускорении RTX и на 25% в режиме CUDA. Такая разница в приростах повторяется для RTX 5080 с RTX 4080 Super и RTX 5070 Ti с RTX 4070 Ti Super.
Для оценки работы видеопроцессора (GPU) в задачах искусственного интеллекта применяется тестовый набор MLPerf. Это семейство тестов машинного обучения, разработанное учеными из Гарварда, Стэнфорда, Nvidia, Google и других университетов и организаций. MLPerf используется для измерения производительности Large Language Model (LLM) — языковой модели на основе нейронной сети с большим количеством параметров, являющейся ключевой технологией генеративного ИИ. Тесты MLPerf оценивают производительность генерации текста при помощи искусственного интеллекта в ответ на разные входные данные. Используется модель Llama2-7B, и этот бенчмарк измеряет время обработки запроса и получения первого токена в четырех типах тестов, а также количество генерируемых токенов в секунду после этого — то есть стабильную производительность в дальнейшем.
Производительность различных GPU оценивается по объединенной категории, которая представляет собой геометрическое среднее всех подтестов. Nvidia, AMD и Intel сотрудничают в разработке теста: первые две компании используют DirectML, а Intel еще и OpenVINO, с которым Intel Arc демонстрируют более высокие показатели.
Время получения первого токена свидетельствует о скорости реакции ИИ, подобно времени отклика системы. По этому показателю видеокарты Nvidia превосходят даже флагман AMD прошлого поколения — RTX 4070 реагирует в полтора раза быстрее. Разница между RTX 5070 и RTX 5070 Ti составила 22%, новинка опередила RTX 4070 на 23% и соответствующую Super-модель на 10%, что весьма неплохо. RX 7900 XTX почти вдвое медленнее.
Скорость выдачи второго и последующих токенов отличается для RTX 4070 Super и RTX 4070 почти не различаются, а новая RTX 5070 лишь на 11%-12% быстрее их. Новейшая RTX 5070 Ti опережает новинку практически на треть, а представленный в сравнении флагман AMD RX 7900 XTX уже обгоняет RTX 5070 на 11%. Интереснее будет сравнить новую модель Nvidia с Radeon RX 9070 (XT), возможность появится совсем скоро.
Тесты технологий DLSS/XeSS/FSR
В данном разделе изучаем дополнительные тесты, связанные с технологиями повышения производительности. Долгое время это были только технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), затем добавилась технология генерации промежуточных кадров — DLSS 3, а после — DLSS 4. Сначала выделили отдельный тест для технологии DLSS, хотя ранее уже проводились тесты с ее применением в приложениях с трассировкой лучей, посчитали целесообразным сделать и отдельное тестирование. Рассмотрим результаты GPU компании Nvidia в разрешении 4K с включением технологий DLSS разных уровней качества нескольких версий.
В режиме Performance изображение создаётся с меньшим разрешением и затем масштабируется до 4K с дополнением сгенерированных кадров. Без DLSS рендеринг выполняется в полном разрешении, что снижает производительность, выдавая 27—41 кадр в секунду в 4K, недостаточно для комфортной игры. Включив DLSS в «производительном» режиме, частота кадров будет достаточной для всех видеокарт. RTX 5070 в таком режиме на 30% медленнее RTX 5070 Ti и на 7% быстрее RTX 4070 Super — прирост есть, но не впечатляющий.
У Blackwell в случае DLSS есть свой козырь: если в видеокартах архитектуры Ada Lovelace появилась поддержка DLSS 3, которая добавила генерацию одного промежуточного кадра, то в Blackwell их может быть до трёх. Включение генерации промежуточных кадров даёт RTX 5070 весомое преимущество над RTX 4070 Super. Так, включение DLSS 4 при максимуме возможностей по генерации кадров, даёт новинке более чем двукратное преимущество над аналогичной по позиционированию видеокартой семейства RTX 40 — даже в Super-варианте.
При включении технологии DLSS в качественном режиме все три GeForce обеспечивают более 50 FPS, что достаточно для базовой частоты и генерации кадров. Новинка без генерации кадров уступает RTX 5070 Ti приблизительно на 36%, но опережает RTX 4070 Super на 11%, что немного выше результатов в других тестах. Генерация одного дополнительного кадра повышает плавность при небольшом увеличении задержек управления, а добавление двух дополнительных кадров даёт новинке RTX 5070 более чем двукратное преимущество над RTX 4070 Super. Споры о «честности» сгенерированных кадров могут быть, но плавность они улучшают. При наличии монитора с высокой частотой обновления комфортно играть, если количество настоящих кадров с DLSS (без учета генерации) превышает 40—50 FPS.
XeSS — метод повышения производительности с помощью рендеринга в меньшем разрешении и масштабирования до более высокого, аналог DLSS 2.0 от Intel. Он использует искусственный интеллект для восстановления информации в кадре и отличается от DLSS тем, что работает на всех современных видеокартах, хотя не так эффективно, как на решениях Intel. Для тестирования использовался бенчмарк из пакета 3DMark с пониженным разрешением рендеринга.
XeSS может значительно увеличить частоту кадров — до двух раз и более. Благодаря универсальности технология имеет право на существование, так как DLSS, хотя и самая совершенная, работает только на Nvidia, FSR – самая универсальная, но простая, а XeSS хороша и универсальна, но уступает DLSS по качеству и функциональности. Новая GeForce RTX 5070 в этом тесте работает эффективнее решений предыдущего поколения GeForce RTX 40 — разработчики Nvidia, похоже, оптимизировали использование XeSS.
В данном тестировании Radeon RX 7900 XTX по эффективности уступает Nvidia, даже без включения XeSS. Флагман из недавнего прошлого лишь на 8% быстрее RTX 5070, а включение XeSS даёт до 16% преимущества новой видеокарте GeForce. Общее повышение эффективности Blackwell привело к тому, что новинка в этом тесте оказалась более чем на 40% производительнее RTX 4070, и почти на четверть быстрее Super-варианта, хотя в родном разрешении разница была 30% и 11%, соответственно.
Еще один представитель семейства технологий масштабирования рендеринга — FSR 2.0 от AMD. Эта технология последней появилась в списке специализированных подтестов 3DMark. К сожалению, сцены разных технологий масштабирования во всех случаях различаются, поэтому их нельзя напрямую сравнить. Можно только оценить рост производительности, но нужно еще учитывать реальное разрешение рендеринга и разницу в качестве, что затруднит задачу.
FSR — универсальная технология, работающая на разных графических процессорах примерно одинаково. Поэтому в тестах FSR 2.0 особых открытий не наблюдалось. Radeon RX 7900 XTX, как и прежде, менее эффективен по сравнению с решениями Nvidia. Без FSR Radeon RX 7900 XTX был значительно быстрее RTX 5070, но при каждом снижении разрешения производительность Radeon RX 7900 XTX относительно GeForce снижалась — всего лишь до 13%.
Сравнение GeForce RTX 5070 с более производительной моделью из той же серии и предшественницами прошлого показало, что без FSR новинка была на треть медленнее RTX 5070 Ti, на 23% быстрее RTX 4070 и на 4% быстрее Super-модели, что согласуется с теорией. После включения технологии масштабирования FSR разница в скорости осталась примерно такой же — в тестах этой технологии масштабирования ничего необычного не наблюдалось. Переходим к тестированию новой модели архитектуры Blackwell в реальных игровых тестах — это должно быть интереснее и полезнее.
Тестирование: игровые тесты
Конфигурация тестового стенда
Конфигурация тестового стенда
Список инструментов тестирования
В ходе всех игровых тестов применялся максимально высокий уровень качества графики.
- Черный Миф: У Цзин (Игровая Научная лаборатория / Игровая Научная лаборатория)
- Cyberpunk 2077 от Софтклаб и CD Projekt RED, обновление 2.21 (январь 2025 года).
- Сага Сэнуа: Ад в глазах 2 (Ниндзя Теори/Xbox Игры).
- Вызов: Современная война II (Инфинити Вард/Актив вижн) (без трассировки и DLSS/FSR/XeSS!)
- Alan Wake 2 (Remedy/Epic Games)
- «Редкий и Кланк: Разлом Реальности» от Insomniac Games, Sony и Софтклаб.
- Призрак Цусимы: расширенная версия (Разработчики: Sucker Punch Productions, издатель: Sony Interactive)
- Наследие Хогвартса (Avalanche Software/Warner Bros)
- Avatar: Frontiers of Pandora (Ubisoft)
- Atomic Heart (Mundfish/VK)
- Индиана Джонс и Великий круг (Машина игр / Бетезда) (трассировка лучей включена по умолчанию!)
Кратко о производительности в 3D-играх
Перед подробным тестированием представляем общие сведения о производительности семейства исследуемого ускорителя и его конкурентов. Каждое изделие мы оцениваем субъективно по семибалльной шкале.
Игры с классической растеризацией :
GeForce RTX 5070 занимает четвёртую строчку в ряду новых продуктов Nvidia, располагаясь между GeForce RTX 4070 Super и GeForce RTX 4070 Ti. AMD противостоит новому ускорителю Radeon RX 7900 GRE.
В итоге вывод однозначный: играть можно с максимальными графическими настройками в любой разрешающей способности, даже в 4К. Повторимся: это касается традиционных игр без использования трассировки лучей.
Игровые технологии с трассировкой лучей и DLSS/FSR/XeSS :
Включение RT вместе с DLSS (или FSR/XeSS) позволяет играть в игры с высокими настройками графики даже в разрешении 4K, некоторые игры не потребуют даже использования динамического масштабирования. DLSS 4 (c MFG) повысит FPS на приличную величину.
Кроме того, при включении DLSS 4 (с многокадровой генерацией MFG) карта GeForce RTX 5070 может превзойти производительность GeForce RTX 4080, а иногда и GeForce RTX 4080 Super. В десяти тестовых играх четыре уже поддерживают DLSS 4 с MFG, в них показатели GeForce RTX 5070 существенно выше, что повлияло на общий результат. Оценить справедливость такой производительности оставим нашим читателям. На наш взгляд, технология заслуживает пристального внимания и использования.
Результаты тестирования в 3D-играх
Результаты тестов по стандарту без применения аппаратного отслеживания лучей при разрешениях 1920×1080, 2560×1440 и 3840×2160.
Black Myth: Wukong
Cyberpunk 2077 v.2.21
Senua’s Saga: Hellblade II
Call of Duty: Modern Warfare II
Alan Wake 2
Ratchet and Clank: Rift Apart
Ghost of Tsushima Director’s Cut
Hogwarts Legacy
Avatar: Frontiers of Pandora
Atomic Heart
Результаты тестирования с включенной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160.
Black Myth: Wukong, RT+DLSS/FSR/XeSS
Cyberpunk 2077 v.2.21, RT
Cyberpunk 2077 v.2.21, RT + DLSS/FSR
Senua’s Saga: Hellblade II, DLSS/FSR/XeSS
Alan Wake 2, RT
Alan Wake 2, RT + DLSS/FSR
Ratchet and Clank: Rift Apart, RT
«Регнат и Клэнк: Раскол реальностей», RT с поддержкой DLSS/FSR/XeSS
Ghost of Tsushima Director’s Cut, DLSS/FSR/XeSS
Hogwarts Legacy, RT
Hogwarts Legacy, RT + DLSS/FSR/XeSS
Avatar: Frontiers of Pandora, RT
Avatar: Frontiers of Pandora, RT + DLSS/FSR
Atomic Heart, DLSS/XeSS
Indiana Jones and the Great Circle, RT
Индиана Джонс и великое кольцо, RTX с поддержкой DLSS/FSR/XeSS.
Из-за технической ошибки в диаграммах указана неверная единица измерения эффективной пропускной способности памяти для видеокарт — МТ/с, правильное обозначение — ГТ/с.
Рейтинг iXBT.com
Методика расчета рейтингов
Рейтинг ускорителей iXBT.com Показывает сравнительный анализ возможностей видеокарт.
- Вариант рейтинга iXBT.com без включения RT
Рейтинг сформирован на основе всех тестов без применения технологий трассировки лучей. Нормирование рейтинга выполнено с учётом наименее производительного ускорителя из группы карт — Arc A310 (скорость и возможности Arc A310 приняты за 100%). Рейтинги составляются по 30 акселераторам, которые регулярно исследуются в рамках проекта. Лучшая видеокарта месяцаДля анализа отобрано несколько видеокарт, среди которых GeForce RTX 5070 и её аналоги.
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
08 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 1594 | 150 | 106 000 |
09 | Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 ГТ/с | 1593 | 152 | 105 000 |
10 | RX 7900 XT 20 ГБ, 2400—2900 МГц/20 ГТ/с | 1521 | 171 | 89 000 |
11 | Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 ГТ/с | 1520 | 145 | 105 000 |
12 | RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 ГТ/с | 1466 | 158 | 93 000 |
13 | RTX 5070 12 ГБ, 2512—2790 МГц/28 ГТ/с | 1463 | 148 | 99 000 |
14 | RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 ГТ/с | 1323 | 161 | 82 000 |
15 | RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 ГТ/с | 1316 | 171 | 77 000 |
В разрешении 2.5K GeForce RTX 5070 немного уступает GeForce RTX 4070 Ti и на 8% — GeForce RTX 4070 Ti Super, опережая GeForce RTX 4070 Super на 11%, а Radeon RX 7900 GRE — на 10%. От более доступного Radeon RX 7900 XT новинка отстает на 4%. Увеличенные частоты карты Gigabyte позволили ей сравняться с Radeon RX 7900 XT.
В рейтинге учитываются результаты игр без RT и DLSS. GeForce RTX 5070 превзошла GeForce RTX 4070 и оказалась на 11% быстрее, чем GeForce RTX 4070 Super. Новинка показывает хорошие результаты даже в классических играх. Вопрос стоит в высокой розничной цене, которая значительно превышает рекомендованные Nvidia и абсурдно выглядит по сравнению с ценами предыдущего поколения.
- Рейтинг iXBT.com с поддержкой технологий RT, DLSS, FSR и XeSS.
Рейтинг основан на результатах десяти тестов, где применяется технология трассировки лучей совместно с Nvidia DLSS, AMD FSR или Intel XeSS. Нормирование рейтинга выполнено по самым слабым ускорителям в каждой группе — Arc A310.
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг iXBT.com | Рейтинг полезности | Цена, руб. |
---|---|---|---|---|
06 | Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 ГТ/с | 5073 | 483 | 105 000 |
07 | RTX 4080 16 ГБ, 2505—2625 МГц/22,4 ГТ/с | 4911 | 372 | 132 000 |
08 | Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 ГТ/с | 4862 | 463 | 105 000 |
09 | RTX 5070 12 ГБ, 2512—2790 МГц/28 ГТ/с | 4684 | 473 | 99 000 |
10 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 4473 | 422 | 106 000 |
11 | RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 ГТ/с | 4143 | 446 | 93 000 |
12 | RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 ГТ/с | 3765 | 489 | 77 000 |
15 | RX 7900 XT 20 ГБ, 2400—2900 МГц/20 ГТ/с | 3041 | 342 | 89 000 |
16 | RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 ГТ/с | 2603 | 317 | 82 000 |
GeForce RTX 5070 занял второе место в своей группе (уступая GeForce RTX 4080), что связано с поддержкой DLSS 4 с многокадровой генерацией в 4 из 10 тестовых игр. Эта технология позволяет картам поколения GeForce RTX 50 значительно, иногда в разы, опережать предшественников по производительности. При этом пока не выявлено серьезных проблем из-за применения MFG в таких играх.
В разрешении 2.5K GeForce RTX 5070 в среднем опережает GeForce RTX 4070 Ti Super на 4,7%, GeForce RTX 4070 Ti — на 13%, GeForce RTX 4070 Super — на 22%, Radeon RX 7900 XT — на 54%. Прирост производительности по сравнению с лучшими моделями предыдущего поколения значительный. Важно помнить, что этот прирост обусловлен использованием MFG, а не исключительно аппаратными возможностями GeForce RTX 5070.
Благодаря повышенным частотам карта Gigabyte максимально приблизилась к GeForce RTX 4080, а ручной разгон обеспечил ей уверенную лидерство в группе.
Рейтинг полезности
Рейтинг полезности Такой же рейтинг получится при делении показателя предыдущего рейтинга на цены соответствующих ускорителей. на март 2025 года.
- Вариант рейтинга полезности без включения RT
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
13 | RX 7900 XT 20 ГБ, 2400—2900 МГц/20 ГТ/с | 171 | 1521 | 89 000 |
14 | RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 ГТ/с | 171 | 1316 | 77 000 |
15 | RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 ГТ/с | 161 | 1323 | 82 000 |
16 | RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 ГТ/с | 158 | 1466 | 93 000 |
17 | Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 ГТ/с | 152 | 1593 | 105 000 |
18 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 150 | 1594 | 106 000 |
19 | RTX 5070 12 ГБ, 2512—2790 МГц/28 ГТ/с | 148 | 1463 | 99 000 |
21 | Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 ГТ/с | 145 | 1520 | 105 000 |
Цены GeForce RTX 5070, как и у всех ранее выпущенных GeForce RTX 50, завышены. Несмотря на это, многие продвинутые пользователи, потратившие 90-100 тысяч рублей на такую видеокарту, не будут ограничиваться играми без трассировки лучей и/или технологий динамического масштабирования, поэтому обращать внимание на этот рейтинг сейчас, возможно, не имеет большого смысла.
- Рейтинг пользы, включающий RT/DLSS/FSR/XeSS.
Рейтинг приведен для разрешения 2.5K.
№ | Модель ускорителя | Рейтинг полезности | Рейтинг iXBT.com | Цена, руб. |
---|---|---|---|---|
03 | RTX 4070 Super 12 ГБ, 2475—2760 МГц/21 ГТ/с | 489 | 3765 | 77 000 |
04 | Gigabyte RTX 5070 Gaming OC, разгон до 3075 МГц/30 ГТ/с | 483 | 5073 | 105 000 |
06 | RTX 5070 12 ГБ, 2512—2790 МГц/28 ГТ/с | 473 | 4684 | 99 000 |
08 | Gigabyte RTX 5070 Gaming OC, 2625—2865 МГц/28 ГТ/с | 463 | 4862 | 105 000 |
09 | RTX 4070 Ti 12 ГБ, 2610—2805 МГц/21 ГТ/с | 446 | 4143 | 93 000 |
11 | RTX 4070 Ti Super 16 ГБ, 2610—2805 МГц/21 ГТ/с | 422 | 4473 | 106 000 |
19 | RX 7900 XT 20 ГБ, 2400—2900 МГц/20 ГТ/с | 342 | 3041 | 89 000 |
21 | RX 7900 GRE 16 ГБ, 2245—2605 МГц/18 ГТ/с | 317 | 2603 | 82 000 |
Если исходить из рекомендованной Nvidia цены 550 долларов (без налогов), то с учетом НДС и торговой надбавки цена карт могла бы составить около 80 тысяч рублей. Даже при завышенных нынешних ценах GeForce RTX 5070 (100—105 тысяч рублей) новинка опережает соперников в своей ценовой группе, кроме удешевившегося GeForce RTX 4070 Super. Это справедливо только если в играх используется многокадровая генерация MFG в рамках DLSS 4.
Результаты тестирования, рейтинги iXBT.com и оценка пользы доступны в downloadable таблицах Excel. здесь (Zip-архив)Тем, кто заинтересован, можно рассчитать рейтинги, используя актуальные для их местности цены.
Выводы и сравнение энергоэффективности
Ускоритель Nvidia GeForce RTX 5070 (12 ГБ) Новый представитель линейки GeForce RTX 50 — модель четвертого ранга (или третьего, если не учитывать GeForce RTX 5090, предназначенную не для игр).
Многие знакомы с особенностями архитектуры Blackwell, особенно с технологией мультикадровой генерации (MFG). Тесты с DLSS 4, особенно при создании трех или более кадров на основе разных моделей ИИ, демонстрируют, что GeForce RTX 5070 не только превосходит модели предыдущего поколения аналогичного уровня, но и может приблизиться к производительности GeForce RTX 4080.
GeForce RTX 5070 с трудом соответствует традиционной тенденции, когда новые ускорители превосходят карты более высокого уровня прошлого поколения (в данном случае новинка обошла GeForce RTX 4070 Super, но лишь сравнялась с GeForce RTX 4070 Ti), если говорить о классических играх без использования MFG. С использованием MFG GeForce RTX 5070 заметно обгоняет, приближаясь к производительности GeForce RTX 4080.
Nvidia выпустила обновлённое приложение Nvidia App, дающее возможность ускорителям GeForce RTX 50 принудительно активировать MFG в играх с поддержкой DLSS 3. Количество таких игр большое. Список игр, где карты GeForce RTX 50 могут заметно повысить производительность, таким образом, существенно расширился.
Остался вопрос качества графики при использовании DLSS 4, возможных задержек и лагов. Рассмотрим всё это в отдельном материале, который уже готовим. Это сложный аспект, его невозможно исследовать в рамках обычного обзора видеокарты или текущего материала. Пока отметим, что в 4 играх (Alan Wake 2, Senua’s Saga: Hellblade II, Cyberpunk 2077 и Hogwarts Legacy), в которые уже внедрена поддержка технологии DLSS 4, явных нареканий на качество не было — встречались лишь мелкие артефакты. Вероятно, как и с первой версией DLSS, оптимизация под разные игры будет вестись непрерывно, и DLSS 4 можно будет пользоваться полноценно.
Отметим еще раз: доля программной работы при использовании видеокарт (аппаратно-программного комплекса) значительно возросла. Даже если GPU имеет набор аппаратных блоков, не сильно отличающийся от предшественника, но получил средства для активной работы с нейронными сетями, включая программные оптимизации, он может считаться ускорителем нового поколения.
Программный компонент работы ускорителей всё больше занимает главенствующую роль, всё активнее применяет существующие достижения в области ИИ (нейронных сетей), а аппаратная часть видеокарты должна обладать блоками, необходимыми для быстрых вычислений. Понятно, что мы сейчас живём в эпоху, когда видеокарта может превзойти флагманские решения прошлых поколений исключительно за счёт Gen AI.
В классических играх без RT, а также в играх с RT и/или технологиями динамического масштабирования DLSS(1/2/3)/FSR/XeSS новый ускоритель GeForce RTX 5070 располагается между GeForce RTX 4070 Super и GeForce RTX 4070 Ti (почти на уровне второго). В играх с возможностью задействовать DLSS 4 (Multi Frame Generation, MFG) производительность новинки резко возрастает, и она может сравняться с GeForce RTX 4080.
По энергоэффективности GeForce RTX 5070 уступает только GeForce RTX 5070 Ti, занимая вторую строчку.
В предыдущем материале о GeForce RTX 5070 Ti мы уже упоминали: прирост производительности у всех моделей GeForce RTX 50 может показаться многим недостаточным. Энтузиасты ожидали не 15%-30%, а 150%-300% улучшения в новом поколении, и все это за меньшие деньги. Такой скачок роста случался редко, а сейчас вообще стал невозможен. Прогресс процессоров общего назначения серьезно замедлился. Ранее увеличение вычислительной мощности происходило стремительно, и казалось, что этому нет конца. Но тогдашний прогресс объяснялся постоянными улучшениями в микроэлектронном производстве, позволявшими размещать на той же площади кристалла все большее количество транзисторов, работающих на все более высокой тактовой частоте. Со временем физические ограничения кремниевого полупроводникового производства стали сказываться. Пока ученые не найдут новые решения, каждый последующий скачок производительности будет сложнее и дороже. В итоге плотность размещения транзисторов и производительность процессоров сейчас растут очень медленно.
Производители предлагают решение в виде развития аппаратных ускорителей искусственного интеллекта для машинного обучения и нейросетей, применяемых для преодоления проблем технологических процессов, таких как производство графических процессоров. Суть заключается в том, что вместо расчета каждого пикселя можно эффективно использовать имеющуюся информацию из соседних пикселей, формируя реалистичную картинку. Искусственный интеллект уже способен за несколько секунд рисовать реалистичные изображения с нуля по текстовому описанию, а через несколько лет это станет доступно и в динамике. Для создания 3D-графики можно использовать большое количество информации о кадре и объектах, а правильно обученный ИИ способен сделать многое с этой информацией. Nvidia продвигает «нейронный рендеринг» как одну из ключевых особенностей архитектуры Blackwell, новые графические процессоры лучше приспособлены для такой работы, чем предыдущие модели, но ускорение классического рендеринга замедлилось из-за упомянутых проблем.
Тонкие техпроцессы (3 нм и 4 нм) пока ограничены технологическими рамками. Массовое производство больших кристаллов GPU с нужными характеристиками крайне затруднительно. Себестоимость такого производства, вероятно, вырастет до неприемлемых показателей. Пока нет альтернатив для развития, кроме как нейронного рендеринга.
«Честные» кадры, созданные традиционными методами, кажутся более правильными, чем сгенерированные ИИ промежуточными. Это действительно так, и вторые пока невозможны без первых. Но повышает ли комфорт и качество игры возможность ИИ? DLSS уже это делает. Новые модели ИИ подняли качество масштабированных кадров выше, чем у «честных». Генерация кадров добавляет плавности на игровых мониторах с большой частотой обновления. Это уже превосходит линейку GeForce RTX 40.
Конкретная протестированная карта Gigabyte GeForce RTX 5070 Gaming OC 12G (12 ГБ) Модель обладает типовыми размерами 33×13 см, занимая три слота в корпусе ПК. Установленный кулер работает тихо, при этом устройство может потреблять до 250 Вт, а то и немного больше, и имеет один 16-контактный разъем питания 12VHPWR (PCIe 5.0). Карта оснащена четырьмя видеовыходами: одним HDMI 2.1b и тремя DisplayPort 2.1b. Последний обеспечивает пропускную способность до 80 Гбит/с в режиме UHBR 20 и позволяет подключить 8K-монитор с частотой обновления 60 Гц по одному кабелю. Модель имеет фирменную подсветку вентиляторов Halo, которая регулируется и отключается через программное обеспечение.
GeForce RTX 5070 обеспечит комфортную игру на высоких настройках в играх без трассировки лучей и масштабирования до разрешений 2160p. При включенном RT в разрешении 4K рекомендуется использовать DLSS.