Это уже второе обновление нашего обзора карт MTT из Китая и посвящен тестированию их на последней актуальной версии драйверов (на август 2025-го). Поэтому истории самой компании, появления этих карт у нас, а также теоретическая часть спрятаны под спойлеры, ибо там ничего нового нет.
Предыстория
Как мы получали данные карты в 2023 году
Наш интерес к новым, необычным видеокартам из Китая, выпущенным компанией Moore Threads, возник сразу после появления новостей о них. На тот момент (поздняя весна 2023 года) стоимость этих новинок была значительной: порядка 3000 юаней за MTT S80 и 2500 юаней за MTT S70, при ожидаемой производительности, сопоставимой с Nvidia GeForce GTX 1650, а, вероятно, и ниже. Очевидно, даже при курсе в 10 рублей за 1 юань это было дорого, а с ростом курса – и вовсе неоправданно. К моменту написания обзора цена этих карт упала почти в три раза (до 1200 и 900 юаней соответственно), что уже представлялось более приемлемым уровнем. Мы осознавали, что можем переплачивать и, возможно, покупаем продукты, лишенные перспектив, но всё же хотели тщательно изучить, что представляют собой видеокарты, полностью разработанные в Китае (и сам графический процессор, и печатная плата.
Эти видеокарты были доступны только через внутренних китайских поставщиков, поэтому мы обратились за содействием к Владиславу (его контакт указан в конце статьи). Мы решили приобрести сразу две модели, использующие один и тот же графический процессор — S70 и S80. MTT S70 удалось купить в качестве отдельного товара для потребителей.
В то время модели MTT S80 перестали продаваться отдельно и были доступны только в составе готовых систем от китайских производителей. Однако желание обладать этой моделью оказалось сильнее, и системный блок, доставленный через службу доставки СДЭК, все же был получен.
Мы планировали использовать ранее полученную видеокарту Nvidia (которая, как мы думали, пригодится для защиты от непредвиденных ситуаций), и решили, что это именно тот случай, когда она может понадобиться. Однако для установки потребовались шурупы, поэтому мы воспользовались отверткой.
Использование системы водяного охлаждения придавало китайскому персональному компьютеру необычный и привлекательный внешний вид, несмотря на то, что в его конфигурации был установлен процессор Intel Core i5-13400).
Таким образом, завершается рассказ о том, как мы получили видеокарты Moore Threads. Они поступили к нам в июне 2023 года, но первый обзор был опубликован лишь в октябре того же года, и вот почему:
- Несколько обзоров, появившихся летом 2023 года, указывали на нестабильную работу и ограниченный перечень совместимых игр с поддержкой API не выше DirectX 10. Тем не менее, в течение времени ожидания карт разработчики выпустили несколько бета-версий драйверов, что делало ожидание оправданным.
- Для функционирования этим картам необходимы современные материнские платы с интерфейсом PCIe 5.0, поэтому нам пришлось модернизировать тестовый стенд, используемый для оценки тепловых характеристик и уровня шума.
- Обновления драйверов от Moore Threads последовательно повышали производительность и расширяли совместимость с играми.
Компания Moore Threads и ее видеокарты
История появления компании и ее видеокарт
В 2022 году китайская компания Moore Threads выпустила первую отечественную игровую видеокарту MTT S80, а впоследствии и менее мощную S70, использующую тот же чип. Компания была учреждена в 2020 году с целью разработки графического процессора, полностью основанного на китайских технологиях. Менее чем за год Moore Threads привлекла финансирование в несколько раундов, получив значительные инвестиции от Sequoia Capital China, ByteDance, Tencent и других крупных корпораций. Полученные средства были направлены на организацию серийного производства видеокарт и развитие экосистемы Moore Threads. Сообщается, что компания сотрудничает со многими китайскими предприятиями, специализирующимися на графике и вычислительной технике.
В последние годы в Китае наблюдается рост числа молодых компаний, разрабатывающих графические процессоры, однако Moore Threads смогла создать собственный GPU благодаря команде опытных специалистов. В состав команды вошли бывшие сотрудники Nvidia, Microsoft, Intel, ARM и других известных технологических корпораций. Неудивительно, что Moore Threads пользуется поддержкой китайских властей, в частности, известно об адаптации их GPU для взаимодействия с китайскими центральными процессорами и операционными системами. В настоящее время видеокарты Moore Threads совместимы со всеми ключевыми платформами, востребованными в Китае — Intel, AMD, Loongson, Zhaoxin, а также с операционными системами Windows, Kirin, Tongxin, Ubuntu и другими.
В настоящее время китайским компаниям крайне важно как можно скорее разработать собственные чипы для высокопроизводительных вычислений, даже если речь идет не о графических процессорах, которые не являются ключевым фактором в этой области. Недавно власти Соединенных Штатов Америки ввели запрет на поставки определенных моделей самых мощных графических ускорителей западных компаний в Китай, что затронуло как Nvidia, так и AMD. Эпоха безусловного свободного рынка никогда не наступала, и последние санкции лишь подтверждают это. Предсказать, какие еще конфликты и западные ограничения могут возникнуть для Китая в будущем, непросто, но они обоснованно стремятся использовать собственные разработки в критически важных для современной индустрии областях, таких как высокопроизводительные вычисления и искусственный интеллект.
Компания Moore Threads также предприняла первые шаги в этом направлении. Конечно, возникают вопросы касательно самой архитектуры (позже мы обсудим, является ли она китайской), ее совместимости с существующим аппаратным и программным обеспечением, а также возможности собственного производства. Действительно, западные санкции ограничивают возможность для китайских компаний производить микропроцессоры с использованием передовых технологий на тайваньской TSMC, где и выпускаются чипы MTT. К тому же, собственное 7-нанометровое производство на китайских предприятиях SMIC пока, судя по всему, не готово к выпуску больших партий изделий такой высокой сложности. В целом, на данный момент существует ряд проблем, но над их решением активно работается.
Учитывая, что китайским геймерам часто не нужны самые передовые игры, которые требуют мощных видеокарт, видеокарты начального уровня могут пользоваться спросом. Модели MTT S80 и S70 в настоящее время при определенных условиях пригодны для просмотра видео и запуска большинства нетребовательных или старых игр, однако для конкуренции на мировом рынке этого недостаточно. Надеемся, Moore Threads продолжит совершенствовать и оптимизировать драйверы для широкого спектра игр и приложений, а в противном случае рекомендовать их продукты при наличии возможности приобрести карты AMD, Nvidia и Intel довольно затруднительно.
Несмотря на практические сложности, они не препятствуют нашему теоретическому интересу: сегодня мы представляем один из самых захватывающих, но и наиболее сложных обзоров за всю историю сайта. Новые производители графических процессоров появляются крайне редко. Ушли в прошлое 1990-е и 2000-е годы, характеризующиеся стремительным развитием аппаратных ускорителей графики в реальном времени, когда небольшая компания могла разработать видеочип, передать его в производство и привлечь стороннюю фирму для выпуска видеокарт. Видеочипы и видеокарты тех лет значительно проще современных. В настоящее время создать конкурентоспособный, производительный GPU со всеми актуальными требованиями сразу не удалось даже Intel, хотя их попытка стала наиболее успешной за продолжительный срок.
Отсутствие данных о продуктах MTT существенно осложняло подготовку обзора. Мы потратили значительное время на поиски, однако нашлась лишь незначительное количество полезной информации, а по ряду вопросов, таких как применение для майнинга или в задачах искусственного интеллекта, сведения отсутствуют вовсе. Отдельные китайские разработчики разрабатывают программное обеспечение для MTT, но не распространяют информацию об этом в глобальной сети. В доступных обзорах, как правило, лишь отмечается факт существования этих видеокарт и описание их работы, зачастую на китайском языке. Давайте рассмотрим, что нам удалось выяснить.
Графический ускоритель MTT S80 | |
---|---|
Кодовое имя чипа | Chunxiao (SD102AA) |
Технология производства | 7 нм TSMC |
Количество транзисторов | 22 млрд |
Площадь ядра | 416 мм² |
Архитектура | унифицированная, с массивом процессоров для потоковой обработки разных видов данных: вершин, пикселей и др. |
Аппаратная поддержка DirectX | DirectX 11 с поддержкой уровня возможностей Feature Level 11_1 |
Шина памяти | поддержка до 8 независимых 32-битных контроллеров памяти GDDR6 |
Частота графического процессора | до 1800 МГц |
Вычислительные блоки | в составе чипа имеется 4096 арифметико-логических устройств (ALU), предназначенных для выполнения целочисленных и операций с плавающей запятой. Поддерживаются следующие числовые форматы: INT8, INT16, FP16, FP32 и FP64) |
Блоки трассировки лучей | — |
Тензорные ядра | 128 ядер |
Блоки текстурирования | поддерживается 256 блоков текстурной адресации и фильтрации, обеспечивающих работу с компонентами FP16/FP32 и включающих трилинейную и анизотропную фильтрацию для всех форматов текстур |
Блоки растровых операций (ROP) | блок ROP содержит 256 элементов и поддерживает разнообразные методы сглаживания, включая программируемые, а также работу с буфером кадров в форматах FP16 и FP32 |
Поддержка мониторов | поддержка интерфейсов HDMI 2.1 и DisplayPort 1.4a |
Спецификации видеокарты MTT S80 | |
---|---|
Частота ядра максимальная | 1800 МГц |
Количество универсальных процессоров | 4096 |
Количество текстурных блоков | 256 |
Количество блоков блендинга | 256 |
Эффективная частота памяти | 14 ГГц |
Тип памяти | GDDR6 |
Шина памяти | 256 бит |
Объем памяти | 16 ГБ |
Пропускная способность памяти | 448 ГБ/с |
Вычислительная производительность (FP32) | до 14,4 терафлопс |
Теоретическая максимальная скорость закраски | 460 гигапикселей/с |
Теоретическая скорость выборки текстур | 460 гигатекселей/с |
Шина | PCI Express 5.0 x16 |
Разъемы | один HDMI 2.1, три DisplayPort 1.4a |
Энергопотребление | до 255 Вт |
Дополнительное питание | один 8-контактный разъем |
Количество выделенных слотов в системном корпусе | 2,5 |
Рекомендуемая цена на старте продаж | $423 (приблизительно) |
Спецификации видеокарты MTT S70 | |
---|---|
Частота ядра максимальная | 1600 МГц |
Количество универсальных процессоров | 3584 |
Количество текстурных блоков | 224 |
Количество блоков блендинга | 224 |
Эффективная частота памяти | 14 ГГц |
Тип памяти | GDDR6 |
Шина памяти | 224 бит |
Объем памяти | 7 ГБ |
Пропускная способность памяти | 392 ГБ/с |
Вычислительная производительность (FP32) | до 11,2 терафлопс |
Теоретическая максимальная скорость закраски | 358 гигапикселей/с |
Теоретическая скорость выборки текстур | 358 гигатекселей/с |
Шина | PCI Express 4.0 x16 |
Разъемы | один HDMI 2.1, три DisplayPort 1.4a |
Энергопотребление | до 220 Вт |
Дополнительное питание | один 8-контактный разъем |
Количество выделенных слотов в системном корпусе | 2,5 |
Рекомендуемая цена на старте продаж | $352 (приблизительно) |
Обозначения видеокарт Moore Threads, представленных сегодня, соответствуют политике наименования, которую компания приняла более года назад. Более мощная из двух моделей получила индекс S80, а младшая — S70. Ранее в линейке также присутствовала менее производительная модель S60, после чего были выпущены более быстрые видеокарты. Посмотрим, как компания будет именовать свои будущие продукты, но на текущий момент всё выглядит вполне последовательно.
Определить рекомендованные цены и оценить конкуренцию на рынке китайских видеокарт затруднительно. Были объявлены ориентировочные цены для внутреннего рынка, однако они не имеют практического смысла из-за отсутствия этих видеокарт в глобальной поставке и из-за быстрого изменения розничных цен. Когда начались продажи, модель S80 стоила 3000 юаней (примерно $423), в настоящее время ее цена снизилась до 1200 юаней ($164), что все же остается достаточно высокой. Тем не менее, для Китая, с учетом действующих и возможных будущих санкций, это может быть вполне привлекательно, а на другие рынки видеокарты Moore Threads не распространяются.
При определении объема видеопамяти для MTT S80, принимая во внимание ширину шины видеопамяти в 256 бит, рассматривались варианты 8 и 16 ГБ. Поскольку эти видеокарты не предназначены исключительно для игр, компания сочла 8 ГБ недостаточным объемом для старшей модели. В результате было выбрано 16 ГБ, что позволит использовать старшую модель и для решения некоторых вычислительных задач. Однако, учитывая относительно невысокую скорость видеокарт MTT, для игр в любом случае потребуются низкие настройки графики, поэтому увеличение объема видеопамяти не является приоритетной задачей. Для игровой карты уровня S80 вполне достаточно и 8 ГБ (или даже меньше).
В случае модели MTT S70 ситуация представляется более неоднозначной: GPU этой версии был лишен одного 32-битного канала памяти, что привело к уменьшению ширины шины до 224 бита. Это позволяет установить либо 14 ГБ, либо 7 ГБ видеопамяти. Для младшей модели был выбран второй вариант, и единственное, что может вызвать вопросы, – это нестандартный «нечетный» объем. Разработчики игр, как правило, ориентируются на наиболее распространенные конфигурации видеопамяти, поэтому в качестве эталона они, скорее всего, возьмут 8 ГБ, а на карте с 7 ГБ в теории могут возникать неожиданные снижения производительности. Тем не менее, принимая во внимание ранее упомянутый уровень общей производительности, S70 вряд ли столкнется с подобной проблемой.
Поскольку компания Moore Threads разрабатывает все компоненты сама, видеокарты MTT выпускаются только в эталонном дизайне и производятся непосредственно самой компанией. Обе видеокарты, предоставленные нам для тестирования, имеют двухслотовую конструкцию, однако из-за значительной толщины кожуха системы охлаждения они займут примерно 2,5–3 слота в корпусе. В качестве системы охлаждения используются три вентилятора. Обе видеокарты оснащены тремя портами DisplayPort 1.4 и одним портом HDMI 2.1 для подключения дисплеев, что соответствует современным стандартам.
Решения MTT, к сожалению, не могут похвастаться высокой энергоэффективностью и проигрывают конкурентам по этому показателю. Энергопотребление видеокарт Moore Threads достаточно велико: заявленный максимум для S80 составляет 255 Вт, а для S70 — 220 Вт. В связи с этим компания применяет крупную систему охлаждения с тремя вентиляторами. При этом такой уровень потребления энергии позволяет использовать всего один 8-контактный разъем дополнительного питания.
Особенности архитектуры
Детали теории и как работают процессоры MTT
Видеокарты MTT S80 и S70 предназначены для игр и используют различные версии графического процессора Chunxiao, построенного на базе архитектуры Moore Threads Unified System Architecture (MUSA). Производство GPU началось в ноябре 2022 года с использованием 7-нм техпроцесса на предприятиях TSMC. Изначально высказывались предположения о возможности производства на фабриках SMIC, однако введение санкций, запрещающих использование современных технологий для производства микрочипов на тайваньских фабриках для китайских производителей, показало, что видеокарты производились именно на TSMC.
В октябре 2023 года Соединенные Штаты усилили санкции против китайских компаний, запретив производителям графических чипов и ускорителей вычислений использовать услуги контрактных производственных компаний, таких как TSMC. Это означает, что Moore Threads не сможет заказывать производство разработанных ими графических процессоров на фабриках TSMC, подобно тому, как это произошло с компанией Huawei несколько лет назад, которая теперь сотрудничает с китайской компанией SMIC, также находящейся под санкциями США. В результате введения санкций Moore Threads уже объявила о сокращении штата сотрудников, и в будущем, вероятно, ей также придется использовать возможности SMIC.
В настоящее время они располагают чипами, произведенными ранее на TSMC. Количество транзисторов в этом графическом ускорителе весьма значительно: заявлено 22 млрд, что превышает показатель в 17,4 млрд у чипа GA104 (Nvidia), применяемого в GeForce RTX 3060 Ti, RTX 3070 и даже RTX 3070 Ti. Площадь кристалла также производит впечатление: 416 мм², что также несколько больше, чем 392 мм² у GA104. Анализ этих данных позволяет говорить о высокой плотности транзисторов у Chunxiao: 52,9 млн/мм², что существенно выше, чем 44,4 млн/мм² у GA104. Это обусловлено различиями в технологическом процессе: 7 нм TSMC для китайского GPU и 8 нм Samsung для графического процессора Nvidia. По этим характеристикам китайский GPU выглядит весьма конкурентоспособно.
Нам неизвестны все подробности, касающиеся внутреннего строения графического процессора. Установлено, что он содержит 4096 потоковых мультипроцессорных блоков (MUSA), работающих на частоте 1,8 ГГц, что обеспечивает вычислительную мощность до 14,4 терафлопс при выполнении операций с плавающей запятой одинарной точности (FP32). Также заявлено о наличии 128 тензорных ядер, которые обеспечивают производительность матричных вычислений в формате INT8 до 57,6 тераопс. К сожалению, сведения о количестве блоков текстурирования TMU и растеризации ROP в Chunxiao отсутствуют, однако, основываясь на цифрах, представленных на одном из слайдов, в 460 Гпикс/с и 460 Гтекс/с, и зная частоту чипа в 1800 МГц, можно предположить, что этих блоков в графическом ускорителе должно быть по 256 штук, что является значительным показателем по сравнению с другими GPU. Однако, других данных у нас нет. И на основании этих значений могут возникнуть вопросы относительно эффективности и конкурентоспособности китайского продукта — даже с учетом чисто теоретической производительности.
наличие 14,4 терафлопса FP32 для 22 миллиардов транзисторов, в сравнении с 21,8 терафлопса FP32 для 17,4 миллиарда (RTX 3070 Ti) при схожих тактовых частотах чипов, указывает на более высокую эффективность второго, даже если рассматривать только теоретические показатели (0,65 против 1,25 терафлопса на миллиард транзисторов). Даже если учитывать упрощенную версию GA104, используемую в RTX 3060 Ti, этот показатель составит 0,93 терафлопса на миллиард, что говорит о значительно более низком значении MTT S80 – в полтора, а то и в два раза. Судя по заявленным значениям MTT, по скорости текстурирования и филлрейту, более производительным окажется и китайское решение, однако это требует практической проверки. Стоит отметить, что предыдущая модель компании – MTT S60 – оснащалась 2048 потоковыми процессорами MUSA, имела вычислительную производительность до 6 терафлопс и скорость заполнения в 192 гигапикселей в секунду (примерно вдвое хуже по всем параметрам). К слову, MTT S80 базируется на графическом процессоре Chunxiao, а S60 – на предыдущем чипе Sudi, и ключевое отличие нового GPU заключается в наличии четырех вычислительных движков, способных функционировать одновременно.
Видеокарта Moore Threads MTT S80 оснащена 16 ГБ высокопроизводительной памяти GDDR6 с эффективной частотой 14 ГГц. Память соединена с графическим процессором через 256-битную шину, что обеспечивает пропускную способность в 448 ГБ/с – такой же показатель, как у RTX 3060 Ti, например. Отличительной особенностью старшей модели MTT S80 является поддержка интерфейса PCIe 5.0 (с полной шириной x16), что делает ее первой видеокартой в отрасли с таким высокоскоростным интерфейсом. Теоретически, это должно обеспечить максимальную пропускную способность для передачи данных в 128 ГБ/с (в обоих направлениях), что недоступно для других графических процессоров, использующих предыдущую версию PCIe и имеющих вдвое меньшую скорость передачи. Однако, мы не смогли найти тестов для Windows, которые могли бы подтвердить эту скорость на практике, и нам остается полагаться на данные китайских исследователей.
Компания Moore Threads объявила и представила на рынке модель MTT S70 значительно позже. Она основана на том же графическом процессоре, но имеет уменьшенные характеристики по сравнению с полноценным чипом в S80. Видеокарта MTT S70 оснащена 3584 потоковыми процессорами архитектуры MUSA (предположительно, потоковые процессоры группируются по 512 штук, и если отключен один из крупных блоков, то по 256). Тактовая частота видеокарты достигает 1,6 ГГц – это ниже, чем у S80, где она составляет 4096 процессоров и 1,8 ГГц. Таким образом, пиковая вычислительная мощность S70 снизилась на 3,2 терафлопса. По всей видимости, младшая версия графического процессора была упрощена и в части количества блоков текстурирования и заполнения. И это еще не все: MTT S70 потеряла один 32-битный канал памяти и вместо 256-битного предлагает лишь 224-битный интерфейс – это довольно редкое значение среди графических процессоров. Соответственно, на нее можно было установить либо 14 ГБ, либо 7 ГБ видеопамяти, и для младшей модели был выбран второй вариант, что выглядит весьма необычно. Эффективная частота памяти осталась прежней (14 ГГц), поэтому общая пропускная способность составила 392 ГБ/с.
Интересно, что компания решила исключить одну из ключевых характеристик в младшей модели. Видеокарта MTT S70 использует интерфейс PCIe 4.0, тогда как более продвинутая модель S80 поддерживает PCIe 5.0. Однако, это скорее вопрос маркетинга, поскольку PCIe 4.0 решает некоторые проблемы совместимости с материнскими платами, а производительности этой версии интерфейса вполне достаточно для графического процессора такого уровня в играх. Потребление энергии в младшей версии видеокарты не было значительно уменьшено: оно снизилось с 255 Вт до 220 Вт.
Видеокарты MTT обладают значительными возможностями в работе с видео, благодаря встроенному интеллектуальному мультимедийному движку второго поколения. Он поддерживает популярные видеоформаты, включая AV1, H.264, H.265 и VP9, а также обеспечивает аппаратную обработку и воспроизведение видеоданных в формате HDR10. Модели S80 и S70 оснащены четырьмя блоками для обработки мультимедийных данных, что позволяет использовать их в задачах компьютерного зрения, а также для ускорения кодирования и декодирования видеопотоков во всех основных форматах. Аппаратное ускорение декодирования видео поддерживается как минимум для форматов H.264, H.265 (HEVC), VP9 и AV1, включая 10-битные профили с разрешением до 8K или до 32 каналов Full HD при частоте 30 кадров в секунду. В ходе тестирования при воспроизведении видео загрузка графического процессора составляла примерно 50%-60%.
Имея поддержку актуальных интерфейсов, таких как DisplayPort 1.4a и HDMI 2.1, китайские видеокарты позволяют выводить изображение одновременно на четыре дисплея. Они обеспечивают вывод данных с разрешением до 8K (7680×4320) при 30 Гц или 1920×1080 при 360 Гц, а также заявлена поддержка HDR. Кроме того, технология многопоточного транспорта MST позволяет объединять несколько видеосигналов в один поток для подключения нескольких дисплеев к одному порту — до четырех.
Поддержка графических API
Поиск специалистов, занимающихся разработкой графических процессоров, представляет собой сложную задачу, о чем мы еще упомянем. Не менее трудно найти и программистов, способных создавать высокооптимизированные графические драйверы для Windows и DirectX. Их количество ограничено, и большинство из них проживает в западных странах. Даже Intel, которая занимается разработкой GPU на протяжении многих лет, столкнулась с рядом трудностей и неудач при создании графического аппаратного и программного обеспечения, не говоря уже о новичке, появившемся на рынке всего три года назад. Поэтому совершенно не удивительно, что у китайцев возникли… определенные трудности, и это еще мягкая оценка.
Графические процессоры Chunxiao и видеокарты MTT производят хорошее впечатление с точки зрения аппаратной части, однако программное обеспечение требует дальнейшей доработки. Центр управления видеокартой PES предоставляет возможности для обновления драйверов, мониторинга состояния видеокарты, а также некоторые настройки, и в этой области наблюдается достаточно стабильная работа. Заявлена поддержка DirectX, OpenGL, Vulkan, OpenCL и CUDA (с использованием трансляции), но на текущий момент реализован только DirectX 11 с уровнем возможностей 11_1 и OpenGL 3.3, что означает, что GPU совместим лишь со старыми играми и приложениями, и то не всегда безупречно – возникают сложности как с производительностью, так и с качеством изображения.
Китайские разработчики непрерывно совершенствуют драйверы, и новые выпуски нередко демонстрируют значительный скачок в производительности. Однако это связано с эффектом низкой отправной точки, поскольку изначальная скорость была крайне низкой. Moore Threads продолжают работу над оптимизацией программного обеспечения с целью повышения эффективности и улучшения совместимости, но нельзя с уверенностью сказать, что нас ждут существенные и масштабные улучшения. На текущий момент поддержка технологий Direct3D выглядит следующим образом.
Согласно данным диагностического программного обеспечения, общий объем доступной видеопамяти составляет 32 ГБ, включая 16 ГБ локальной памяти и 16 ГБ, выделенных из системной оперативной памяти. Видеокарты данной модели поддерживают функциональность Direct3D до версии 11_1, в то время как современные графические процессоры обычно совместимы с версиями 12_1 и 12_0. По имеющимся сведениям, доступно полноэкранное сглаживание с использованием MSAA 2×, MSAA 4× и MSAA 8×, однако мы не проводили его тестирование, поскольку производительность и без этого недостаточна, а включение подобных ресурсоемких технологий еще больше ее снизило бы. Максимальный размер текстур, который может быть использован, равен 8192×8192 пикселей, в отличие от видеокарт Nvidia, которые поддерживают разрешение 16384×16384).
Графические процессоры MTT не совместимы со следующими возможностями Direct3D 11, в отличие от современных видеокарт Nvidia: текстурирование через AGP, вычисления с плавающей точкой двойной точности, одновременное создание драйвером, списки команд драйвера, сглаживание с помощью сглаживания по краям и мозаичные ресурсы. В то время как функции сглаживания по краям и вычисления с плавающей точкой двойной точности вряд ли будут востребованы на графических процессорах такого уровня, списки команд и мозаичные ресурсы вполне могли бы найти применение — особенно с учетом их дальнейшего развития в Direct3D 12, который, в свою очередь, не поддерживается графическими процессорами MTT. Списки команд позволяют создавать объекты (текстуры, буферы и шейдеры) параллельно в различных потоках и формировать командный буфер в отдельном потоке, что ускоряет загрузку и обработку. Подобные функции используются практически во всех современных приложениях Direct3D 12. Тесселяция также поддерживается не в полном объеме, по крайней мере, на текущий момент.
Среди значимых недостатков отсутствует поддержка функции GPU-планировщика с аппаратным ускорением, известной как Hardware Scheduling, представленной в обновлении Windows 10 в мае 2020 года. Благодаря аппаратному ускорению планирования достигается более эффективное распределение ресурсов между приложениями; при наличии поддержки на уровне аппаратного и программного обеспечения, значительную часть планирования можно перенести на графический процессор, что, как правило, работает быстрее. Тем не менее, операционная система по-прежнему определяет приоритетность приложений при распределении ресурсов.
Лицензирование или собственная архитектура?
Наиболее любопытный вопрос заключается в том, как китайским специалистам удалось за сравнительно короткий срок создать с нуля уникальную графическую архитектуру, несмотря на ее недостатки. Небольшое количество компаний в мире способны разработать собственные ядра графических процессоров, поскольку для этого требуется использование множества технологий и патентов, принадлежащих не только китайским, но и многим западным организациям. Однако, не всегда требуется самостоятельная разработка вообще всё, в случае необходимости можно использовать и разработки, принадлежащие другим лицам, предварительно согласовав это с их владельцами.
Мы не единственные, кто обратился к этому вопросу, и хотя однозначных подтверждений пока нет, совокупность признаков указывает на значительную вероятность того, что Moore Threads приобрела лицензию на какую-либо архитектуру у Imagination Technologies, компании, известной по PowerVR Kyro, использовавшемуся в настольных компьютерах много лет назад, и графическим ядрам PowerVR, которые лежат в основе некоторых смартфонов и планшетов – стоит отметить, что ранее их графические решения применяла даже Apple. Imagination Technologies обладает более чем тридцатилетним опытом разработки графических процессоров PowerVR и является одним из первопроходцев в области аппаратного ускорения 3D-графики. Компания известна благодаря уникальной архитектуре отложенного рендеринга, основанной на тайлах (tile-based deferred rendering — TBDR), созданной еще в 90-х годах, а их графические ядра для мобильных устройств включают поддержку трассировки лучей. В смартфонах и планшетах эти мобильные решения демонстрируют хорошую производительность и энергоэффективность.
Портфолио графических процессоров компании Imagination отличается широтой охвата, их GPU демонстрируют отличную масштабируемость и предлагают решения с различным уровнем производительности. Привлекает внимание и недавний выпуск IMG DXD – новых высокопроизводительных графических ядер с поддержкой DirectX, доступных для лицензирования другим компаниям. Стоит отметить, что данная архитектура является эволюцией уже известной архитектуры отложенного рендеринга на основе тайлов PowerVR, которая применялась как в настольных решениях, так и на рынке мобильных устройств, где критически важна высокая энергоэффективность. Новые ядра IMG DXD обеспечивают вдвое большую производительность на ядро по сравнению с предыдущими решениями IMG BXT. Среди основных факторов, способствующих повышению производительности, – удвоенная скорость вычислений FP16, динамически изменяемая скорость затенения, позволяющая увеличивать производительность без потери качества изображения, текстурирование с удвоенной скоростью, поддержка текстурного сжатия ASTC HDR для снижения требований к пропускной способности памяти, а также встроенное ядро RISC-V для управления графическим процессором.
Двухъядерный чип IMG DXD обладает вычислительной мощностью до 5 терафлопс для операций в формате FP32 (скорость работы с FP16 вдвое выше, а с DOT8 – вчетверо), а также обеспечивает скорость текстурирования 144 гигатекселей в секунду, что должно быть достаточно для пользователей с невысокими требованиями к графике. В практических задачах пиковая производительность IMG DXD на 40–60% превышает аналогичную конфигурацию IMG BXT. Наиболее важным для нас является тот факт, что баланс между вычислительной мощностью, скоростью текстурирования и пропускной способностью у IMG DXD и других продуктов компании в целом сопоставим с характеристиками, представленными Moore Threads, что указывает на возможную схожесть лицензионной базы и использования технологий Imagination.
Такая ситуация вполне объяснима: китайский рынок демонстрирует повышенный интерес к мощным и экономичным видеокартам, что обусловлено усилением западных ограничений и запретов, и предложение Imagination может пользоваться значительным спросом. Полная аппаратная поддержка DirectX (даже версии 11) и современных игр в формате IMG DXD представляет собой ценный актив: пример Moore Threads наглядно показывает, что создание GPU таким способом занимает меньше двух лет, хотя и предполагает использование готовых архитектурных решений. В настоящее время китайские компании, стремящиеся к успеху, ускоряют разработку собственной продукции, и подобная поддержка от опытного партнера, такого как Imagination, будет для них весьма полезной.
Аппаратная поддержка DirectX у IMG DXD пока ограничена уровнем возможностей 11.0, что даже ниже, чем у MTT, однако этого достаточно для запуска множества известных игр и приложений. Полная аппаратная поддержка DirectX критически важна для настольных графических процессоров, и поддержка IMG DXD уровня возможностей Direct3D 11.0 – это лишь первый шаг. По словам директора компании, специалисты планируют и далее совершенствовать функциональность своих разработок. Помимо этого, их решения совместимы с другими API: Vulkan 1.3, OpenGL 4.6 (через Zink), OpenGL ES 3.2 и OpenCL 3.0. Очевидно, что в этом плане возможности Moore Threads и самого современного решения Imagination, доступного для лицензирования, достаточно сопоставимы.
Долгое время ходили слухи о применении архитектуры PowerVR в решениях MTT, и вероятно, другие китайские компании последуют их примеру, заключив соглашения, например, с Imagination Technologies. Для Китая это станет лишь частичным решением ключевой проблемы, поскольку патенты на большую часть технологий графических процессоров по-прежнему будут принадлежать западным компаниям. Однако использование готовых разработанных решений позволяет избежать значительной части работы по созданию всей структуры графического процессора, и разработку можно будет завершить всего за полтора года. На текущем этапе развития китайской микроэлектроники это выглядит как вполне оправданный подход. Основные патенты в сфере графических процессоров, особенно те, что связаны с графикой, а не с вычислениями, принадлежат таким производителям, как Nvidia, Intel и AMD, и китайским компаниям не удастся их обойти.
С позиции бизнеса, как и в мобильных системах-на-чипе, вполне целесообразно применять готовые ядра ARM, а не создавать их самостоятельно. Небольшое число производителей микроконтроллеров располагают достаточными ресурсами и компетенциями для разработки собственных ядер, и использование чужих решений – это наиболее оперативный и экономичный способ. Однако, с точки зрения импортозамещения, применение ядер графических ускорителей и архитектур, созданных зарубежными (западными) компаниями, не стимулирует развитие отечественных технологий. В этой ситуации существует значительный риск, обусловленный вероятностью ужесточения санкций со стороны западных государств.
В Китае еще в 90-х годах велись работы над процессорами, аналогичными Intel 80486, однако после того, как были сняты ограничения на импорт процессоров производства Intel, собственные разработки массовых решений были приостановлены. Ему казалось китайцам, и не только им, что нет необходимости тратить ресурсы, если можно просто приобрести готовые решения. Если бы они продолжили работу над собственными процессорами с того времени, возможно, у них появился бы конкурент для Intel и Nvidia уже несколько лет назад. В настоящее время всё больше китайских компаний вынуждены проводить собственные исследования и создавать технологии в сфере графических ускорителей и вычислений, связанных с искусственным интеллектом.
Учитывая, что китайские стартапы, занимающиеся разработкой и производством графических процессоров, не располагают собственными проектами графических процессоров, перспективным решением является приобретение лицензии на использование графических ядер у компании Imagination Technologies. Пока существуют финансовые возможности и отсутствуют ограничения, данный подход представляется целесообразным. Альтернативным вариантом является применение специализированного ядра Nvidia с открытым исходным кодом NVDLA для задач, связанных с искусственным интеллектом. Этот код доступен для модификации, что позволяет добиться высокой производительности, однако он не обеспечивает графических функций.
В настоящее время в Китае действует несколько десятков новых компаний, специализирующихся на графических и вычислительных процессорах, и большинство из них применяют ядра Imagination или NVDLA. Развитие собственных исследований и разработок все большим количеством предприятий может предоставить китайской индустрии графических процессоров дополнительные перспективы. Мы будем внимательно отслеживать эти компании и постараемся проводить их изучение.
Текущее положение дел и перспективы
Давайте обсудим практические результаты, достигнутые видеокартами MTT в исследованиях разных специалистов. Согласно тесту Fillrate Tester, скорость заполнения MTT S80 составляет 188 Гпикс/с, что является весьма впечатляющим показателем. Для сравнения, у RTX 3060 этот параметр не превышает 90 Гпикс/с, а пиковая скорость заполнения MTT S80 сопоставима с характеристиками RTX 3080 Ti. По всей видимости, Moore Threads предоставила достоверные сведения о пиковой теоретической скорости заполнения, хотя она и существенно отличается от реальной производительности. Результаты теста скорости текстурирования в бенчмарке 3DMark 06 демонстрируют более 170 Гтекс/с, что уже ближе к скорости заполнения текстур у аналогичных видеокарт, например, RTX 3060 обеспечивает в этом тесте около 200 ГТекс/с.
Из-за ограниченного количества тестов, совместимых с китайскими видеокартами под управлением Windows, возникли определенные трудности. В частности, не удалось запустить тесты, основанные на OpenCL. Тем не менее, согласно другим исследованиям, максимальная скорость вычислений с плавающей запятой одинарной точности FP32 для MTT S80 составляет около 14 терафлопс, что близко к ее теоретическому значению. Тестирование карт MTT на пропускную способность PCIe в Windows также оказалось невозможным, хотя нас и интересует возможность проверки поддержки PCIe 5.0 версии S80. Китайские исследователи, используя OpenCL в Ubuntu, достигли скорости выгрузки данных в 28 Гбит/с и скорости загрузки – 32 Гбит/с. Эти показатели, хоть и не соответствуют теоретическим, значительно превосходят возможности большинства других видеокарт, поддерживающих лишь PCIe 4.0.
Согласно исследованиям китайских ученых, производительность декодирования видеороликов с разрешением 1080p и кодеком VP9 в многопоточном режиме достигает общей частоты кадров, превышающей 1200 кадров в секунду, что означает одновременную обработку десяти каналов с частотой более 120 FPS на каждый. В части кодирования, десять потоков с разрешением 1080p сжимаются в формат H.265 со скоростью более 180 кадров в секунду. Таким образом, аппаратные возможности кодирования и декодирования в MTT достаточно высоки, однако существует определенная проблема: отсутствие адаптации популярного программного обеспечения для работы с этими решениями. Moore Threads ведет разработку программного обеспечения для редактирования видеоданных, но эта работа пока находится на начальной стадии.
При оценке 3D-производительности, исходя из результатов синтетических тестов и теоретических данных, топовая модель MTT S80 должна была бы демонстрировать уровень, сопоставимый с GeForce RTX 3060. Однако, учитывая, что драйвер всё ещё далёк от идеальной оптимизации, даже в играх, поддерживающих китайские GPU, производительность не соответствует более слабым решениям. Это указывает на заметное расхождение между заявленными теоретическими характеристиками MTT S80/S70 и их фактическими результатами в реальных тестах и игровых приложениях. Потенциал аппаратной части MTT S80 и S70 пока не реализован, и, вероятно, это связано с проблемами в работе драйверов.
Видеокарты MTT демонстрируют наилучшую производительность в приложениях, работающих на DirectX 9, что указывает на используемую архитектуру, для которой длительное время не проводились оптимизации и не разрабатывались новые драйверы. Изначально драйверы для китайских графических процессоров поддерживали только DX9, затем появилась совместимость с DX10 и некоторыми играми DX11, перечень которых постоянно увеличивался. Это говорит о заметных усилиях и прогрессе в оптимизации драйверов, однако китайским производителям предстоит еще большая работа. Количество поддерживаемых игр увеличивается, но это преимущественно старые проекты, в то время как новые игры практически все используют Direct3D 12, который пока недоступен для китайских видеокарт.
С точки зрения геймеров, видеокарты MTT – это своего рода дебют, они показывают признаки незрелости. Их программное обеспечение постоянно улучшается и дорабатывается. Драйверы не совместимы со многими распространенными графическими интерфейсами, такими как DirectX. Применение некоторых из поддерживаемых функций приводит к заметным проблемам с производительностью и качеством изображения. Существует мнение, что в архитектуре и текущей реализации графического процессора присутствует ряд недочетов в аппаратной части, которые драйверы пытаются компенсировать программными методами, что негативно сказывается на быстродействии системы. Желательно было бы увидеть улучшения в последующих моделях GPU, однако на данный момент нет информации, указывающей на это – Moore Threads придерживается политики конфиденциальности, а теперь к этому добавились и санкционные ограничения, которые могут повлиять на планы компании.
Хотя дальнейшая работа над архитектурой потенциально могла бы устранить значительную часть существующих проблем, сейчас мы не можем гарантировать, что это произойдет. Существует мнение, что компания, возможно, преждевременно сделала заявления о пригодности своих видеокарт для игр и их конкурентоспособности. Решения подобного рода на этапе разработки чаще всего целесообразны для конкретных, узкоспециализированных задач, таких как создание вычислительного программного обеспечения, требующего исключительно китайского аппаратного и программного обеспечения. Для этих целей MTT S80 и S70 будут вполне подходящими, однако более эффективными окажутся специализированные ускорители вычислений, использующие тот же графический процессор. Но поскольку S80 и S70 позиционируются как игровые решения, в этой роли они не демонстрируют выдающихся результатов.
Даже флагманская модель S80 по производительности сопоставима лишь с GeForce GTX 1050 Ti, в оптимальном случае — GTX 1650. Это очень скромный показатель с учетом современных стандартов. При этом, учитывая сложность чипа Chunxiao, решения, созданные на его основе, должны были бы конкурировать как минимум с RTX 3060 Ti, чтобы достичь успеха на рынке. Однако многие даже не самые новые игры работают с проблемами или не запускаются на MTT из-за несовершенства драйверов и API. Поэтому S80 и S70 – игровые видеокарты для очень узкой группы энтузиастов, и на практике их использование представляется нецелесообразным даже для китайского рынка, пока на него не запретили поставки видеокарт Nvidia, AMD и Intel. Особенно если учесть не самые скромные цены на видеокарты MTT, которые изначально достигали примерно $300 на внутреннем китайском рынке – в результате та же GTX 1050 Ti была и производительнее, и доступнее.
Видеокарты MTT демонстрируют впечатляющие теоретические характеристики производительности в задачах вычислений и текстурирования, а также высокую скорость заполнения. Конкурентоспособный техпроцесс и энергопотребление также заслуживают внимания. Установленная память GDDR6 обладает значительной пропускной способностью, и стоит отметить поддержку PCIe 5.0 – зачем китайским производителям реализовывать все эти технологии для видеокарты, сопоставимой по производительности с GTX 1050 Ti? По всей видимости, видеокарты MTT обладают более широкими аппаратными возможностями, чем мы наблюдаем на практике. Сложный графический процессор с большим количеством исполнительных блоков, высокой частотой, интерфейсом PCIe 5.0 и 16 ГБ GDDR6-памяти с 256-битной шиной не должен работать со скоростью устаревшей видеокарты с 4 ГБ медленной памяти, подключенной по 64-битной шине, и потребляя всего 75 Вт.
Оптимистичные ожидания могут быть связаны с тем, что компании Intel тоже приходилось сталкиваться с трудностями при выходе на рынок видеокарт Arc, особенно на начальном этапе. Первые модели не поддерживали множество игр и демонстрировали производительность, уступающую ожиданиям, однако затем последовало заметное улучшение производительности и драйверов за относительно короткий срок. Учитывая масштабный опыт Intel в разработке и производстве графических ядер, включая интегрированные в процессоры, которые требуют высокой энергоэффективности, существуют основания полагать, что игровая производительность и совместимость MTT S80 и S70 также значительно улучшатся и достигнут, например, уровня Radeon RX 5700, при условии оперативной доработки драйверов. Важно обеспечить не только производительность, но и поддержку актуальных версий DirectX, OpenGL и OpenCL.
Видеокарты MTT, вероятно, более эффективны не для игровых задач, а для вычислительных приложений, таких как работа с нейронными сетями. Согласно теоретическим предположениям, архитектура MUSA и комплексный программный стек, разработанный компанией, предоставляют разработчикам необходимых инструментов и позволяют адаптировать существующие программы для работы на видеокартах MTT, поддерживающих PyTorch, TensorFlow, PaddlePaddle, OneFlow и другие платформы глубокого обучения. В состав программного стека MUSA входят модули для рендеринга, мультимедийной обработки, задач искусственного интеллекта, физического моделирования и общих вычислений.
По предположениям, графические процессоры MTT должны демонстрировать достойную производительность при решении подобных задач, поскольку их максимальная вычислительная мощность в операциях с плавающей запятой одинарной точности и в 8-битном формате INT8 достаточно велика. Имеются сведения о том, что решения MTT хорошо совместимы с MONAI – платформой искусственного интеллекта с открытым исходным кодом, применяемой в медицинских исследованиях. Кроме того, китайские разработчики подтверждают высокую производительность в OpenCL под Ubuntu. Однако, поскольку мы полагаемся исключительно на публичные тесты и не проводим собственные вычисления, мы не имеем возможности это проверить.
Moore Threads разработала важную технологию под названием CUDA on MUSA. По ее названию можно предположить, что она предназначена для облегчения перехода пользователей CUDA с видеокарт Nvidia на MTT путем адаптации CUDA-кода для решений Moore Threads (вероятно, OpenCL). Сложность переноса исходного кода CUDA на графические процессоры Moore Threads неизвестна, однако, согласно заявлению компании, этот процесс должен быть относительно простым и включать в себя лишь портирование и перекомпиляцию. Проверить это на практике мы не имеем возможности.
Теперь перейдем к практическому рассмотрению видеокарт Moore Threads MTT S80 и S70, что мы можем проверить и чем регулярно занимаемся.
Особенности карт Moore Threads MTT S80 (16 ГБ) и MTT S70 (7 ГБ)
Каким образом организованы видеокарты MTT и каковы их температурные и акустические параметры
Компания Moore Threads Technology (торговая марка MTT) была основана в 2020 году в Китайской Народной Республике. Ее штаб-квартира расположена в Пекине. Изначально компания создавалась как стартап, занимающийся разработкой графических процессоров и видеокарт. Формальным руководителем является бывший вице-президент и глава офиса Nvidia в КНР Чжан Цзяньчжун. За три года своего существования стартап получил значительную государственную поддержку со стороны правительства КНР, что позволило ему уже через год объявить о первой успешной разработке собственного GPU. На его основе были выпущены первые продукты компании, предназначенные для вычислительных задач, в рамках единой концепции создания «метакомпьютеров» для обработки данных, направленной на оцифровку физического мира и физикализацию цифрового. Была разработана единая системная архитектура MUSA (MT Unified System Architecture). Информация о численности персонала не разглашается.
Объекты исследования: в линейке ускорителей графики представлены модели MTT S80 с объемом памяти 16 ГБ и 256-битной шиной GDDR6, а также MTT S70 с 7 ГБ памяти и 224-битной шиной GDDR6.
Внешне карты совершенно одинаковы.
Moore Threads MTT S80 с 16 ГБ GDDR6 памятью шириной 256 бит / MTT S70 с 7 ГБ GDDR6 памятью шириной 224 бита | ||
---|---|---|
Параметр | S80 | S70 |
GPU | Chunxiao | |
Интерфейс | PCI Express x16 5.0 | PCI Express x 16 4.0 |
Частота работы GPU (ROPs), МГц | 1800 | 1600 |
Эффективная физическая частота памяти, МГц | 1750 (14000) | 1750 (14000) |
Ширина шины обмена с памятью, бит | 256 | 224 |
Число вычислительных блоков в GPU | 64 | 56 |
Число операций (ALU/CUDA) в блоке | 64 | |
Суммарное количество блоков ALU/CUDA | 4096 | 3584 |
Число блоков текстурирования (BLF/TLF/ANIS) | 152 | 148 |
Число блоков растеризации (ROP) | 80 | |
Число блоков Ray Tracing | — | |
Число тензорных блоков | 128 | 114 |
Размеры, мм | 285×110×50 | |
Число слотов на материнской плате, необходимых для установки видеокарты | 3 | |
Цвет текстолита | черный | |
Энергопотребление пиковое в 3D, Вт | 170 | 152 |
Энергопотребление в режиме 2D, Вт | 150 | 141 |
Энергопотребление в режиме «сна», Вт | — | — |
Уровень шума в 3D (максимальная нагрузка), дБА | 27,6 | 27,4 |
Уровень шума в 2D (просмотр видео), дБА | 22,0 | 22,0 |
Уровень шума в 2D (в простое), дБА | 22,0 | 22,0 |
Видеовыходы | 1×HDMI 2.1, 3×DisplayPort 1.4a | |
Поддержка многопроцессорной работы | нет | |
Предельное число устройств отображения, поддерживающих одновременный вывод изображения | 4 | 4 |
Питание: 8-контактные разъемы PCIe | 0 | 1 |
Питание: 8-контактные разъемы EPS12V | 1 | 0 |
Питание: 16-контактные разъемы | 0 | 0 |
Вес карты с комплектом поставки (брутто), кг | — | 1,3 |
Вес карты чистый (нетто), кг | 1,0 | 1,0 |
Максимальное разрешение/частота, DisplayPort | 3840×2160@144 Гц, 7680×4320@60 Гц | |
Максимальное разрешение/частота, HDMI | 3840×2160@144 Гц, 7680×4320@60 Гц | |
Ориентировочная стоимость карт | 18 тысяч рублей | 14 тысяч рублей |
Память
На карте MTT S80 установлено 16 ГБ памяти GDDR6 SDRAM, состоящей из восьми чипов объемом по 16 Гбит, расположенных на лицевой стороне печатной платы.
Видеокарта MTT S70 оснащена 7 ГБ памяти GDDR6 SDRAM, которая расположена на семи микросхемах по 8 Гбит на передней стороне печатной платы.
Микросхемы памяти производства Samsung имеют номинальную рабочую частоту 2000 (16000) МГц.
Характеристики карт и их сопоставление
На обеих картах используется идентичная печатная плата. Различия заключаются в емкости микросхем памяти и в том, что в S70 отсутствует одна микросхема. Это привело к уменьшению объема памяти до 7 ГБ и снижению ширины шины памяти до 224 бит.
Модель MTT S80 оснащена чипом SD102AA-500, дата его производства не установлена.
Модель MTT S70 оснащена чипом SD102AA-400, дата его выпуска не установлена.
Различные маркировки производства на чипах позволяют сделать вывод о том, что кристаллы изготавливались на разных предприятиях.
На обеих картах в общей сложности 8 фаз питания (6 и 2).
Схема питания ядра выделена зеленым цветом, память — красным.
два ШИМ-контроллера DRV8305 (Texas Instruments), способные управлять максимум 3 фазами питания ядра, расположены на лицевой стороне карты. Каждый из них отвечает за 6 фаз питания.
управление питанием микросхем памяти осуществляется третьим ШИМ-контроллером, который идентичен по своей структуре.
Для питания процессора и микросхем памяти применяются транзисторные сборки DrMOS, а именно AOZ5311 от Alpha&Omega Semi, способные выдерживать ток до 55 А.
Для контроля (мониторинга) напряжений и температуры предусмотрен контроллер от компании Texas Instruments).
Подсветка присутствует на картах, однако она имеет фиксированный цвет и не регулируется, поскольку отсутствует соответствующий контроллер.
Оба устройства используют контроллер Realtek RTD2175, отвечающий за преобразование сигнала DisplayPort в HDMI 2.1 (что необходимо для функционирования единственного видеовыхода такого типа).
Энергопотребление карт в тестах доходило до 170 Вт у MTT S80 и до 152 Вт у MTT S70 (что примерно соответствует их заявленному максимальному потреблению с учетом того, что во время тестов мы видели стабильно низкую загруженность GPU, далекую от 100%).
Электропитание к обоим устройствам подается через боковую панель. В MTT S70 используется стандартный 8-контактный разъем PCIe 2.0, в то время как в MTT S80 – 8-контактный разъем EPS12V, который обычно применяется на материнских платах для питания процессора).
Для материнской платы MTT S80 в комплекте идет адаптер питания EPS12V, подключаемый к двум разъемам PCIe с 8 контактами. Обычно блоки питания имеют два таких разъема EPS12V, которые часто используются одновременно).
Для предотвращения путаницы разъемы питания на картах имеют соответствующие наклейки. Однако, поскольку MTT S80 был получен как часть готового компьютера, с уже подключенным разъемом питания и переходником, на ней наклеек не оказалось.
Размеры карт соответствуют общепринятым стандартам: их толщина равна 5 см, что означает занятие почти трех слотов в корпусе компьютера (производитель официально указывает их как двухслотовые).
Необходимо также учитывать, что обе карты оснащены стандартными видеовыходами: один порт HDMI 2.1 и три порта DisplayPort 1.4a.
Работа с картами осуществляется посредством фирменной утилиты MTT PES (Perfect Experience System). PES предоставляет возможность мониторинга и позволяет управлять выводом графики на несколько дисплеев. Возможность регулировки частот GPU и режимов работы отсутствует. Необходимо включить в настройках автоматическое отслеживание обновлений драйверов, поскольку только часть версий доступна на сайте в виде отдельных пакетов, остальные скачиваются через PES в виде обновлений.
Семья MTT освоила FurMark 2, но HWinfo продолжает предоставлять ограниченные сведения.
Нагрев и охлаждение
Сердцем системы охлаждения выступает довольно крупный двухсекционный никелированный радиатор с пластинами, в котором тепло распределяется по ребрам с помощью тепловых трубок.
Крупные медные пластины соединяются с трубками методом пайки. Для охлаждения микросхем памяти и преобразователей питания VRM используется этот же массивный радиатор посредством термопрокладок).
Задняя пластина выполняет защитную функцию для печатной платы, повышает прочность конструкции и способствует охлаждению силовых компонентов схемы питания графического процессора. Она плотно прилегает к обратной стороне текстолита посредством термопрокладки).
Над радиатором размещен кожух, в котором расположены три вентилятора: два боковых диаметром 100 мм и один центральный диаметром 85 мм).
Вентиляторы работают постоянно, независимо от рабочей нагрузки.
Мониторинг температурного режима
MTT S80
В ходе двухчасового тестирования при пиковой нагрузке температура ядра не поднялась выше 52 градуса, что свидетельствует об эффективной системе охлаждения. Потребляемая мощность видеокарты достигала 170 Вт.
Максимальная температура наблюдается в области графического процессора и разъема PCIe.
MTT S70
В ходе двухчасового тестирования при максимальной нагрузке температура ядра не поднялась выше 46 градусов, что свидетельствует о хороших показателях. Потребление энергии видеокарты достигало 152 Вт.
Шум
Для определения уровня шума необходимо, чтобы помещение было звукоизолировано и имело пониженные отражающие свойства. Системный блок, используемый для оценки шумности видеокарт, не оснащен вентиляторами и не создает механических шумов. Уровень фонового шума, составляющий 18 дБА, отражает шумность помещения и самого шумомера. Измерения производятся на расстоянии полметра от видеокарты, на уровне системы охлаждения.
Режимы измерения:
- В режиме ожидания в 2D-среде были запущены интернет-браузер с открытым сайтом iXBT.com, приложение Microsoft Word и несколько интернет-мессенджеров
- Для просмотра фильмов в двухмерном режиме применяется SmoothVideo Project (SVP), обеспечивающий аппаратное декодирование с добавлением промежуточных кадров
- Для работы в трехмерном режиме с максимальной нагрузкой на видеокарту применяется тест FurMark
Определение уровней шума производится по следующей шкале:
- менее 20 дБА: условно бесшумно
- от 20 до 25 дБА: очень тихо
- от 25 до 30 дБА: тихо
- от 30 до 35 дБА: отчетливо слышно
- от 35 до 40 дБА: громко, но терпимо
- выше 40 дБА: очень громко
MTT S80
При бездействии температура оставалась на уровне не более 24 °C, вращение вентиляторов составляло 1100 оборотов в минуту, а шум не превышал 22 дБА.
Во время просмотра фильма с использованием аппаратного декодирования никаких изменений не наблюдалось.
При пиковой нагрузке в трехмерных приложениях температура ядра достигала 52 °C. Вентиляторы в этом случае вращались со скоростью 1846 оборотов в минуту, а уровень шума увеличивался до 27,6 дБА, что можно считать тихим. Аудиозапись шума — здесь.
Спектрограмма шума:
MTT S70
При бездействии в двухмерном пространстве температура не превышала 22 °C, вентиляторы функционировали со скоростью 1000 оборотов в минуту, а уровень шума составлял 22 дБА.
Во время просмотра фильма с использованием аппаратного декодирования не было зафиксировано никаких изменений.
При максимальной нагрузке в трехмерных приложениях температура ядра достигала 46 °C. Вентиляторы в этом случае вращались со скоростью 1828 оборотов в минуту, а уровень шума достигал 27,4 дБА, что можно считать тихим. Аудиозапись шума — здесь.
Спектрограмма шума:
Подсветка
Оба устройства оснащены однородной оранжевой подсветкой, не подлежащей регулировке и отключению, которая располагается по окружности центрального вентилятора. Аналогичным образом подсвечен вырез, имитирующий логотип компании, на задней панели.
Комплект поставки и упаковка
MTT S70
Помимо стандартного руководства пользователя и гарантийного талона, которые содержат информацию на китайском языке, в комплект поставки не включено никаких других материалов.
MTT S80
Мы уже сообщали, что данная карта была получена вместе с системным блоком, поэтому в комплекте с ней не было ничего, кроме адаптера питания. В качестве приятного дополнения, отдельно был отправлен большой фирменный коврик для мыши Moore Threads.
Тестирование: синтетические тесты
Мы вновь провели повторное тестирование видеокарт Moore Threads со стандартными характеристиками, используя свежую версию драйверов (300.110.2) на момент создания материала. Набор тестов для китайских GPU ежегодно расширяется, однако пока не соответствует полноценному — несмотря на добавление нескольких новых проверок. Ограниченная поддержка графических API вынудила нас сократить перечень тестов и даже использовать старые DirectX 10 тесты, которые мы давно исключили из наших обычных обзоров видеокарт AMD, Intel и Nvidia.
Китайские разработчики неуклонно совершенствуют драйверы, каждая новая версия приносит улучшения и расширяет функциональность. Если ранее приходилось полностью отказываться от приложений DirectX 12, которые являются основой наших стандартных тестов для оценки графических процессоров, то теперь драйверы решений MTT получили некоторую поддержку DX12-приложений, и некоторые тесты 3DMark теперь запускаются на этих видеокартах.
Использовались следующие конфигурации для проведения синтетических тестов:
- MTT S80 со стандартными параметрами и новыми драйверами 300.110 (MTT S80 2025)
- MTT S80 со стандартными параметрами и старыми драйверами 270.80 (MTT S80 2024)
- MTT S70 со стандартными параметрами и новыми драйверами 300.110 (MTT S70 2025)
- MTT S70 со стандартными параметрами и старыми драйверами 270.80 (MTT S70 2024)
- Radeon RX 5500 XT со стандартными параметрами (RX 5500 XT)
- GeForce GTX 1650 со стандартными параметрами (GTX 1650)
- GeForce GTX 1050 Ti со стандартными параметрами (GTX 1050 Ti)
Использованные для тестирования видеокарт MTT и актуальные версии драйверов остались прежними, выбор соперников оказался непростым. Особенно учитывая, что Nvidia давно не предлагала решений подобного уровня производительности в противовес AMD. Недавно выпущенная модель GeForce RTX 5050 значительно превосходит предшественницы, и сравнение с ней не представляется целесообразным. Из линейки видеокарт Radeon мы выбрали одну модель, основанную на первой архитектуре RDNA – Radeon RX 5500 XT. Она является одной из наименее мощных в этой серии (редкую RX 5300 мы не рассматривали) и достаточно устарела и медленна, чтобы китайские видеокарты могли с ней конкурировать.
При выборе решений от Nvidia выбор оказался несколько шире, поскольку компания ранее представила линейку GeForce GTX 16, включающую видеокарты с не самыми мощными графическими процессорами. Из этой линейки мы выбрали одну из моделей с сопоставимо невысокой производительностью – GTX 1650 (использование GTX 1630 не представляется целесообразным, как и использование RX 5300). Кроме того, из графических процессоров более старых поколений была выбрана модель GeForce GTX 1050 Ti (иногда ее заменяли на более простую версию без суффикса Ti). Безусловно, эти видеокарты не являются прямыми конкурентами китайским GPU по стоимости и функциональности, поскольку видеокарты AMD и Nvidia, как правило, более доступны и надежны, однако для синтетических тестов это не играет существенной роли, нам необходима просто какая-то отправная точка.
Тесты Direct3D 10
В процессе тестирования DirectX 10 с помощью RightMark3D мы отобрали лишь несколько наиболее требовательных к GPU примеров. На этот раз их количество немного увеличено, поскольку видеокарты MTT испытывают трудности с поддержкой последних версий графического API, даже при использовании актуальных драйверов, что и требовалось для тестирования. Первая группа тестов оценивает производительность при работе с несложными пиксельными шейдерами, включающими циклы и большое количество текстурных выборок (до нескольких сотен на пиксель) с умеренной нагрузкой на арифметико-логические блоки. Проще говоря, в них определяется скорость обработки текстурных выборок и эффективность условных переходов в пиксельном шейдере. Оба примера используют самозатенение и шейдерный суперсэмплинг, что дополнительно увеличивает нагрузку на видеочипы.
Первым тестом для оценки пиксельных шейдеров служит Fur. При использовании максимальных настроек он предполагает от 160 до 320 текстурных выборок из карты высот и несколько выборок из основной текстуры. Наибольшее влияние на производительность в этом тесте оказывает количество и эффективность блоков TMU, хотя на результат также влияет скорость выполнения сложных программ.
При решении задач процедурной визуализации меха, особенно при использовании большого количества текстурных выборок, видеокарты AMD традиционно демонстрировали хорошие результаты. Компания занимала лидирующие позиции с момента появления графических процессоров на архитектуре GCN, а модели на чипах Navi с архитектурой RDNA1 стали еще более эффективными в выполнении этих программ – хотя и превосходят решения Nvidia лишь в сравнении.
В этих тестах видеокарты Moore Threads демонстрируют результаты, превосходящие показатели их весьма приблизительных конкурентов, включая Radeon RX 5500 XT и GeForce GTX 1650, а также GTX 1050. Благодаря значительному числу блоков TMU и оптимизированному текстурированию, видеокарты S80 и S70 показали более высокую скорость по сравнению с другими видеокартами в данном тесте. Обновление драйверов до версии 2025 года обеспечило лишь незначительный рост производительности, в единицы процентов в лучшем случае, поэтому ситуация практически не изменилась — китайские видеокарты по-прежнему заметно превосходят условных соперников в этом тесте.
Тест Steep Parallax Mapping, использующий DX10, также оценивает производительность при обработке сложных пиксельных шейдеров, включающих циклы и большое количество текстурных выборок. При максимальных настройках он задействует от 80 до 400 текстурных выборок из карты высот, а также несколько выборок из основных текстур. Этот шейдерный тест Direct3D 10 представляется более полезным с практической точки зрения, поскольку методы parallax mapping, включая steep parallax mapping, широко используются в играх. Помимо этого, в нашем тесте реализовано самозатенение, которое удваивает нагрузку на видеочип, и суперсэмплинг, также повышающий требования к вычислительной мощности графического процессора.
Диаграмма имеет сходство с предыдущей, видеокарты GeForce демонстрируют незначительное улучшение по сравнению с Radeon, однако китайские видеокарты сохраняют лидерство, получив дополнительный прирост благодаря обновлению драйверов. Обе видеокарты достаточно эффективны в подобных тестах, а старшая модель значительно превосходит остальные GPU – большое количество блоков текстурирования обеспечивает китайским видеокартам заметное преимущество в задачах со сложными шейдерами и большим количеством текстурных выборок. Драйверы новой версии повысили результат на 2%-4%, аналогично предыдущему тесту. Это не внесло существенных изменений, поскольку китайские видеокарты и в этом подтесте значительно превосходят как видеокарты Nvidia, так и единственное решение Radeon.
В следующих парах тестов пиксельных шейдеров минимизировано количество выборок текстур, чтобы уменьшить нагрузку на блоки TMU. Они основаны на большом количестве арифметических операций и предназначены для оценки математической производительности видеочипов, в частности, скорости выполнения арифметических инструкций в пиксельном шейдере. В последнее время эта скорость уже не является определяющим фактором, поскольку большинство вычислений перенесены в compute shaders, однако для старых игр она всё ещё имеет значение.
Первый математический тест носит название Mineral. Это испытание, посвященное сложному процедурному текстурированию, в котором применяются всего две выборки из текстурных данных и 65 инструкций, использующих функции sin и cos.
Часто результаты парных тестов, оценивающих математические возможности DirectX 10, не всегда точно отражают различия в частотах и количестве вычислительных блоков. На них влияют различные факторы, такие как эффективность использования этих блоков при решении конкретных задач, оптимизация драйверов, приоритеты, заложенные в микроархитектуре, и многое другое. Поэтому в тесте Mineral видеокарты нередко демонстрируют результаты, которые не являются показательными, и могут значительно отличаться от теоретических значений, а также от результатов, полученных в аналогичных тестах из других программных пакетов.
В прошлом году мы констатировали, что видеокарты MTT продемонстрировали хорошие показатели в данном тесте: обе оказались быстрее пары GeForce, а флагманская модель превзошла и видеокарту AMD. С выходом новых драйверов ситуация не изменилась, и результаты остались примерно на том же уровне, поскольку даже погрешность измерений может составлять до 2%. Таким образом, MTT S80 по-прежнему лидирует в нашем сравнении, но с незначительным перевесом, а более доступная модель уступает лишь решению компании AMD.
Второй тест шейдерных вычислений, известный как Fire, представляет собой более сложную задачу для арифметико-логических блоков. В нем используется только один канал выборки текстур, однако объем инструкций sin и cos увеличен в два раза — до 130. Рассмотрим, какие изменения произойдут при повышении нагрузки:
Второй тест математических вычислений, предназначенный для китайских видеокарт, оказался более требовательным, однако и обновленные драйверы, выпущенные в 2025 году, не продемонстрировали существенного улучшения – прирост в 1% сложно назвать значительным. В подобных тестах нередко наблюдаются результаты, не соответствующие теоретическим расчетам, поскольку некоторые графические процессоры при тестировании не загружаются работой на полную мощность и подвержены ограничениям, отличным от скорости арифметико-логических устройств. В целом, этот тест можно считать устаревшим.
В любом случае, старшая видеокарта MTT S80 превосходит обе GeForce, а младшая сопоставима с GeForce GTX 1650, что является весьма достойным показателем. Первоначально выпущенные драйверы оказались настолько неэффективными, что видеокарты Moore Threads демонстрировали крайне низкие результаты в математических тестах DX10, однако в настоящее время их положение значительно улучшилось. То, что обе модели уступают Radeon RX 5500 XT, не является чем-то из ряда вон выходящим, и эти результаты, в любом случае, можно оценить как неплохие.
Переходим к тестированию геометрических шейдеров. Пакет RightMark3D 2.0 включает в себя два теста производительности геометрических шейдеров, однако один из них (Hyperlight, демонстрирующий применение instancing, stream output, buffer load и динамическое создание геометрии с использованием stream output) не функционирует на всех видеокартах AMD, а на видеокартах MTT показал неудовлетворительные результаты, поэтому мы остановились на втором тесте — Galaxy. В этом тесте на GPU создается анимация системы частиц, и геометрический шейдер формирует из каждой точки четыре вершины, составляющие частицу.
Вычисления в данном тесте выполняются в геометрическом шейдере, что является менее распространенной задачей по сравнению с текстурированием и сложными математическими операциями, которые встречались в предыдущих тестах. В результате обе видеокарты MTT продемонстрировали значительно более низкую производительность по сравнению с решениями AMD и Nvidia, даже если мы проводим сравнение с устаревшими моделями. Разница между S80 и S70 в данном случае незначительна, но это не имеет большого значения, поскольку обе модели существенно уступают конкурентам.
При различной геометрической сложности сцен скорость обработки примерно одинакова для всех протестированных конфигураций, поскольку производительность зависит от количества используемых точек. Однако видеокарты MTT S80 и S70 продемонстрировали значительно более низкие показатели – в несколько раз ниже, чем у устаревших моделей AMD и Nvidia. Radeon RX 5500 XT и GeForce GTX 1650 в данном тесте показывают схожие результаты, и обе справляются с задачами достаточно эффективно, а GTX 1050 также не сильно от них отстает. Видеокарты MTT, напротив, испытывают трудности при работе с геометрическими шейдерами из-за слабого геометрического конвейера, и даже обновление драйверов не смогло существенно улучшить ситуацию – скорость возросла лишь на один процент.
Начинаем тестирование скорости извлечения текстур из вершинных шейдеров. Тесты «Vertex Texture Fetch» предназначены для оценки производительности большого числа текстурных выборок, осуществляемых вершинным шейдером. Тесты «Earth» и «Waves» имеют схожую структуру: в обоих случаях применяется displacement mapping на основе данных текстурных выборок. Главное различие заключается в том, что в тесте «Waves» используются условные переходы, а в «Earth» — не применяются. Поскольку полученные результаты оказались близкими, для анализа будет достаточно теста «Waves», при котором количество билинейных текстурных выборок может достигать 24 на каждую вершину.
Опыт показывает, что на итоги этого теста способны оказывать влияние такие факторы, как частота обращений и пропускная способность памяти, которые могут снижать производительность. Однако у видеокарт Moore Threads с этими ограничениями не сталкиваются, равно как и с быстродействием обработки текстур. Что касается оптимизации драйверов для различных задач, особенно для довольно редко используемых, то у них до сих пор существует значительная проблема, даже спустя несколько лет после выпуска оборудования.
Результаты тестов китайских видеокарт оказались лучше, чем при работе с геометрическими шейдерами, однако MTT S80 и S70 всё равно значительно проиграли другим участникам тестирования, причем GTX 1050 оказалась вдвое быстрее. Проверяемые китайские видеокарты вновь продемонстрировали невысокую производительность, уступая моделям серий Radeon и GeForce на несколько порядков. В целом, показатели геометрических и вершинных шейдеров для видеокарт MTT остаются неудовлетворительными – в этих тестах они проигрывают даже устаревшим и медленным графическим процессорам от более известных компаний. Обновленные в 2025 году драйверы позволили добиться небольшого увеличения производительности, но это лишь незначительный прирост в размере +2%…3%, который сложно назвать существенным. Даже старые и относительно немощные видеокарты конкурентов работают быстрее.
Тесты 3DMark Vantage
Мы часто обращаемся к довольно старым синтетическим тестам из набора 3DMark Vantage, поскольку в них нередко обнаруживаются интересные моменты, отсутствующие в более современных тестах. Функциональные тесты, входящие в этот пакет, поддерживают DirectX 10, и они остаются в целом актуальными. При анализе результатов новых видеокарт мы всегда приходим к полезным заключениям. Особенно это важно для видеокарт, таких как китайские MTT, поскольку это один из немногих способов детально оценить их производительность.
Feature Test 1: Texture Fill
Первый тест предназначен для оценки эффективности работы блоков выборки текстур. Он основан на заполнении прямоугольной области значениями, получаемыми из небольшой текстуры. При этом используются многочисленные текстурные координаты, которые изменяются в каждом кадре.
В текстурном тесте Futuremark видеокарты AMD и Nvidia, как правило, демонстрируют высокую производительность, и результаты близки к ожидаемым теоретическим значениям. Однако, в отдельных случаях, показатели некоторых графических процессоров могут быть несколько ниже. Видеокарты Moore Threads, в свою очередь, показывают результаты, значительно отличающиеся от заявленных производителем – фактическая скорость текстурирования решений MTT оказалась не такой высокой, как потенциально возможная.
Несмотря на это, производительность китайского графического процессора Chunxiao в двух конфигурациях в данном тесте оказалась достаточно высокой, чтобы превзойти Radeon RX 5500 XT и некоторые видеокарты GeForce. Первые версии драйверов демонстрировали, что младшая модель с упрощенной версией графического процессора была почти вдвое медленнее старшей, однако эту проблему устранили в прошлом году. В 2025 году, благодаря обновленным драйверам для S70 и S80, прирост производительности составил всего несколько процентов, но даже младшая модель продолжает демонстрировать более высокие показатели, чем аналогичные решения от AMD и Nvidia.
Feature Test 2: Color Fill
Вторым этапом является проверка скорости заполнения. Для этого применяется базовый пиксельный шейдер, который не оказывает влияния на производительность. Интерполированное значение цвета записывается в буфер, не принадлежащий экрану (render target), посредством альфа-смешения. Используется 16-битный внеэкранный буфер в формате FP16, который часто применяется в играх с HDR-рендерингом, что делает данный тест актуальным.
Вторичные тесты 3DMark Vantage демонстрируют работу блоков ROP независимо от скорости передачи данных видеопамяти. Этот тест предназначен для оценки производительности подсистемы ROP, и обычно на неё не влияет пропускная способность памяти. В ходе первого теста мы заметили необъяснимую разницу в производительности MTT для моделей S80 и S70, которая противоречит теоретическим расчётам. Тогда это было вызвано различиями в драйверах, оптимизированных для каждой модели по-разному. Однако в прошлом году эту проблему устранили, и S70 начала уступать S80 в соответствии с теоретическим прогнозом.
В 2025 году обновления драйверов принесли дополнительный прирост производительности – от 5% до 7%, что уже нельзя считать погрешностью измерений. Китайские видеокарты и без того демонстрировали показатели, близкие к впечатляющим теоретическим значениям пиковой скорости заполнения сцены, а теперь они значительно превосходят Radeon RX 5500 XT, а также некоторые модели GeForce. Решения MTT справляются с подобными условиями в разы быстрее, что обусловлено их архитектурной схожестью с PowerVR. Имитированные условия хорошо подходят для тайловой архитектуры, однако в реальных задачах столь же существенного преимущества перед традиционными GPU ожидать не стоит.
Тест функции 3: отображение окклюзии с использованием параллакса
Этот feature-тест отличается особой интересностью, поскольку схожие методы давно применяются в разработке игр. В нем создается четырехугольник (точнее, два треугольника) с использованием техники Parallax Occlusion Mapping, которая позволяет имитировать детализированную геометрию. Для реализации требуется выполнение ресурсоемких операций трассировки лучей и использование карты глубины высокого разрешения. Кроме того, данная поверхность затеняется с помощью сложного алгоритма Strauss. Это проверка пиксельного шейдера, который является сложным и требует значительных ресурсов видеочипа, поскольку включает множество текстурных выборок при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Оценка, полученная в тесте 3DMark Vantage, формируется не только за счет скорости математических расчетов, качества обработки условных переходов или быстроты выборки текстур, но и зависит сразу от нескольких факторов. Для достижения оптимальной производительности в данном тесте необходим сбалансированное взаимодействие графического процессора и эффективное выполнение сложных шейдеров. Этот тест достаточно информативен, поскольку его результаты часто соответствуют результатам, демонстрируемым в игровых бенчмарках. Здесь требуется и высокая математическая, и текстурная производительность, поэтому в этой синтетической нагрузке 3DMark Vantage видеокарты Moore Threads показывают хорошие результаты, как и в аналогичных тестах предыдущего раздела из RightMark.
Изначально между старшей видеокартой S80 и младшей S70 наблюдался существенный разрыв, вызванный различной оптимизацией программного обеспечения для этих моделей. Однако к 2024 году младшая S70 значительно сократила отставание от более мощного GPU, получив при этом небольшой прирост производительности. Новейшая версия драйверов также увеличила показатели на 2–3%. Хотя младшей S70 и не удалось догнать Radeon RX 5500 XT и GeForce GTX 1650, разница между ними в данном тесте незначительна, в то время как старшая модель S80 увеличила свой отрыв.
Feature Test 4: GPU Cloth
Четвертый тест представляет интерес, поскольку в нем для моделирования физических взаимодействий (имитация ткани) задействован графический процессор. В нем применяется вершинная симуляция, основанная на совместной работе вершинных и геометрических шейдеров, с использованием нескольких этапов. Для передачи данных о вершинах между этапами симуляции используется технология stream out. Это позволяет оценить производительность вершинных и геометрических шейдеров, а также скорость работы stream out.
Время рендеринга в данном тесте также определяется сразу несколькими факторами, ключевыми из которых являются производительность при работе с геометрией и эффективность геометрических шейдеров. В теории это так, но на видеокартах Nvidia мы давно наблюдаем неверные результаты в этом тесте, аналогичная ситуация возникла и с видеокартами поколения Radeon RX 7000 и более поздними. Кажется, что может быть хуже? Есть – с видеокартами MTT ситуация еще более плачевная, их результаты в этом тесте в десятки раз уступают показателям конкурентов.
Как и в тестах геометрических и вершинных шейдеров, описанных ранее, здесь наблюдается крайне низкий результат, который сложно объяснить простой теорией. Возможно, причина кроется в драйверах, которые не получают оптимизации для выполнения подобных задач и работы с малоизвестными тестовыми пакетами. Однако, вероятнее всего, проблема заключается в том, что тайловая архитектура неэффективна при работе с таким синтетическим тестом. Повышение версии драйверов до 300.110 не привело к улучшению ситуации, а напротив — видеокарты китайского производства даже потеряли от 6% до 8% производительности в этих тестах. Но самое главное, что обе они существенно уступают всем остальным участникам, и их отставание весьма значительно.
Feature Test 5: GPU Particles
Тест основан на физической симуляции эффектов, использующей системы частиц, вычисления для которых выполняются на графическом процессоре. Для моделирования применяется вершинная симуляция, в которой каждая вершина соответствует отдельной частице. Для достижения той же цели, что и в предыдущем тесте, используется вывод данных в поток. Вычисляется несколько сотен тысяч частиц, все они анимируются независимо, и также рассчитываются их взаимодействия с картой высот. Отрисовка частиц осуществляется с помощью геометрического шейдера, который генерирует четыре вершины из каждой точки, формируя частицу. Наибольшая нагрузка приходится на шейдерные блоки из-за вершинных расчетов, и также проверяется вывод данных в поток.
В данном случае наблюдается схожая картина с предыдущей диаграммой: результаты китайских видеокарт Moore Threads во втором геометрическом тесте из 3DMark Vantage оказались не впечатляющими, и они снова значительно уступают решениям от Radeon и GeForce. Даже более свежий драйвер, выпущенный в 2025 году, не привел к существенным улучшениям, и MTT по-прежнему значительно позади. Незначительное снижение производительности на 2% по сравнению с прошлогодним программным обеспечением не оказало заметного влияния.
Судя по имеющимся данным, в китайских графических процессорах может присутствовать специфическая аппаратная особенность или даже дефект, касающийся обработки геометрии в определенных задачах. Из-за этого в драйверах приходится применять обходные пути, частично перекладывая вычисления на центральный процессор, подобно тому, как это делалось в эпоху расцвета аппаратного ускорения 3D-графики в начале двухтысячных годов. Тем не менее, нельзя исключать, что указанные проблемы обусловлены недостатком оптимизации драйвера для решения конкретного типа задач.
Feature Test 6: Perlin Noise
Последний тест функциональности пакета Vantage представляет собой вычислительно сложный тест GPU, который включает в себя расчет нескольких октав алгоритма Perlin noise в пиксельном шейдере. Для увеличения нагрузки на видеочип каждый цветовой канал использует отдельную функцию шума. Perlin noise – это общепринятый алгоритм, часто используемый при процедурной генерации текстур, требующий значительного объема математических операций.
Результаты тестов производительности различных GPU в математических задачах не всегда соответствуют теоретическим прогнозам, однако, как правило, близки к максимальным показателям, которые видеочипы демонстрируют в задачах, использующих ресурсы на пределе, хотя и с некоторыми ограничениями. В ходе тестирования выполняются вычисления с плавающей запятой, и современные архитектуры, как правило, эффективно их обрабатывают. Однако и более ранние модели показывают достойные результаты – несмотря на то, что тест уже достаточно устарел, он остается подходящим для оценки представленных GPU.
Заметной разницы между младшей и старшей видеокартами MTT в данном тесте не выявлено, поскольку последние версии драйверов практически не повлияли на результаты работы обеих моделей. Небольшое увеличение производительности младшей модели на 1% вполне может быть связано с погрешностью измерений. Тем не менее, обе китайские видеокарты демонстрируют лучшие показатели по сравнению с Radeon RX 5500 XT и GeForce GTX 1650, не говоря уже о самой слабой видеокарте в тестировании GTX 1050 Ti, которая отстала более чем в два раза. Таким образом, в задачах, связанных с математическими вычислениями, китайские видеокарты показывают себя достаточно хорошо.
Подводя итоги по всем тестам DirectX 10, можно констатировать, что в задачах, связанных с текстурированием и заполнением буфера кадра, видеокарты MTT демонстрируют заметное превосходство над предшествующими моделями. Обновленные драйверы позволили им занять еще более выгодную позицию. Также достойные результаты они показывают и в вычислительных операциях. Однако при работе с менее распространенными игровыми и программными задачами, такими как геометрические шейдеры или выборка текстур из вершинных шейдеров, китайские графические процессоры проявляют себя не лучшим образом, и программная оптимизация не оказывает существенного влияния – вероятно, это связано с особенностями их архитектуры. Предстоит оценить возможности китайских GPU в более современных синтетических тестах, использующих DirectX 11 и 12.
Тесты Direct3D 11
Видеокарты Moore Threads изначально поддерживали DirectX 11, благодаря чему мы смогли применить Direct3D11-тесты из пакета разработчиков SDK Radeon. В качестве первого теста выбран FluidCS11, который моделирует физику жидкостей, рассчитывая поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в данном примере используется гидродинамика сглаженных частиц. Количество частиц в тесте установлено на максимально доступное значение — 64 000 штук.
В ходе тестирования видеокарты MTT S80 и S70 продемонстрировали схожие показатели, что оказалось довольно неожиданным и вызывало вопросы – вероятно, здесь присутствует какая-то ошибка. Полученные результаты нельзя назвать плохими, как это было в некоторых геометрических тестах, описанных ранее, однако оптимизация вычислительных шейдеров D3D11 для видеокарт MTT, по всей видимости, не является оптимальной, и они проигрывают не только Radeon RX 5500 XT и GeForce GTX 1650, но и уступают даже самой слабой GTX 1050 Ti. Тем не менее, высокая частота кадров указывает на то, что вычисления в данном примере из SDK слишком просты даже для карт такого уровня.
Новые драйверы версии 300.110, выпущенные в этом году, не содержат никаких изменений, как и драйверы предыдущего года. Программные разработчики для MTT, независимо от того, являются ли они китайскими специалистами или сотрудниками Imagination Tech, чья архитектура послужила основой для китайских GPU, оптимизируют свои драйверы исключительно для определенных игр. В качестве универсального решения, подходящего для любого программного обеспечения, использующего данную версию графического API, они оказываются недостаточно эффективными. Таким образом, в первом тесте DX11 мы не выявили никакой разницы между драйверами различных версий: 230.40, 270.80 и 300.110. Остается надежда, что она проявится в последующих тестах.
Второй тест D3D11, InstancingFX11, демонстрирует применение вызовов DrawIndexedInstanced для отрисовки большого количества идентичных объектов в каждом кадре. Разнообразие визуального представления достигается за счет использования текстурных массивов с различными текстурами, применяемыми к деревьям и траве. Чтобы обеспечить максимальную нагрузку на графический процессор, были применены максимальные настройки, определяющие количество деревьев и плотность травы.
Скорость рендеринга в данном тесте в первую очередь определяется оптимизацией драйвера и возможностями вычислительного ядра графического процессора. Решения Nvidia традиционно демонстрировали превосходство в этом аспекте, в то время как AMD ранее отставали, но затем улучшили свои показатели и теперь практически не уступают GeForce. Однако продукты Moore Threads снова не оправдали ожиданий — при выполнении задач, выходящих за рамки стандартных тестов текстурирования и математических расчетов, и использующих альтернативные вычислительные блоки, особенно при неравномерной нагрузке на графический процессор, S80 и S70 показывают неудовлетворительные результаты, значительно уступая сопоставимым конкурентам. За прошедший год обновления драйверов не принесли никаких улучшений и для второго из наших тестов, использующих DirectX 11, что указывает на недостаток оптимизаций или какую-то аппаратную проблему, поскольку, согласно теоретическим расчетам, MTT не должны настолько сильно проигрывать решениям AMD и Nvidia.
Третий пример, демонстрирующий возможности D3D11, называется VarianceShadows11. В этом тесте, включенном в SDK AMD, применяются shadow maps с тремя каскадами, то есть с разной степенью детализации. Динамические каскадные карты теней в настоящее время часто используются в играх с растеризацией, поэтому данный тест представляет интерес с точки зрения практического применения. При проведении тестирования были использованы стандартные параметры.
Эффективность работы в данном примере, использующем SDK, определяется как скоростью обработки графических блоков, так и возможностями памяти. Этот тест имеет значение, поскольку методы отрисовки теней, подобные описанным, часто применяются в реальных игровых проектах. Именно поэтому мы обнаружили тест DX11, в котором MTT S80 и S70 демонстрировали стабильно хорошие показатели, несмотря на то, что они всё равно уступали решениям AMD и Nvidia – компаний, которые давно и успешно оптимизировали свои аппаратные и программные компоненты.
Хотя обновление драйверов в 2024 году до версии 270.80 заметно повысило скорость рендеринга теней, обновленные драйверы версии 300.110 текущего года, напротив, снизили эту производительность. В прошлом году, в ходе тестирования, как старшая модель S80, так и младшая S70 демонстрировали большую скорость по сравнению с видеокартами GeForce, уступая лишь Radeon. Однако новая версия программного обеспечения привела к ухудшению результатов на 25–35%, что является значительным падением. Теперь обе модели MTT стали самыми медленными GPU, даже уступая GTX 1050 Ti. Если ранее мы отметили оптимизацию кода DX11, поскольку такие методы отрисовки теней часто применяются в играх, то теперь необходимо сожалеть о том, что подобная оптимизация обернулась отрицательным эффектом и может негативно сказаться на работе в некоторых играх.
Возможна и такая ситуация: проблема заключается в недостаточной популярности подобных тестов, для которых не ведется оптимизация кода. В качестве примера можно привести DX11-тест, который начал корректно работать с драйверами MTT лишь в прошлом году — бенчмарк Fire Strike (обычная версия) из пакета 3DMark. Это широко известный и часто используемый тест для оценки производительности графических процессоров невысокой мощности, и все производители должны обеспечивать высокий уровень оптимизации программного обеспечения для него.
Несмотря на то, что эти видеокарты не обязаны соответствовать определенным требованиям, они демонстрируют производительность, сопоставимую с GeForce GTX 1050 Ti. Они уступают модели GTX 1650 незначительно, а вот Radeon RX 5500 XT значительно превосходит все представленные решения. Однако обновление драйверов, выпущенное в 2025 году, оказало положительное влияние на работу китайских видеокарт, увеличив их показатели на 4-5%, что, хоть и не является существенным улучшением, все же является позитивным фактором.
Несмотря на то, что разница между моделями S70 и S80 оказалась относительно небольшой – всего 4%-8%, в большинстве тестов наблюдалось значительное расхождение, что соответствовало теоретическим предположениям. Тем не менее, уже сам факт работоспособности этого популярного теста на малоизвестных китайских видеокартах является положительным моментом.
Тесты Direct3D 12
Это совершенно новая категория синтетических тестов, предназначенная для оценки производительности китайских видеокарт MTT. С появлением новой версии драйверов 2025 года стали доступны и некоторые тесты из пакета 3DMark, использующие Direct3D12, в том числе популярный бенчмарк Time Spy. Нам важно не только общее сравнение видеокарт по вычислительной мощности, но и выявление различий в производительности при использовании и без использования асинхронных вычислений, реализованных в DirectX 12. Мы провели тестирование видеокарт сразу в двух графических тестах.
В ходе тестирования видеокарты MTT продемонстрировали достойную производительность. Старшая модель S80 оказалась на 3%-9% быстрее GeForce GTX 1650, что является заметным преимуществом. Более младшая модель MTT S70 уступает старшей на 16%-17%, что сопоставимо с ожидаемым теоретическим разрывом между ними. Примечательно, что в первом же тесте DirectX 12 китайские видеокарты превзошли модель GeForce RTX 1050 Ti, а единственная представленная в сравнении видеокарта Radeon показала наиболее выдающиеся результаты по сравнению со всеми остальными решениями, в том числе и GeForce.
Начало поддержки DX12 для продуктов Moore Threads выглядит перспективным, поскольку были выполнены серьезные оптимизации, адаптированные к этому тесту. Однако важно помнить, что результаты данного теста не всегда точно отражают реальную производительность в играх, поскольку большинство компаний стремятся к максимальной оптимизации драйверов именно для Time Spy. Тем не менее, есть основания полагать, что китайские видеокарты покажут себя достойно в приложениях, использующих DX12, а уровень производительности, сопоставимый с GeForce GTX 1650, уже можно считать весьма достойным.
Еще одним тестом из той же серии 3DMark, который был выполнен на китайских видеокартах с новыми драйверами, стал один из представителей семейства технологий масштабирования изображения — FSR 2.0 от AMD. Эта технология была добавлена в перечень специализированных тестов масштабирования в 3DMark в последней версии, вслед за DLSS и XeSS. К счастью, FSR в ранних версиях поддерживает все решения, совместимые с DX12, поэтому он запускается практически на любом оборудовании, включая протестированные китайские видеокарты.
FSR — это технология, предназначенная для работы на различных графических процессорах, и демонстрирует схожую производительность на решениях от AMD, Nvidia и Intel. К сожалению, видеокарты китайского производства MTT не смогли показать достойных результатов, поскольку они значительно уступают по эффективности при использовании масштабирования разрешения методом FSR 2.0 по сравнению с другими видеокартами.
У нас отсутствуют результаты тестирования GTX 1650, GTX 1050 Ti и Radeon RX 5500, однако их заменила Intel Arc A310. Она демонстрирует производительность, сопоставимую с MTT S70 без использования технологии FSR, хотя включение этой технологии оказывает незначительное влияние на скорость китайских видеокарт по сравнению с остальными. При переходе на более низкое разрешение рендеринга Intel Arc A310 показала увеличение скорости в 2,7 раза, в то время как S80 и S70 ускорились лишь в 1,7 раза. Таким образом, с реализацией кода FSR у них явно имеются проблемы. К сожалению, это упускаемая возможность повышения производительности в DX12-приложениях, где она необходима, то есть во всех приложениях, поддерживающих FSR.
В дополнение к существующим тестам, мы включили в нашу программу еще один инструмент из 3DMark. Он не связан напрямую с графическими API, однако полезен как для оценки графической производительности, так и для вычислений на GPU. Речь идет о бенчмарке, измеряющем пиковую пропускную способность передачи данных по шине PCIe. Мы оценим пропускную способность шины PCI Express с помощью специального теста, входящего в состав пакета 3DMark, который позволяет определить максимальную скорость передачи данных по внешней шине.
Шина PCI Express пятого поколения уже некоторое время используется в настольных компьютерах, в частности, для твердотельных накопителей, однако, в задачах 3D-графики графические процессоры не получают существенного преимущества от увеличения полосы пропускания вдвое. Максимальная пропускная способность определяется как версией шины PCIe, так и количеством используемых линий: x8 или x16. Видеокарта MTT S80, обладающая 16 линиями, стала первым промышленным решением, поддерживающим PCIe 5.0, опередив при этом AMD, Intel и даже Nvidia! Далее мы сравним ее характеристики с некоторыми современными видеокартами этих трех компаний, выпускающих решения для настольных ПК.
В этой области китайским производителям нечего особого демонстрировать. Как показано на диаграмме, даже при значительно меньшем количестве линий, GeForce RTX 5050 демонстрирует на 22% лучший результат в данном тесте. Даже видеокарта Intel Arc B570, которая поддерживает восемь линий PCIe 4.0, передает данные примерно вдвое медленнее, чем MTT S80, хотя, согласно теории, разница между ними должна составлять в четыре раза. Это подтверждается сравнением с видеокартой Radeon, которая даже в режиме PCIe 4.0 превосходит по производительности при передаче данных по шине, а режим 5.0 позволяет ей занять безоговорочное лидерство. Однако, заметная разница в результатах этого синтетического теста не приводит к столь же значительному отличию частоты кадров в играх, поэтому ее значение не столь велико. Тем не менее, владельцам видеокарт с ограниченной эффективной скоростью передачи данных по PCIe стоит осознавать, что их использование в системах с поддержкой только PCIe 3.0 или 4.0 может повлечь за собой негативные последствия в реальных приложениях.
Подводя итог по результатам всех синтетических тестов, можно констатировать, что драйверы MTT, несмотря на ощутимый прогресс за последние годы, пока не достигли уровня, необходимого для обеспечения стабильной и оптимизированной работы во всех приложениях и алгоритмах. Выпуск драйверов версии 300.110 в 2025 году позволил незначительно повысить производительность в ряде тестов, однако во многих случаях она остаётся крайне невысокой, что не позволяет конкурировать с видеокартами даже устаревших моделей других производителей.
Китайские разработки по-прежнему уступают конкурентам, во многом из-за недостаточной детализации ключевых факторов. Несмотря на имеющийся резерв аппаратной мощности, он ограничен неоптимальным программным обеспечением, и несмотря на значительное время, прошедшее с момента выпуска, все недочеты так и не удалось устранить. Это вполне объяснимо, поскольку ведущие конкуренты на протяжении многих лет работали над оптимизацией своих драйверов, и даже у мощной Intel не всегда получается добиться желаемых результатов. Однако нас приятно удивило появление, хотя и не идеальной, но все же поддержки DirectX 12 в новых драйверах — значит, пусть и с некоторыми трудностями и невысокой скоростью, но такие приложения будут работать на видеокартах S80 и S70. И на этой позитивной ноте мы переходим к тестированию китайских видеокарт в реальных игровых сценариях — возможно, усилия программистов MTT все это время были сосредоточены именно на играх.
Тестирование: игровые тесты
Конфигурация тестового стенда
Конфигурация тестового стенда
- Компьютер, построенный на процессоре AMD Ryzen 9 9950X3D с сокетом AM5) :
- Платформа:
- процессор AMD Ryzen 9 9950X3D (разгон до 5,3 ГГц по всем ядрам);
- СЖО Asus ROG Ryujin III 360 ARGB Extreme;
- системная плата Asus ROG Crosshair X670E Hero на чипсете AMD X670E;
- оперативная память XPG Lancer Blade DDR5 2×16 GB EXPO 6000 МТ/с (CL30-40-40);
- SSD Intel 760p NVMe 1 ТБ PCIe;
- SSD Intel 860p NVMe 2 ТБ PCIe;
- блок питания Galax Hall of Fame GH1300 PCIE5, 1300 Вт;
- корпус Thermaltake Level20 XT (тестирование в условиях закрытого корпуса с продувом: 2 фронтальных вентилятора на вдув и 1 задний на выдув);
- операционная система Windows 11 Pro 64-битная (24H2);
- телевизор LG 55Nano956 (55″ 8K HDR, HDMI 2.1);
- драйверы MTT 230.40/270.80/300.110.2;
- драйверы AMD версии 25.8.1;
- драйверы Nvidia версии 580.88;
- драйверы Intel версии 101.6972;
- VSync отключен.
- Платформа:
Список инструментов тестирования
При проведении игровых тестов настройки графики всегда устанавливались на минимальный уровень.
- Ashes of the Singularity
- Dota 2
- PlayerUnknown’s Battlegrounds
- Counter-Strike: Global Offensive
- Heroes of the Storm
- World of Tanks
- Monster Hunter: World
- Far Cry 5
- Crysis 3
Результаты тестирования в 3D-играх в разрешении 1920×1080
В прошлом году мы выбрали девять игровых тестов, демонстрирующих удовлетворительную производительность на видеокартах MTT, и они функционировали без проблем. При этом для тестирования требовались не самые новые игры, но поддерживающие DirectX 11 или DirectX 10. Следует отметить, что официальный список поддерживаемых игр с сайта производителя в основном состоит из китайских наименований, которые мало что говорят пользователям за пределами Китая.
В тот же период времени мы провели тестирование пяти карт эконом-класса, рассматривая их как конкурентов:
- Видеокарта Nvidia GeForce GTX 1650 с 4 ГБ видеопамяти (модель Palit GeForce GTX 1650 StormX)
- Nvidia GeForce RTX 3050 8 ГБ (Palit GeForce GTX 3050 StormX)
- AMD Radeon RX 6500 XT 4 ГБ (Gigabyte Radeon RX 6500 XT Gaming)
- Intel Arc A380 6 ГБ (Gigabyte Intel Arc A380 Gaming)
- Intel Arc A310 4 ГБ (Gigabyte Intel Arc A310 Gaming)
Уровень детализации карт в многостоловых турнирах (MTT) не превышает Full HD, и как правило, он даже ниже. Также следует отметить, что использование максимальных графических настроек для подобных тестов нецелесообразно. Даже при среднем качестве графики возникали задержки, поэтому все испытания для обеспечения сопоставимости проводились на минимальных настройках в разрешении 1080p.
В качестве основного объекта изучения в этот раз выступает анализ влияния новой версии драйверов 300.110.2 на результаты тестов MTT, сопоставление их с результатами, полученными при использовании предыдущих версий – 270.80 и 230.40. В связи с изменением конфигурации тестового стенда в 2025 году, повторное тестирование было проведено и для остальных видеокарт, используя самые актуальные версии драйверов.
Более свежие версии драйверов MTT характеризуются смещением индикатора результата в нижнюю область.
Первое тестирование 2023 года показало, что даже у модели S80 комфорт в Ashes of the Singularity был удовлетворительным, хотя и не идеальным. Однако теперь положение значительно улучшилось: по сравнению с первой версией драйверов (230.40), старшая модель S80 продемонстрировала увеличение производительности на 70%, а младшая S70 — на 71%. При этом производительность S80 стала сопоставима с GeForce GTX 1650, значительно превзойдя Arc A310. Игровой процесс комфортен как на S80, так и на S70.
В Dota 2 даже при минимальных настройках графики игра на разрешении 1920×1080 ранее позволяла достичь комфортного геймплея, обеспечивая частоту кадров, превышающую 60. Однако, новые драйверы позволили увеличить производительность для моделей S80 и S70 на 58% и 55% соответственно, по сравнению с предыдущими показателями. В результате, S80 превзошел GeForce GTX 1650 и Radeon RX 6500 XT, приблизившись по мощности к Intel Arc A380. А S70 опередил GeForce GTX 1650 и Arc A310. Теперь в этой игре можно повысить настройки графики до среднего уровня, практически не теряя в плавности игрового процесса.
На начальных версиях драйверов игра PUBG была невозможна. Загрузка ядер видеокарт MTT при этом не превышала 60%-70%, что указывало на наличие проблем с драйверами. Сравнительный анализ с продуктами конкурентов не представлялся целесообразным. После выпуска финальной версии драйверов производительность модели S80 увеличилась в 4,2 раза (!), а S70 — в 4,6 раза! Проведена качественная оптимизация. Благодаря этому S80 превзошел не только Arc A310, но и GeForce GTX 1650, приблизившись к характеристикам Radeon RX 6500 XT. А производительность S70 оказалась сопоставима с GeForce GTX 1650. Пользователям, предпочитающим высокое качество графики, уже доступна возможность повысить настройки до среднего уровня.
Мы ранее констатировали, что в CS:GO уровень комфорта был достаточно высоким, хотя минимальная частота кадров иногда опускалась ниже 40. Теперь же S80 продемонстрировал улучшение на 89%, а S70 – на 93%. Игровой процесс не вызывает затруднений – не было замечено проблем со стабильностью, задержками и прочим. S80 значительно превзошел GeForce GTX 1650, показав результат немного меньший, чем у Radeon RX 6500 XT. При этом S70 также опередил GeForce GTX 1650. В этой игре теперь можно увеличить настройки графики до среднего уровня, практически не теряя в плавности геймплея.
В Heroes of the Storm мы ранее уже констатировали удобный геймплей и отсутствие претензий. Тем не менее, стоит упомянуть, что обновленный драйвер MTT обеспечил видеокартам S80 почти 67% увеличения скорости, а для S70 этот показатель составил 74%. Благодаря этому S80 превзошел GeForce GTX 1650 и достиг производительности на уровне Arc A310. Результаты S70 оказались сопоставимы с GeForce GTX 1650. В данной игре теперь можно увеличить настройки графики до среднего уровня без существенного влияния на плавность игрового процесса.
Игровой процесс в World of Tanks остается вполне удобным. Однако, производительность моделей S80 и S70 значительно улучшилась на новых драйверах, увеличившись более чем на 83%. Благодаря этому, они превзошли не только Arc A310, но и GeForce GTX 1650 и Radeon RX 6500 XT. В данной игре появилась возможность повысить настройки графики до среднего уровня, при этом обе видеокарты MTT демонстрируют стабильную работу и обеспечивают приятный игровой опыт.
В Monster Hunter: World видеокарты S80 и S70 ранее страдали от периодических задержек и зависаний. В настоящее время этих проблем практически не наблюдается, а благодаря новым драйверам производительность S80 и S70 увеличилась вдвое. S80 приблизился к уровню Radeon RX 6500 XT, превзойдя GeForce GTX 1650 и Arc A310, а S70 также продемонстрировал более высокую производительность по сравнению с GeForce GTX 1650.
В 2023 году было зафиксировано наличие существенных недостатков у карт MTT в данной игровой дисциплине, что приводило к прерывистой перерисовке сцен. Уже год назад ситуация значительно улучшилась, и геймплей стал более плавным, хотя производительность по-прежнему не обеспечивала комфортный уровень. В настоящее время наблюдается заметный прогресс: S80 получил прирост в 2,3 раза (по сравнению с первой версией 230.40), а S70 — в 2,6 раза. S80 практически достиг уровня Arc A380, превзойдя при этом Radeon RX 6500 XT и GeForce GTX 1650, а S70 почти сравнялся с Radeon RX 6500 XT.
До недавнего времени Crysis 3 оставался единственным тестом в нашем наборе, в котором карты MTT показывали результаты, сопоставимые с конкурентами. Изначально игра демонстрировала неплохой абсолютный FPS, однако сопровождалась периодическими задержками и зависаниями, особенно во время вспышек огня (взрывов), когда частота кадров могла снижаться до 10-15. Ситуация улучшилась год назад, что сделало игровой процесс более комфортным, поскольку задержки исчезли, а S80 занял первое место, опередив даже GeForce RTX 3050 (S70 расположился на третьем месте). В настоящее время положение S80 и S70 стало еще более благоприятным, и даже S70 показывает производительность, эквивалентную GeForce RTX 3050. Теперь можно рассмотреть возможность повышения настроек графики в игре.
Выводы
Moore Threads MTT S80/S70 в целом
Несомненно, сам факт выхода компании, стремящейся конкурировать с такими гигантами, как Nvidia, AMD и Intel, уже является положительным моментом. Moore Threads Technology делает акцент исключительно на китайских разработках и собственных технологиях, что объясняет первоначальную настройку и отладку программного обеспечения под китайские игры. К тому же, видеокарты S80/S70, несмотря на внушительный дизайн, в основном рассчитаны на офисные компьютеры для масштабного государственного аппарата Китая, а также для многочисленных бизнес-центров, которым не принципиальны возможности их машин в части запуска трехмерных игр.
Изначально мы указывали, что основной проблемой MTT S70/S80 являются драйверы. Подобная ситуация наблюдалась и с продукцией Intel, которая вышла на рынок настольных ускорителей графики в 2022 году – поначалу она существенно страдала из-за невысокого качества программного обеспечения. Тем не менее, положение дел у Intel значительно улучшилось, оптимизация драйверов продолжается и в настоящее время, и сейчас видеокарты семейства Arc практически во всех современных играх не уступают по производительности и качеству изображения решениям конкурентов, схожим по техническим характеристикам. Однако Intel при разработке драйверов в первую очередь сосредоточилась на современных играх, использующих API DirectX 12 и Vulkan, а оптимизация программного обеспечения под устаревшие технологии была проведена позднее. MTT выбрала альтернативный путь: сначала была обеспечена поддержка старых игр с API DirectX 9, затем последовательно добавлена поддержка DirectX 10, далее приступили к DirectX 11 и даже DirectX 12. Мы не располагаем информацией о причинах такого подхода, поскольку разработчик и его партнеры не взаимодействуют с внешним миром. Другой вероятной причиной является отсутствие сотрудничества MTT с крупными игровыми компаниями, в то время как у AMD, Intel и Nvidia этот канал связи давно существует, и результаты оптимизации очевидны.
Разработчики из Китая способны оказать поддержку в создании игр, предназначенных для внутреннего рынка, что, возможно, объясняет их преобладание в списке совместимости, опубликованном на сайте MTT. Для выхода на международный рынок необходимо сотрудничество с опытными разработчиками, многие из которых базируются в США или Европе, и в этом случае, вероятно, возникнут политические препятствия. В настоящее время специалисты MTT пытаются самостоятельно совершенствовать своё программное обеспечение, используя общедоступные (или не совсем общедоступные) материалы, содержащие информацию о работе API и библиотек. Проведённые тесты продемонстрировали наличие ощутимых результатов: с новыми драйверами производительность обеих видеокарт значительно улучшилась во всех играх, которые мы использовали для тестирования — это известные проекты DX9/DX10/DX11.
Видеокарты MTT S80/S70 демонстрируют вполне удовлетворительную производительность в играх, позволяя запускать некоторые проекты с API DirectX 11 и обеспечивая комфортный игровой процесс в Full HD разрешении при минимальных настройках графики. Однако до уровня продуктов, пользующихся широким спросом, им еще далеко, и предстоит значительная работа по оптимизации драйверов и сопутствующего программного обеспечения (желательно, чтобы была возможность выбора языка интерфейса). Стоит отметить, что даже современная игра, такая как Assassin’s Creed Shadows, успешно запустилась на картах MTT, и в нее можно играть на низких настройках качества.
Moore Threads MTT S80 (16 ГБ)
Новый этап тестирования продемонстрировал, что производительность этой видеокарты в целом достигает и иногда превышает показатели Nvidia GeForce GTX 1650, значительно превосходя Intel Arc A310. Таким образом, наше первоначальное предположение о том, что этот продукт сможет конкурировать лишь с GeForce GTX 1050 Ti или GeForce GTX 1050, оказалось неверным. Вероятно, с дальнейшей оптимизацией и выпуском обновленных драйверов ситуация будет меняться, и S80 сможет приблизиться к уровню Radeon RX 6500 XT (поскольку заявленные характеристики MTT S80 достаточно внушительные).
Начальные тесты продемонстрировали, что карта успешно выполняет аппаратное декодирование видео, однако поддержка OpenCL оказалась недостаточной. В результате, в большинстве программ для видеомонтажа, таких как Adobe Premiere, окна предварительного просмотра не отображались. Повышение производительности произошло год назад с выпуском драйверов версии 270, что позволило использовать предварительный просмотр, хотя и сопровождалось появлением артефактов. Новейшая версия 300.110 предоставила ожидаемые улучшения, и артефакты были устранены.
Мы обратили внимание на то, что видеокарта MTT S80 оснащена довольно тихой системой охлаждения, однако для своего уровня производительности она отличается повышенным энергопотреблением, поскольку графический процессор изготовлен по устаревшей технологии. Кроме того, графический процессор и чипы памяти постоянно работают на высоких частотах, даже в режиме ожидания (потребление энергии после перехода в 2D практически не уменьшается). В случае, если разработчикам удастся внедрить полноценный режим ожидания с заметным снижением частот, энергопотребление также снизится, и тогда можно будет говорить о возможности отключения вентиляторов. Это значительно повысило бы удобство использования видеокарты. Надеемся, что эту проблему удастся устранить в последующих версиях драйверов. И было бы неплохо добавить возможность отключения подсветки для пользователей, которым она будет мешать своим постоянно горящим оранжевым светом».
Moore Threads MTT S70 (7 ГБ)
Ранее мы уже отмечали необычный подход к созданию младшей модели ускорителя: помимо уменьшения объема видеопамяти вдвое по сравнению с более производительной версией, была исключена одна из восьми микросхем, что привело к объему в 7 ГБ вместо 16 ГБ. При этом количество вычислительных блоков у карт практически идентично. Безусловно, 16 ГБ для видеокарты такого класса, как MTT S80, – это избыточный объем (восьми гигабайт было бы вполне достаточно). Однако, возможно, использование 16 ГБ локальной памяти имеет иное объяснение. В любом случае, разница в производительности между S80 и S70 незначительна и, очевидно, не связана с объемом памяти.
В отношении видеокарты необходимо отметить, что к ней применимы все ранее упомянутые характеристики, относящиеся к S80.
Итог
В настоящее время видеокарты MTT не получили широкого распространения и требуют дальнейшей доработки и оптимизации.
Несмотря на это, положительные изменения очевидны. За полтора года общая производительность значительно улучшилась (иногда – в несколько раз!), а проблемы со стабильностью в играх возникают реже, хотя и не исчезли полностью, особенно в проектах, использующих DX11. В настоящее время мы продолжаем оценивать перспективы развития этих продуктов с умеренной надеждой.
Нельзя не похвалить стремление создавать собственные разработки, не опираясь на американские технологии. Наиболее важным преимуществом такого решения является возможность повышения конкуренции, что особенно необходимо в связи с чрезмерно высокими требованиями американских производителей графических процессоров.
Благодарим Владислава Громова из Хабаровска (Telegram-канал)
за помощь в оперативном получении нового оборудования из Китая