- Почему компания Nvidia назвала архитектуру своих видеокарт именем Ады Лавлейс?
- Отличия в производительности видеокарт RTX 4000
- Какие особенности имеет архитектура Ada Lovelace видеокарт Nvidia?
- Какие технические характеристики имеет видеокарта NVIDIA GeForce RTX 4090?
- Какие аппаратные особенности имеют видеокарты NVIDIA GeForce RTX 4090?
- Сравнение производительности видеокарт 3000 и 4000 серий
- Производительность видеокарт Gigabyte RTX 4000 в играх
Почему компания Nvidia назвала архитектуру своих видеокарт именем Ады Лавлейс?
Ада Лавлейс — выдающаяся женщина-математик, которая в начале XIX века помогла улучшить/запрограммировать компьютер Чарльза Бэббиджа, а также придумала такие понятия, как цикл и рабочая ячейка.
В связи с этим Ада Лавлейс считается самым первым известным программистом в истории.
Имя «Ада Лавлейс» в новой архитектуре видеокарт NVIDIA продолжает традицию компании использовать имена выдающихся ученых, внесших значительный вклад в математику, физику и электротехнику (ранее это были Ферми, Максвелл, Паскаль, Тьюринг, Ампер, Тесла и теперь ловелас).
Отличия в производительности видеокарт RTX 4000
Мы ранжировали видеокарты по уровню производительности, от самого высокого до самого низкого, а ниже сравнили их по производительности.
- GIGABYTE NVIDIA GeForce RTX 4090 ИГРОВАЯ
Бесспорный флагман самого мощного потребительского графического процессора в мире.
- GIGABYTE NVIDIA GeForce RTX 4080 ИГРОВАЯ
Ближайший последователь — 4090.
- GIGABYTE NVIDIA GeForce RTX 4070Ti ИГРОВАЯ
Золотая середина цены и качества.
- GIGABYTE NVIDIA GeForce RTX 4070 ИГРОВАЯ
Оптимальный уровень для игр в разрешении 2К.
- GIGABYTE NVIDIA GeForce RTX 4060Ti ИГРОВАЯ
Лучший вариант для игр на ультра настройках в Full HD.
- GIGABYTE NVIDIA GeForce RTX 4060 ИГРОВАЯ
Самый доступный представитель 4000-й серии. Дает возможность опробовать новые технологии.
Какие особенности имеет архитектура Ada Lovelace видеокарт Nvidia?
Архитектура видеокарт Nvidia Ada Lovelace имеет ряд преимуществ по сравнению с предыдущей (Amperes):
- количество транзисторов (вычислительных ядер) на единицу площади значительно увеличилось. Это позволило увеличить частоту их работы и производительность, что снизило расход;
- используются новые RT-ядра и более быстрая (примерно в два раза) прорисовка тензорных лучей;
- за счет добавления технологии Shader Execution Reordering увеличена производительность шейдерных ядер, что особенно эффективно в приложениях/играх, использующих трассировку лучей;
- добавлена поддержка технологии NVIDIA DLSS 3. Это совершенно новый ускоритель оптического потока и генератор кадров AI, который увеличивает рендеринг в 2-4 раза.
Полный кристалл AD102 содержит:
- 12 графических кластеров (GPC);
- 72 текстурных кластера (TPC);
- 144 потоковых мультипроцессора (СМ). Каждый включает 128 ядер CUDA, одно ядро RT, 4 тензорных ядра, 4 текстурных блока, регистровый файл размером 256 КБ и кэш L1 объемом 128 КБ;
- 288 FP64-битных ядер (по два на SM);
- 384-битная шина памяти с 12 32-битными контроллерами.
Блок-схема микросхемы AD102 со всеми устройствами:
Видеокарта серии 4000 с «необрезанным» графическим процессором AD102 содержит:
- 18432 ядра CUDA;
- 144 ядра RT;
- 576 тензорных ядер;
- 576 текстурных блоков.
Одна графическая группа с видеокартой серии 4000 (графический процессор AD10x) включает 6 TPC, 12 SM и 16ROP:
Сравнение чипов AD102 и TU102 (серия RTX2000):
Сравнение чипов AD102 и GA102 (серия RTX3000):
Читайте также: Почему ⧼Не обновляется Xiaomi⧽
Какие технические характеристики имеет видеокарта NVIDIA GeForce RTX 4090?
Характеристики графики NVIDIA GeForce RTX 4090 (по сравнению с графикой Nvidia GeForce RTX 3090):
- Дата начала производства: 12.10.2022 (01.09.2020);
- Графический процессор – AD102-300-A1 (GA102-300-A1);
- Архитектура – Ада Лавлейс (Ампер);
- Техпроцесс, нм — 5 (8);
- Количество транзисторов, млрд – 76,3 (28,3);
- Площадь кристалла, мм² – 608 (628);
- Количество потоковых мультипроцессоров (SM Count) – 128 (82);
- Количество шейдерных ядер (Shading Units) – 16384 (10496);
- Количество единиц ТМУ/РОП – 512/192 (328/112);
- Рабочая частота графического процессора, МГц – 2235-2520 (1395-1695);
- Производительность FP32, терафлопс — 82,58 (35,58);
- Производительность FP64, GFLOPS – 1290 (556);
- Объем видеопамяти, ГБ – 24;
- Тип видеопамяти – GDDR6X;
- Тактовая частота памяти, МГц/эффективная частота, Гбит/с — 1325/21,2 (1219/19,5);
- Разрядность шины памяти, бит – 384;
- Кэш L2/L3, МБ — 96/- (6/-);
- Пропускная способность памяти, ГБ/с – 1018 (936,2);
- Поддержка CUDA/OPENCL — 8,9/3,0 (8,6/3,0);
- Теоретический хешрейт на алгоритме ethash, MH/s (по производительности VRAM) — 127 (117);
- TDP, Вт – 450 (350);
- Теоретическая энергоэффективность, МГ/с на Вт, не хуже 0,28 (0,33).
Графические процессоры серии 4000 созданы с использованием 5-нм техпроцесса (TSMC 4N), что является большим шагом вперед по сравнению с видеокартами Ampere серии 3000, которые были изготовлены по 8-нм технологии.
В процессе TSMC 4N используется точный размер полупроводникового кристалла 5 нм, но с различными улучшениями по сравнению с эпохой 5N (фактический 4-нм процесс будет называться TSMC N4).
Интересно отметить, что GeForce RTX 4090 использует только 128 ядер SM из максимальных 144. Таким образом, через некоторое время должны появиться видеокарты GeForce RTX 4090Ti/Titan со всеми 144 потоковыми процессорами. Вычислительная производительность титановой видеокарты будет на 10-15% выше, чем у обычной модели.
Размер высокоскоростного кэша L2 у GeForce RTX 4090 увеличился в 16 раз — с 6 до 96 мегабайт!
Вероятно, это связано с необходимостью отреагировать на преимущества видеокарт AMD, связанные с технологией Infinity Cash/Smart Access Memory.
Какие аппаратные особенности имеют видеокарты NVIDIA GeForce RTX 4090?
Для использования видеокарт серии NVIDIA 4000, особенно GeForce RTX 4090, необходимо использовать следующие драйверы:
- на компьютерах под управлением Windows – не старше версии 522.06;
- на ПК под управлением Linux – 520.61.05 или новее.
Видеокарты серии NVIDIA GeForce RTX 4000 имеют аппаратную поддержку Compute Capability 9.0 (видеокарты NVIDIA Hopper и NVIDIA Ada Lovelace), реализованную в наборе инструментов CUDA, начиная с версии 11.8.
В них использован улучшенный алгоритм взаимодействия с центральным процессором компьютера, оптимизирована работа многопроцессорной системы, а также ряд других улучшений:
Для питания RTX4090 Founders Edition используется 12-контактный разъем (Molex Micro-Fit 3.0) для дополнительного питания:
Назначение разъемов дополнительного питания RTX4000 аналогично схеме, протестированной на эталонном RTX3000:
Теоретически разъем Molex Micro-Fit 3.0 может выдавать мощность до 600 Вт с проводами 16AWG. RTX4090 может использовать адаптеры с проводами 18AWG, обеспечивающие мощность 500 Вт.
Поскольку 4090 потребляет не более 450 Вт, использование 12-контактного разъема вдоль вспомогательного шнура питания обеспечивает хорошее питание. В связи с этим некоторые производители видеокарт могут использовать в своих продуктах два стандартных разъема питания 6+2-pin, которые способны выдавать мощность до 450 Вт (два по 225 Вт каждый).
Для подключения GeForce RTX4090 к блоку питания необходимо использовать переходники с 3-4 отводами на 6+2-контактные разъемы, так как при использовании переходников с двумя отводами через провода/соединения разъемов будет проходить слишком большой ток.
Отличия мощного 450-ваттного (слева) и более слабого 350-ваттного (справа) адаптеров питания для мощных 12-контактных видеокарт:
Система питания типичных видеокарт Nvidia RTX 4090 использует 23 фазы питания, что обеспечивает очень стабильную работу:
Сравнение производительности видеокарт 3000 и 4000 серий
Результаты взяты с сайта https://technical.city/ru и основаны на выполнении 7 тестов:
- Постоянный персонаж
- Производительность 3DMark Vantage
- 3DMark 11 Производительность графического процессора
- Оценка огневого удара 3DMark
- Графический процессор 3DMark Cloud Gate
- Графика 3DMark Fire Strike
- Графический процессор 3DMark Ice Storm
За 100 была принята самая плодовитая карта из серии 4000.
Сравнение видеокарт серий 4090 и 3090
Сравнение видеокарт серий 4080 и 3080
Сравнение видеокарт серий 4070 и 3070
Сравнение видеокарт серий 4060 и 3060
Производительность видеокарт Gigabyte RTX 4000 в играх
Чтобы наглядно показать разницу в производительности видеокарт RTX 4000, мы протестировали их в пяти популярных играх.
Испытательный стенд
- Процессор Intel Core i9-13900K
- Материнская плата MSI MPG Z790 EDGE WIFI
- Оперативная память DDR5 G.Skill Trident Z5 RGB 6600 МГц
- Твердотельный накопитель (SSD) Samsung 1 ТБ 980 PRO
- Блок питания 1,25 кВт CoolerMaster MWE Gold V2
Наследие Хогвартса: количество кадров в секунду (FPS) на видеокартах RTX 4000
Forza Horizon 5: количество кадров в секунду (FPS) на видеокарте RTX 4000
Cyberpunk 2077: количество кадров в секунду (FPS) на видеокарте RTX 4000
A Plague Tale: Requiem: количество кадров в секунду (FPS) на видеокарте RTX 4000
Ratchet & Clank Rifr Apart: количество кадров в секунду (FPS) на видеокартах RTX 4000