видеокарта pny nvidia a100 40gb для чего
Разбираем редкого зверя от Nvidia — DGX A100
Крупные IT-компании располагают дорогими «игрушками», которые скрыты от взоров большинства пользователей. Сегодня мы приоткроем завесу тайны и расскажем про систему, которая оптимизирована для работы с искусственным интеллектом.
Задачи ИИ предъявляют высокие требования к вычислительным и сетевым ресурсам, поэтому наш сегодняшний «гость» приятно порадует своей конфигурацией. Встречайте: NVIDIA DGX A100.
Встречают по одежке
Техника безопасности предписывает использовать механический лифт для работы с сервером
NVIDIA DGX A100 — это стоечный сервер, высотой в 6U и массой более 130 килограмм. Сервер даже в коробке способен повергнуть в легкий трепет. Большой корпус и красивый золотистый цвет притягивают взгляды проходящих мимо коллег.
Сервер прибыл в сопровождении инженера, который оказывал нам как физическую, так и моральную поддержку. Пока наши сотрудники снимали упаковку и готовили инструменты для транспортировки сервера к месту установки, инженер рассказывал интересные факты об этом сервере. Так, техника безопасности предписывает использовать лифт для монтажа в стойку, а для разборки сервера нужно минимум два человека.
Количество портов ввода-вывода на этом сервере зашкаливает
Корпус сервера не открывается сверху. Вместо этого в задней части сервера есть два трея — это составные части сервера, которые содержат «начинку» сервера. Обратите внимание, что винты-фиксаторы треев в шасси окрашены в зеленый цвет, а фиксаторы крышки трея — в черный.
В глаза бросается шесть блоков питания по 3 КВт каждый с возможностью горячей замены. Интересно, что максимальное заявленное энергопотребление — 6.5 КВт. Разгадка проста: блоки питания работают по схеме 3+3, то есть резервирование 2N. Большинство обычных корпусов для GPU предоставляют 4 блока питания и схему 3+1.
На нижнем трее видно десять портов сетевых карт с пропускной способностью до 200 Гбит/с. По умолчанию двухпортовая карта сконфигурирована в режиме Ethernet, а остальные — в режиме Infiniband. Эти сетевые карты используются для объединения нескольких DGX в вычислительный кластер. У нас всего один DGX, поэтому порты не используются.
Один из суперкомпьютеров России, Кристофари, собран из 75 серверов DGX-2, в основе которого лежат графические ускорители предыдущего поколения.
Сперва мы хотели попытаться запустить DGX самостоятельно, но, к сожалению, столкнулись с неожиданной проблемой. Во время пуско-наладочных работ сервер вывел ошибку связи с BMC и раскрутил все вентиляторы до 18 000 оборотов в минуту. При помощи сопровождающего инженера ошибка была устранена, и сервер стал работать в штатном режиме. Даже в процессе стресс-тестирования на такие обороты он больше не выходил.
В ходе тестов было выявлено, что данная крышка не имеет значительного влияния на теплоотвод, вентиляторы сервера отлично справляются со своей работой.
После внешнего осмотра сервер был перенесен на прочный стол и разобран.
Филигранная техника
Специфические коннекторы GPU-трея
Как уже говорилось ранее, сервер состоит из двух треев: CPU и GPU. Каждый трей — это часть сервера, заключенная в свою железную коробку, которая установлена в шасси. Связь между треями, вентиляторами и корзинами на передней панели обеспечивает объединительная плата, установленная в корпусе. В некотором смысле DGX — это классическое blade-шасси, только вместо отдельных серверов (лезвий) устанавливаются части одного сервера.
GPU-трей. Много радиаторов
Вверху находится GPU-трей, занимающий 3U. Он тяжеловат даже для двух человек. На верхней крышке трея также есть предупреждающий знак о тяжести объекта и необходимости работать с ним вдвоем.
В этом трее установлены восемь видеокарт NVIDIA Tesla A100 в модификации 40 GB. Их особенностью является форм-фактор SXM4. Данная версия видеокарты отличается мезонинным исполнением и повышенным тепловыделением: 400 Вт против 300 у PCIe-версии.
Помимо восьми больших радиаторов видеокарт, на трее расположены шесть радиаторов поменьше. Эти радиаторы охлаждают микросхемы, которые реализуют интерконнект видеокарт. Технологии NVLINK и NVSWITCH соединяют восемь видеокарт многосвязной топологией (каждая видеокарта соединена с каждой) с пропускной способностью 600 Гбит/с.
CPU-трей. Здесь тоже много радиаторов
CPU-трей имеет два способа извлечения: полное и частичное.
Во втором случае трей выезжает из шасси чуть больше чем на длину части с PCIe-слотами и фиксируется, а крышка трея открывается вверх. Это позволяет провести работы с сетевыми картами или накопителем для ОС, не извлекая трей целиком.
Со стороны CPU-трей выглядит как обычный 2U сервер без блоков питания. Под большими радиаторами прячется пара процессоров AMD EPYC 7742, суммарно 128 физических ядер или 256 логических. Рядом стоят шестнадцать планок DDR4 с частотой 3200 МГц и объемом 64 ГБ каждая. Суммарный объем оперативной памяти 1 ТБ.
Интересно, что радиаторы процессоров расположены друг за другом, то есть второй процессор охлаждается теплом первого. Тем не менее, с системой охлаждения DGX это выглядит незначительно. Непривычно большие радиаторы заметны и на этом трее. Взаимодействие с GPU-треем создает большую нагрузку на PCIe-мосты, которые тоже требуют охлаждения.
Электронный город
Между слотами находится небольшая плата с максимальной плотностью электронных компонентов. Это выглядит как маленький электронный город. Здесь узнается чип ASPEED, который является «сердцем» BMC-модуля. Помимо этого, здесь есть модули доверенной загрузки, которые обеспечивают безопасность платформы.
Существует «старшая» модификация DGX A100 на 640 ГБ видеопамяти. В ней объем оперативной памяти расширен до 2 ТБ, а также увеличен объем постоянного хранилища.
На этом знакомство с внутренним миром DGX закончено. Давайте посмотрим на него в работе.
Душа титана
Для отображения всех ядер в htop разрешения 203×53 мало
В коробке с DGX лежит флешка, а на флешке — подготовленный образ операционной системы для начала работы. Основой образа является операционная система Ubuntu 20.04.3 LTS с предустановленными драйверами и специальными утилитами.
Сервер, который мы запускаем, прошел длинный путь, в ходе которого был разобран и собран. После транспортировки и манипуляций стоит проверить целостность систем сервера. По регламенту установки операции, сопряженные с первым запуском DGX, должен проводить сопровождающий инженер, но нам было очень любопытно, поэтому все операции проводились совместно.
Часть операций производится через утилиту nvsm, консольный интерфейс для nvidia system management. Всего одна команда проверит «теоретическое» состояние сервера:
Команда проверяет все, до чего может «дотянуться», а именно:
Следующий этап регламента — запуск стресс-теста. Это не только проверит систему в работе, но заодно предоставит нам информацию о максимальном практическом энергопотреблении и температуре на различных компонентах сервера. В этой задаче также помогает утилита nvsm.
Стресс-тест сделан достаточно удобно. Утилита нагружает процессор, видеокарты, оперативную память и постоянное хранилище и начинает отслеживать системные события, температуры, обороты вентиляторов и энергопотребление. Через 20 минут, в конце теста, выводится табличка статистики.
Здесь видно, что температура процессоров и видеокарт не превышала 69 градусов, при этом вентиляторы работали чуть меньше, чем в полсилы. Энергопотребление составило 4.7 КВт, что почти на два киловатта меньше заявленного в спецификации. Впрочем, данный стресс-тест не учитывает десяти внешних сетевых карт, да и наша версия DGX не старшая.
Теперь, когда сервер проверен и готов к работе, хочется провести тесты, чтобы узнать, на что способна эта машина для вычислений. Хотя данный сервер больше предназначен для задач ИИ, желания провести обычные тесты никто не отменял.
Мы начали с GeekBench 5 Compute. К сожалению, данный бенчмарк не задействует интерконнект между видеокартами и тестирует исключительно одно устройство за раз. Тем не менее, с его помощью можно сравнить, насколько SXM4-версия Tesla A100 лучше, чем PCIe-версия.
Категория | PCIe Tesla A100 40G | SXM4 Tesla A100 40G |
---|---|---|
OpenCL | 170137 | 188380 (+11%) |
CUDA | 213899 | 234890 (+10%) |
Категория | PCIe Tesla A100 40G | SXM4 Tesla A100 40G |
---|---|---|
Inference Score | 25177 | 30158 (+20%) |
Training Score | 23775 | 27837 (+17%) |
AI Score | 48952 | 57995 (+19%) |
В качестве тестирования задач ИИ был выбран MLPerf от MLCommons. На сайте NVIDIA упоминается этот тест, а в турнирных таблицах MLPerf встречаются результаты старшей версии DGX A100 за авторством производителя.
Несмотря на наличие инструкции и четкий регламент, большинство тестов не запускалось из-за ошибок в зависимостях Docker-контейнеров. Однако вместе с DGX A100 поставляется контракт на техническую поддержку, который включает в себя в том числе возможность пообщаться с экспертами в области ИИ, а также удаленную помощь с настройкой ПО.
На данный момент у нас нет возможности сравнить DGX A100 с сервером с восемью Tesla A100 без интерконнекта, поэтому тестирование MLPerf пока отложено до момента появления тестового стенда с необходимой конфигурацией.
Заключение
NVIDIA DGX A100 — мощный сервер, призванный ускорить решение задач, связанных с искусственным интеллектом. DGX имеет множество сложных технических нюансов и особенностей, но их нельзя прочувствовать на паре общих тестов производительности. Чтобы узреть настоящую мощь этого сервера, нужно «потрогать» его самостоятельно.
Сервер предоставлен компанией Forsite. Forsite — российский производитель суперкомпьютеров и провайдер решений NVIDIA уровня Elite.
Nvidia выпустила флагманский ускоритель A100 c 80 ГБ памяти
В мае этого года Nvidia представила мощный графический ускоритель под названием A100 с 40 ГБ памяти HBM2e. Карта разработана только для дата-центров. Ею комплектуются фирменные модули Nvidia DGX A100 для вычислительных кластеров, в том числе для суперкомпьютеров. В ноябре были запущены первые инстансы AWS на ускорителях A100 (инстансы EC2 P4d). Судя по всему, это A100 — де-факто самые производительные GPU в мире.
Сейчас представлена новая версия флагманского видеоускорителя, которая оснащается вдвое большим объёмом памяти — 80 гигабайт HBM2e. Это более продвинутый стандарт памяти, у которого увеличена тактовая частота, так что пропускная способность памяти в новой версии доведена до 3,2 Гбит/с на каждый пин, что даёт в сумме пропускную способность всей памяти 2 ТБ/с.
Nvidia не снимает старую модель с производства и будет одновременно продавать 40- и 80-гигабайтные версии. Основные заказчики — клиенты с большими наборами данных для обучения систем искусственного интеллекта. При работе с чрезвычайно большими наборами данных объём памяти является «бутылочным горлышком» в аппаратной части, то есть главным ограничивающим фактором. Таким образом, если графический ускоритель способен сохранить всю нейронную модель в локальной памяти целиком, то потенциально он может быть значительно быстрее, чем тот GPU, которому часто приходится выходить для обмена данными во внешнюю память за пределами платы.
Сравнение первого и второго поколения А100 с 40 и 80 ГБ памяти
Технические характеристики топовых ускорителей Nvidia
A100 (80 ГБ) | A100 (40 ГБ) | V100 | |
Ядер FP32 CUDA | 6912 | 6912 | 5120 |
Макс. частота | 1,41 ГГц | 1,41 ГГц | 1,53 ГГц |
Частота памяти | 3,2 Гбита/с HBM2e | 2,4 Гбита/с HBM2 | 1,75 Гбита/с HBM2 |
Шина памяти | 5120 бит | 5120 бит | 4096 бит |
Полоса пропускания памяти | 2,0 ТБ/с | 1,6 ТБ/с | 0,9 ТБ/с |
VRAM | 80 ГБ | 40 ГБ | 16 ГБ/32 ГБ |
Числа одинарной точности | 19,5 TFLOPs | 19,5 TFLOPs | 15,7 TFLOPs |
Числа двойной точности | 9,7 TFLOPs (1/2 FP32 rate) | 9,7 TFLOPs (1/2 FP32 rate) | 7,8 TFLOPs (1/2 FP32 rate) |
Тензоры INT8 | 624 TOPs | 624 TOPs | N/A |
Тензоры FP16 | 312 TFLOPs | 312 TFLOPs | 125 TFLOPs |
Тензоры TF32 | 156 TFLOPs | 156 TFLOPs | N/A |
Интерконнект | NVLink 3 12 Links (600GB/sec) | NVLink 3 12 Links (600GB/sec) | NVLink 2 6 Links (300GB/sec) |
GPU | GA100 (826 мм 2 ) | GA100 (826 мм 2 ) | GV100 (815 мм 2 ) |
Транзисторов | 54,2 млрд | 54,2 млрд | 21,1 млрд |
TDP | 400 Вт | 400 Вт | 300 Вт/350 Вт |
Процесс производства | TSMC 7N | TSMC 7N | TSMC 12nm FFN |
Интерфейс | SXM4 | SXM4 | SXM2/SXM3 |
Архитектура | Ampere | Ampere | Volta |
Как видим, единственное различие между 40-и 80-гигабайтной версиями A100 заключается в объёме и пропускной способности памяти. Обе модели сделаны на базе графических процессоров GA100 с максимальной тактовой частотой 1,41 ГГц. Аналогично, TDP у двух моделей тоже не отличается.
Вместо этого улучшения A100 сводятся к объёму и большей пропускной способности памяти. Оригинальный A100 оснащался шестью 8-гигабайтными стеками памяти HBM2, причём один из них был отключён. Это давало 40 ГБ памяти с пропускной способностью 1,6 ТБ/с.
В новом A100 сохранилась та же конфигурация 5/6 стеков, но здесь поставили новую память HBM2E. Это неофициальное название для последнего поколения стандарта памяти HBM2 с рекордной пропускной способностью 3,2 Гбит/с на пин. Улучшения в техническом процессе позволили производителю удвоить ёмкость памяти. Конечным результатом является то, что HBM2E предлагает и больше ёмкость, и больше полосу пропускания.
Судя по всему, выпуск новой версии A100 с большей пропускной способностью и большим объёмом памяти является не столько запланированным шагом, сколько побочным эффектом от улучшения техпроцесса. Samsung и SK Hynix совсем недавно начали массовое производство HBM2E.
В A100 сохраняется аппаратное ограничение в 7 инстансов на один ускоритель.
Nvidia выпускает A100 на серверных платах HGX и DGX. Для клиентов, которым нужны отдельные экземпляры ускорителя, по-прежнему предлагаются A100 в исполнении PCIe, хотя в варианте 80 ГБ они пока не доступны.
Конфигурация DGX — это новинка. В такую систему устанавливается восемь ускорителей, так что совокупный объём памяти достигает 640 ГБ.
Также доступна рабочая станция DGX Station A100. Это наследник прежней DGX Station образца 2017 года на ускорителях Volta.
По сути, DGX Station A100 — усечённая наполовину DGX A100 с четырьмя ускорителями A100 и одним процессором AMD EPYC. Энергопотребление пока неизвестно, но на пресс-конференции, заявили, что рабочая станция «работает от обычной розетки». Для сравнения, потребляемая мощность стандартной DGX A100 составляет 6,5 кВт.
Рабочая станция DGX Station A100
Станция DGX использует хладагент, то есть искусственное охлаждение (рефрижерацию), тогда как в DGX Station предыдущего поколения было простое водяное охлаждение. Можно предположить, что возникнет дополнительный шум, связанный с подключением компрессора.
40 ГБ памяти и TDP 250 Вт. Nvidia A100 PCIe — первая графическая карта компании с PCIe 4.0
Это ускоритель вычислений для ИИ
В мае компания Nvidia представила графический ускоритель A100, который ранее назывался бы Tesla A100, но компания решила избавляться от бренда Tesla, чтобы не было путаницы с известным американским автогигантом.
Nvidia A100 основана на монструозном GPU GA100, состоящем из 54 млрд транзисторов. Карта содержит 6912 ядра CUDA (из 8192 ядер, имеющихся в GPU) и обеспечивает производительность 19,5 TFLOPS (FP32) либо 9,7 TFLOPS (FP64). При этом представленная в мае A100 имеет форм-фактор SMX. И вот сегодня, согласно данным источника, Nvidia представила A100 PCIe, то есть версию с соответствующим интерфейсом. При этом речь идёт о PCIe 4.0, и это первый графический адаптер компании с этим интерфейсом и соответствующим исполнением.
Несмотря на практически идентичные названия, карты очень сильно отличаются. Сама Nvidia утверждает, что версия PCIe при постоянной нагрузке на 10-50% менее производительна, чем версия SXM, хотя пиковые показатели одинаковы. TDP новой модификации составляет всего 250 Вт, тогда как карта SXM характеризуется значением 400 Вт. Не уступает старшей сестре новая версия и по объёму памяти. Это всё те же 40 ГБ HBM2. Конфигурация GPU также осталась неизменной.
Скорее всего, Nvidia A100 PCIe будет ощутимо дешевле версии SXM, но пока цен мы всё равно не знаем.
NVIDIA A100 NVIDIA A100
Part No. TCSA100M-PB
EAN: 3536403378035
The NVIDIA A100 Tensor Core GPU delivers unprecedented acceleration at every scale for AI, data analytics, and HPC to tackle the world’s toughest computing challenges. As the engine of the NVIDIA data center platform, A100 can efficiently scale up to thousands of GPUs or, using new Multi-Instance GPU (MIG) technology, can be partitioned into seven isolated GPU instances to accelerate workloads of all sizes. A100’s third-generation Tensor Core technology now accelerates more levels of precision for diverse workloads, speeding time to insight as well as time to market.
PNY provides unsurpassed service and commitment to its professional graphics customers offering: 3 year warranty, pre- and post-sales support, dedicated Quadro Field Application engineers and direct tech support hot lines.
PART NUMBER AND EAN | TCSA100M-PB | EAN: 3536403378035 |
NVLA100-2SLOT-3PCK | EAN: 3536403378189 |
Peak double precision floating point performance
Peak single precision floating point performance
Peak half precision
Max power consumption
Weight (w/o extender)
NVLA100-2SLOT-3PCK EAN: 3536403378189
RoHs, Reach and CE certificates available on Professional PNY partner portal
Характеристики видеокарты PNY Nvidia A100 40GB (TCSA100M-PB)
PNY | ||
Производитель видеопроцессора Фирма-производитель процессора для видеокарты Тип – рекомендация производителя видеокарты, указывающая сферу ее использования. Это не жесткое ограничение, а всего лишь пожелание разработчика. Профессиональные видеокарты предназначены для работы в высокопроизводительных программах для 3D-моделирования и т.д.. Офисные/игровые видеокарты изначально предназначались для решения повседневных задач: работы в различных редакторах и отрисовки виртуального мира в 3D играх. Сейчас граница между игровыми и профессиональными картами размыта. Для некоторых современных игр требуется более производительная видеокарта, чем для профессионального 3D-моделирования. Разъем для подключения видеокарты к материнской плате. AGP – устаревший интерфейс, который сейчас довольно сложно найти. PCI-Express (PCI-E) – современный высокоскоростной интерфейс передачи данных. Существуют также разные типы разъема и стандарты PCI-E. Стандарты PCI Express: | PCI-E 16x 4.0 | |
Количество занимаемых слотов Количество слотов задней панели корпуса компьютера, которые необходимы видеокарте. | 2 | |
Необходимость дополнительного питания Необходимость обеспечивать видеокарту дополнительным питанием помимо того, которое она получает через интерфейс ее соединения с материнской платой (PCI-E или AGP). В основном для питания видеокарт используются 6-pin или 8-pin коннекторы. Графический процессорНазвание процессора, установленного на видеокарте. Кодовое название процессора | GA100 | |
Частота графического процессора, МГц Тактовая частота графического процессора, установленного на видеокарте. Чем выше данный показатель, тем быстрее работает видеокарта. | 800 | |
Количество графических процессоров С увеличением числа процессоров производительность видеокарты растет пропорционально. Техпроцесс – размер одного транзистора, из которых состоит процессор. Чем он меньше, тем больше элементов можно разместить на кристалле видеопроцессора, то есть создать более сложную и более производительную архитектуру. Оперативная видеопамятьОперативная память необходима видеокарте для хранения полученных в результате вычисления данных. Чем выше ее объем, тем больше данных можно хранить в локальной памяти видеокарты, не выгружая их в медленную оперативную память. Очень часто важность данного параметра переоценивают, считая его основным критерием быстродействия. Это далеко не так. Зачастую увеличение объема памяти не приводит к сколь-нибудь заметному приросту производительности. Но и недооценивать данный параметр нельзя – при недостатке видеопамяти производительность может проседать. На данный момент видеопамяти, размером 2Гб вполне достаточно для большинства современных видеоигр. Тип памяти – определяет максимальную рабочую частоту и пропускную способность видеопамяти. GDDR3 и GDDR5 – основные модели графической памяти, представленные сейчас на рынке, поскольку GDDR4 – в момент выхода практически ничем не отличалась (кроме цены) от популярной на тот момент GDDR3 и быстро ушла с рынка, а GDDR и GDDR2 сейчас считаются сильно устаревшими. GDDR5 – самая последняя версия памяти стандарта GDDR, отличается от GDDR3 повышенной теоретической пропускной способностью и возможностью работать на повышенных частотах. Следует также отметить, что существуют различные модели памяти типа GDDR5 (с различными параметрами и стоимостью), что позволяет использовать ее на большинстве выпускаемых ныне видеокарт. GDDR3 значительно уступает GDDR5 по характеристикам и постепенно уходит в тень своего прямого конкурента. *Пропускная способность памяти индивидуальна в каждом случае и зависит от ее частоты и размера шины памяти. | HBM2 | |
Частота оперативной памяти, МГц Частота видеопамяти важный параметр, напрямую влияющий на пропускную способность памяти. Чем выше частота, тем выше пропускная способность, а, соответственно, и производительность. Шина памяти – интерфейс, соединяющий память и процессор видеокарты. Чем больше разрядность шины (в битах), тем больше данных можно передать за 1 цикл. Размер шины – крайне важный параметр, влияющий на пропускную способность памяти видеокарты, чем он выше, тем больше ее пропускная способность. Шейдеры и вычислительные блокиШейдер – программа, выполняющая обработку изображения, представляемого пользователю. Существуют различные типы шейдеров: вершинные, геометрические, пиксельные. Чем выше версия шейдеров, тем проще разработчикам создавать реалистичную графику, поскольку с каждой новой версией появляется поддержка более сложных и красивых видеоэффектов. Для того чтобы иметь возможность играть в ту или иную игру нужно убедиться, что Ваша видеокарта поддерживает версию шейдеров, на которой написана игра. Все современные видеокарты поддерживают версию шейдеров 5.0, необходимую для современных видеоигр. Версии 4.0 и 4.1 сейчас считаются устаревшими и пригодны только для старых 3D игр. Частота шейдерных блоков – крайне важная характеристика быстродействия видеокарты. Чем выше данный показатель, тем быстрее будут производиться операции по отрисовке изображения, то есть уровень FPS (количество кадров в секунду) будет выше. | 1280 | |
Число универсальных (шейдерных) процессоров Наряду с частотой шейдерных блоков число универсальных (шейдерных) процессоров оказывает большое влияние на производительность видеокарты. Чем выше данный показатель, тем большее количество параллельных вычислений (не обязательно шейдерных) может производить видеокарта. Блоки растеризации осуществляют финальный этап обработки изображения (сглаживание и пр.). С увеличением их числа уменьшается вероятность того, что последний этап обработки будет узким местом в производительности видеопроцессора. Количество блоков растеризации, как правило, рассчитывается производителем оптимальным образом для того, чтобы их было достаточно для заключительного этапа обработки изображения. Текстурные блоки занимаются обработкой текстур (обычно это простые 2D изображения), необходимых для отрисовки картинки. Чем больше блоков, тем выше текстурная производительность. ОхлаждениеВ системах с пассивным охлаждением для отвода тепла, выделяемого видеопроцессором используется радиатор. При активном охлаждении к радиатору добавляется еще и вентилятор. | пассивное | |
Дизайн системы охлаждения | референсный | |
Количество вентиляторов Количество вентиляторов, используемых для охлаждения видеокарты. Водяное охлаждение значительно эффективнее воздушного, что позволяет эксплуатировать видеокарту на повышенных частотах. Поддержка стандартов и технологийDirectX – прикладное программный интерфейс (библиотека, используемая программистами для разработки), который позволяет взаимодействовать с видеокартой. Данная библиотека используется исключительно при работе на ОС Microsoft Windows. В каждой новой версии DirectX появляются дополнительные возможности, упрощающие разработку игр и графических приложений, а также оптимизирующие производительность. То есть чем выше поддерживаемая версия DirectX, тем большее количество игр (графических программ) Вам удастся запустить, плюс будет выше производительность в играх, разработанных под предыдущие версии DirectX. Также стоит отметить, что ОС может не поддерживать версию DirectX видеокарты. Работать видеокарта, конечно, будет, но никаких преимуществ от ее использования Вы не получите. OpenGL (Open Graphics Library) можно условно считать прикладным программным интерфейсом (также как и DirectX) при разработке графических программ и 3D игр. Но OpenGL поддерживается всеми ОС, а не только Windows (как в случае с DirectX). Чем выше поддерживаемая версия OpenGL, тем большее количество игр (графических программ) Вам удастся запустить, плюс будет выше производительность в играх, разработанных под предыдущие версии OpenGL. SLI/CrossFire – технологии, позволяющие объединять вычислительные мощности 2-х видеокарт и получать прирост производительности. SLI – технология, используемая в видеокартах NVIDIA, CrossFire – в картах AMD(ATI). Как правило, на современных устройствах при правильном подключении наблюдается почти линейный прирост производительности. То есть при подключении 2-х одинаковых видеокарт прирост производительности будет почти двукратным (по сравнению с одной видеокартой). CrossFireX позволяет одновременно использовать до 4 видеокарт AMD и получать прирост производительности. 3-Way SLI позволяет объединять 3 видеокарты NVIDIA и получать при этом прирост производительности. Quad SLI позволяет объединять 2 двухпроцессорные видеокарты NVIDIA и получать при этом прирост производительности. | нет | |
Поддержка AMD APP (ATI Stream) AMD APP (бывшая ATI Stream) – технология, позволяющая использовать вычислительные мощности видеокарты AMD для неграфических вычислений (например, для конвертации видео). Мощные карты, поддерживающие AMD APP могут дать более чем двукратный прирост производительности в программах, оптимизированных под данную технологию. CUDA – технология (аналогичная AMD APP), позволяющая использовать вычислительные мощности видеокарты NVIDIA для неграфических вычислений (например, для конвертации видео). Мощные карты, поддерживающие CUDA могут дать более чем двукратный прирост производительности в программах, оптимизированных под данную технологию. | есть | |
Поддержка TurboCache/HyperMemory Технологии TurboCache (на картах NVIDIA) и HyperMemory (на AMD) позволяют параллельно со встроенной памятью использовать часть оперативной памяти компьютера для хранения данных. На современных видеокартах она не применяется ввиду низкой эффективности. При помощи данной технологии защищают, в основном, лицензионные Blu-ray диски от копирования. Для передачи сигнала с Blu-ray диска на устройство вывода необходимо чтобы оно (в прочем, как и видеокарта) поддерживало данную технологию. По задумке разработчиков это должно было предотвратить незаконное копирование информации. Хотя в действительности этого не произошло, поскольку технология была взломана. Технические характеристики
Возможность работы с несколькими мониторами позволяет пользователю выводить на каждый из них различное изображение. Стоит отметить, что существуют видеокарты, которые не поддерживают вывод картинки вообще, они предназначены для вычислений. FSSA (Full Scene Anti-Aliasing) – технология, обеспечивающее сглаживание изображения. Чем выше поддерживаемая степень сглаживания, тем изображение более четкое и ровное. Увеличение степени сглаживания сильно сказывается на производительности видеокарты, поэтому рекомендуется уменьшать данную настройку в играх по максимуму, до оптимального для Вас качества изображения. | 16x | |
Максимальная степень анизотропной фильтрации Анизотропная фильтрация – технология, используемая для обработки текстур (изображений, которые накладываются на 3D-объекты). При помощи данной технологии качество картинки становится значительно реалистичнее. Чем выше степень поддерживаемой видеокартой анизотропной фильтрации, тем выше качество сцен. Разрешение – количество пикселей (точек) по горизонтали и вертикали, которые составляют изображение. Например, разрешение 1920х1080 говорит о том, что изображение по горизонтали описывается при помощи 1920 точек, а по вертикали – 1080, что дает примерно 2 млн точек (необходимо умножить 1920 на 1080), представляющих выводимую картинку. Чем выше поддерживаемое разрешение, тем более реалистичной будет картинка. Но для этого необходимо, чтобы устройство вывода видео (монитор, телевизор и т.д.) поддерживали данное разрешение. RAMDAC (Random Access Memory Digital to Analog Converter) – устройство преобразующее цифровой сигнал с видеокарты в аналоговый (для вывода на монитор). Почти все видеокарты имеют частоту RAMDAC 400 МГц, которой вполне достаточно для вывода изображения любого доступного на данный момент разрешения. РазъемыVGA (D-Sub) используется для передачи аналогового видеосигнала на монитор. При передаче данных возможно наличие шумов на видео. На данный момент устарел (вытесняется HDMI, DVI и пр.), используется для совместимости со старыми устройствами вывода видеоинформации (мониторы, проекторы и пр.). DVI (Digital Visual Interface – цифровой видео интерфейс) используется для передачи цифрового видеосигнала на устройства вывода (мониторы, проекторы и пр.). На видео нет помех и шумов. HDMI (High Definition Multimedia Interface – мультимедиа интерфейс высокой четкости) используется для передачи цифровых сигналов видео и аудио через единый кабель. В основном применяется для подключения к телевизорам. Поддерживает защиту от нелегального копирования. Mini HDMI аналогичен разъему HDMI, но с несколько уменьшенными габаритами. | 0 | |
Количество разъемов Micro HDMI Micro HDMI аналогичен разъему HDMI, но с миниатюрными габаритами. | 0 | |
Количество разъемов DisplayPort DisplayPort — стандарт интерфейса для передачи аудио и видео сигналов на цифровые дисплеи (в основном на мониторы). Displayport имеет на данный момент самую большую пропускную способность, но в большинстве случаев это ни к чему. DisplayPort использовался для передачи видеосигнала в Mac устройствах, но вскоре был вытеснен интерфейсом Thunderbolt (имеющим одинаковый с DisplayPort внешний вид и обратную совместимость). Сейчас в основном устанавливается на профессиональных видеокартах (для работы с графикой). | 0 | |
Количество разъемов Mini DisplayPort Mini DisplayPort аналогичен разъему DisplayPort, но с несколько уменьшенными габаритами. VIVO (Video Input Video Output) позволяет принимать картинку со старых аналоговых устройств и/или выводить ее на эти устройства. Интерфейс представляется на видеокарте в виде S-Video. К устройству вывода, как правило, подключают композитный коннектор RCA (тюльпан). На современных видеокартах не устанавливается. TV-out на видеокарте обычно представляется в виде интерфейса S-Video и позволяет подключить видеокарту напрямую к старым телевизорам для вывода на них информации (по большому счету, это VIVO без возможности принимать сигнал). На современных видеокартах не устанавливается. | 0 | |
Количство компонентных выходов Компонентный выход также как и TV-out подключается по интерфейсу S-Video, но обеспечивает более высокое качество изображения. Использовался для подключения старых телевизоров высокой четкости, поэтому на современных видеокартах не устанавливается. РазмерыНизкопрофильную (Low Profile) видеокарту можно установить в компактные компьютерные корпуса (Slim-Desktop, Small Form Factor). Обычно в комплекте с низкопрофильной видеокартой идет переходник, позволяющий установить ее в стандартный корпус.
|