NVIDIA представила графический процессор Ampere и рассказала о планах на него

 | 11.00

NVIDIA A100

Компания NVIDIA анонсировала графический процессор с архитектурой Ampere. Сфера применения ускорителей с архитектурой Ampere — это не только системы искусственного интеллекта, но и анализ «больших данных», научные расчёты и облачная графика.

NVIDIA A100 выпускается по 7-нм технологии компанией TSMC и содержит более 54 млрд транзисторов на площади 826 мм . Шесть стеков памяти типа HBM2 производства Samsung совокупным объёмом 40 ГБ с пропускной способностью 1,6 ТБ/с. Ядра CUDA разделились по специализации: для вычислений с плавающей запятой двойной точности (FP64) отведено 3456 штук, одинарной (FP32) — 6912 штук. Количество тензорных ядер достигло 432 штук, предусмотрены и потоковые мультипроцессоры в количестве 108 штук.

NVIDIA утверждает, что обучение нейронных систем с применением графических процессоров происходит в 20 раз быстрее по сравнению с предшественниками.

Пиковая производительность A100 в обучаемых системах при использовании вычислений с плавающей запятой одинарной точности (FP32) достигает 312 терафлопс, это в двадцать раз выше, чем у Volta. Целочисленные операции (INT8) в системах, способных делать логические выводы, Ampere выполняет со скоростью 1,248 трлн штук в секунду. Отрыв от Volta тоже двадцатикратный. Наконец, в высокопроизводительных операциях с двойной точностью (FP64) новинка NVIDIA оказывается в два с половиной раза быстрее предшественницы.

Каждый графический процессор Ampere поддерживает двенадцать каналов NVLink 3.0. Впервые в серверном сегменте NVIDIA предлагает продукт с поддержкой PCI Express 4.0, им как раз является графический процессор A100. Кроме того, технология виртуализации MIG позволяет разделять ресурсы одного графического процессора на семь независимых сегментов.

Серийное производство графического процессора A100 уже началось, ускорители на его основе поставляются клиентам.

NVIDIA A100

Более того, исполнительный директор NVIDIA, Дженсен Хуанг (Jensen Huang) подтвердил, что новейшая архитектура Ampere появится на рынке как в ускорителях для центров обработки данных, так и в видеокартах для рядовых потребителей.

Это фактически подтверждает большинство слухов о том, что видеокарты на базе Ampere будут выпущены на рынок и в рамках потребительской серии GeForce. Напомним: в предыдущем поколении было иначе: серии Volta и Turing были разделены на профессиональные и игровые направления соответственно.

Ускорители Tesla, вероятно, сосредоточатся на блоках, наиболее востребованных в вычислительных нагрузках и ИИ (FP8/FP16 и FP64), в то время как игровая серия может выиграть от более быстрых блоков FP16/32.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *