Новий ривок продуктивності NVIDIA GPU

З великої програми осінньої конференції NVIDIA GTC 2022 Fall народна увага вихопила анонс десктопних прискорювачів RTX 4080 і 4090 - не обговорювати ж програмне забезпечення, середовище розробки та професійні GPU. Але саме платформи NVIDIA для дата-центрів забезпечують постійний приріст продуктивності понад закон Мура, а програми HPC/AI отримують нові проривні можливості.

Новинки побудовані на графічному процесорі Ada Lovelace, який прийшов на зміну ядру Ampere та, пишуть, у рази підніме продуктивність у ряді прикладних завдань. Всі оголошені масові та спеціалізовані акселератори почнуть відвантажуватись у четвертому кварталі 2022 року, включаючи топовий H100 з ще весняного анонсу.

Небожителі та миряни

Навесні цього року NVIDIA підняла ставки в центрах обробки даних, представивши нову архітектуру Hopper та графічний процесор H100 для робочих навантажень високопродуктивних обчислень та штучного інтелекту. H100 виробляється за технологією TSMC 4 нм, у ньому 80 мільярдів транзисторів - на 68 відсотків більше, ніж у 7 нм графічного процесора A100 попереднього покоління (Ampere). H100 - перший графічний процесор з підтримкою PCIe Gen5, перший з використанням HBM3 та пропускною здатністю пам'яті 3 ТБ/с.

Новий ривок продуктивності NVIDIA GPU

Прискорювач випускається у двох форм-факторах: SXM5 з пам'яттю 80 ГБ HBM3 та заявленим TDP 700 Вт, та у вигляді карти розширення PCIe 5.0 c 80 ГБ пам'яті HBM2e та енергоспоживанням 350 Вт.

Новий ривок продуктивності NVIDIA GPU

H100 прискорює навчання до 9 разів, інференс до 30 разів, додатки HPC до 7 разів, порівняно з попереднім поколінням A100.

Новий ривок продуктивності NVIDIA GPU

Поки що є лише оціночні судження про майбутню ціну H100, але можна припустити, що топові акселератори будуть дорожчими за нинішній флагман A100 (~$15K) відповідно до приросту продуктивності.

За такого розльоту цін NVIDIA реалістично дивиться на ринок і залишає (не знижуючи прайсу) у виробництві A100 – для щільного заповнення продуктової вертикалі. Не тому що є користувачі «багаті» та «бідні», а через розшарування попиту. Схоже, NVIDIA поділяє свої графічні процесори на ті, які призначені для масштабних обчислень HPC/AI (H100 і почасти A100) і ті, що в першу чергу призначені для прискорення графіки. Нижче A100 у поточній лінійці GPU для робочих станцій та серверів розташовувалися A6000 (з активним охолодженням) та A40 (з пасивним охолодженням – для дата-центрів). Їм на зміну йдуть RTX 6000 та L40. Зупинимося на них докладніше - як продуктах, що увійдуть і в наше неритмічне життя.

RTX 6000

Новий ривок продуктивності NVIDIA GPU

Маркетологи NVIDIA дивують із неймінгом. Треба бути пильним, щоб не сплутати RTX 6000 Ada з одним із його попередників:

NVIDIA Quadro RTX 6000 (архітектура Turing)
NVIDIA RTX A6000 (Ampere)
NVIDIA RTX 6000 (Ada Lovelace)

Інженери, навпаки, показали клас: цей GPU з 48 ГБ пам'яті ECC займає два слоти і споживає лише 300 Вт - проти 450 Вт у трислотового ігрового RTX 4090 з 24 ГБ non-ECC.

Servethehome зібрав характеристики RTX 6000 Ada в одну таблицю:

Новий ривок продуктивності NVIDIA GPU

Сама NVIDIA не балує подробицями на своєму сайті, обмежуючись загальними порівняннями RTX 6000 Ada з попередником RTX A6000. Як і A100, A6000 теж залишаються у виробництві. На відміну від змінників, A6000 можна спарювати містками NVLink – у завданнях, де є ефект від поєднання просторів графічної пам'яті.

L40

Новий ривок продуктивності NVIDIA GPU

Цей GPU за характеристиками ідентичний RTX 6000 Ada, тільки йде з пасивним охолодженням і призначений для дата-центрів - високощільних GPU-серверів. Як і у попередника A40 (Ampere), він має 48 ГБ графічної пам'яті ECC і енергоспоживання 300 Вт.

Новий ривок продуктивності NVIDIA GPU

L40 витіснить A40 продуктивністю: обіцяють дворазове прискорення трасування променів проти покоління Ampere.

The winner takes it all

Геймери залишилися незадоволені тим, що відеокарти RTX 4090 заявлені значно дорожче, ніж коштували топові моделі попереднього покоління на момент їх появи. Вони посилаються на закон Мура - по суті, емпіричне спостереження про подвоєння кількості транзисторів процесорів за два роки при одночасному падінні ціни з підвищенням продуктивності. Глава NVIDIA Джесен Хуанг зауважив , що «закон Мура мертвий», у новій реальності старі очікування не працюють і не варто розраховувати, що відеокарти дешевшатимуть з часом. Ще більшою мірою це стосується інструментів бізнесу.

Незадоволені не лише кінцеві користувачі. У середині вересня провідний виробник відеокарт EVGA подав на розлучення. Компанія заявила , що припиняє співпрацю з NVIDIA через зневажливе ставлення за понад 20 років партнерства. Керівництво EVGA стверджує, що NVIDIA не ділилася інформацією про продукти і не надавала інформацію для інженерів, що оновлюється, в оперативному режимі. Своє майбутнє EVGA бачить у бізнесі блоків живлення та материнських плат – більш передбачуваному та прибутковому.

Останнє багато що пояснює. Динаміка розподілу прибутку між NVIDIA та її виробничими партнерами показує, куди йде компанія – до консолідації розробки та продажу.

Новий ривок продуктивності NVIDIA GPU