Тест GPGPU

XE Product imageBE Product imageEE Product image

Ця контрольна панель, яку можна запустити з інструментів | GPGPU Benchmark пропонує набір тестів OpenCL GPGPU. Вони призначені для вимірювання обчислювальної продуктивності GPGPU за допомогою різних робочих навантажень OpenCL. Кожен окремий тест можна запускати на до 16 графічних процесорах, включаючи графічні процесори AMD, Intel і NVIDIA, або на їх комбінації. Звичайно, повністю підтримуються конфігурації CrossFire і SLI, а також dGPU і APU. Наразі існує лише попередня підтримка конфігурацій HSA. По суті, будь-який комп’ютерний пристрій, зазначений як графічний процесор серед пристроїв OpenCL, буде перевірено.

Поточні тести OpenCL не оптимізовані для жодної архітектури графічного процесора. Натомість модуль AIDA64 OpenCL покладається на компілятор OpenCL, який оптимізує ядро ​​OpenCL для найкращої роботи на базовому обладнанні. Ядра OpenCL, які використовуються для цих тестів, компілюються в режимі реального часу з використанням драйвера OpenCL графічного процесора. Через це завжди рекомендується оновлювати всі відеодрайвери (Catalyst, ForceWare, HD Graphics тощо) до останньої версії. Для компіляції передаються такі параметри компілятора OpenCL: -cl-fast-relaxed-math -cl-mad-enable.

Для порівняння панель GPGPU Benchmark Panel також пропонує вимірювання ЦП. Однак тести ЦП не використовують OpenCL, а записуються в рідному машинному коді x86/x64 з використанням доступних розширень набору інструкцій, таких як SSE, AVX, AVX2, FMA і XOP. Ці тести CPU дуже схожі на старі тести CPU та FPU AIDA64, але цього разу вони вимірюють максимальну обчислювальну продуктивність (FLOPS, IOPS). Контрольні тести ЦП є багатопоточними та оптимізовані для кожної архітектури ЦП, представленої з часів першого Pentium.

Наразі доступні такі контрольні тести:

Читання пам'яті

Вимірює пропускну здатність між пристроєм GPU та ЦП, ефективно вимірюючи продуктивність, GPU може копіювати дані з власної пам'яті пристрою в системну пам'ять. Його також називають пропускною здатністю від пристрою до хоста. Тест ЦП вимірює пропускну здатність зчитування пам’яті, тобто швидкість, з якою ЦП може зчитувати дані із системної пам’яті.

Запис у пам’ять

Вимірює пропускну здатність між ЦП і Пристрій GPU, який ефективно вимірює продуктивність, GPU може копіювати дані з системної пам’яті у свою власну пам’ять пристрою. Його також називають пропускною здатністю між хостом і пристроєм. Тест ЦП вимірює пропускну здатність запису в пам’ять, тобто, наскільки швидко ЦП може записувати дані в системну пам’ять.

Копіювання пам’яті

Ефективно вимірює продуктивність пам’яті власного пристрою GPU. Вимірюючи продуктивність, графічний процесор може копіювати дані з власної пам’яті пристрою в інше місце в пам’яті того ж пристрою. Його також називають пропускною здатністю від пристрою до пристрою. Тест ЦП вимірює пропускну здатність копіювання пам’яті, тобто швидкість переміщення ЦП даних у системній пам’яті з одного місця в інше.

FLOPS одинарної точності

Вимірює MAD (Продуктивність графічного процесора множення додавання, інакше відома як FLOPS (операції з плаваючою точкою в секунду), з даними з плаваючою комою одинарної точності (32-розрядні, "плаваючі").

Подвійна точність. FLOPS

Вимірює продуктивність графічного процесора MAD (множинного додавання), інакше відому як FLOPS (операції з плаваючою точкою в секунду), з подвійною точністю (64-розрядні, "подвійні") з плаваючою комою дані. Не всі графічні процесори підтримують операції з плаваючою комою подвійної точності. Наприклад, поточні настільні та мобільні графічні пристрої Intel підтримують лише операції з плаваючою комою з одинарною точністю.

24-бітове ціле число IOPS

Вимірює продуктивність MAD (множинного додавання) GPU, інакше відомий як IOPS (цілочисельні операції в секунду), з 24-розрядними цілочисельними ("int24") даними. Цей спеціальний тип даних визначено в OpenCL, враховуючи, що багато графічних процесорів здатні виконувати операції int24 у своїх одиницях з плаваючою комою, що ефективно збільшує цілочисельну продуктивність у 3–5 разів у порівнянні з 32-розрядними цілочисельними операціями.

32-bit Integer IOPS

Вимірює продуктивність графічного процесора MAD (Multiply-Addition), інакше відому як IOPS (цілочисельні операції в секунду), з 32-розрядними цілочисельними ("int") даними .

64-розрядне ціле число IOPS

Вимірює продуктивність графічного процесора MAD (множинного додавання), інакше відому як IOPS (цілочисельні операції в секунду), з 64-розрядним цілим числом ( «довгі») дані. Більшість графічних процесорів не мають виділених ресурсів виконання для 64-розрядних цілочисельних операцій. Такі пристрої емулюють 64-розрядні цілі операції на своїх 32-розрядних цілочисельних виконавчих блоках. У таких випадках 64-розрядна ціла продуктивність може бути дуже низькою.

AES-256

Ми можемо використовувати цей тест GPGPU на основі OpenCL для вимірювання продуктивності шифрування AES-256 сучасних графічні процесори та APU.

SHA-1

Ми можемо використовувати цей тест GPGPU на основі OpenCL для вимірювання продуктивності хешування SHA-1 сучасних графічних процесорів і APU.

Single-Precision Julia

Виміряти продуктивність з плаваючою комою з одинарною точністю (32-розрядна, «плаваюча») за допомогою обчислення кількох кадрів популярного фракталу «Джулія».

Подвійної точності Менделя

Заходи міри. продуктивність з плаваючою комою з подвійною точністю (64-розрядна, «подвійна») за допомогою обчислення кількох кадрів популярного фрактала «Мандельброта». Не всі графічні процесори підтримують операції з плаваючою комою подвійної точності. Наприклад, поточні настільні та мобільні графічні пристрої Intel підтримують лише операції з плаваючою комою одинарної точності.

Інтерфейс користувача

Ви можете використовувати прапорці, щоб вибрати пристрій GPU або CPU для контрольні показники. Після закриття панелі стан прапорця ЦП буде збережено.

Ви можете запустити тести для вибраних пристроїв, натиснувши кнопку «Почати контрольний тест». Якщо ви хочете запустити всі тести, але лише на графічному процесорі, вам потрібно двічі клацнути мітку стовпця GPU. Якщо ви хочете запустити тести зчитування пам’яті лише на графічному(их) і на центральному процесорі, вам потрібно двічі клацнути мітку читання пам’яті. Якщо ви хочете запустити тест зчитування пам’яті лише на графічних процесорах, вам потрібно двічі клацнути клітинку, де з’явиться запитаний результат тесту після завершення тесту.

Контрольні тести виконуються одночасно на всіх вибраних графічних процесорах з використанням кількох потоків і кількох контекстів OpenCL , кожен з яких має одну чергу команд. Проте тести CPU запускаються лише після завершення тестів GPU. Наразі неможливо запустити тести GPU та CPU одночасно.

Якщо в системі є кілька графічних процесорів, у першому стовпці результатів буде відображатися агрегований результат для всіх графічних процесорів. Окремі результати GPU об’єднуються (додаються), і мітка стовпця матиме вигляд, наприклад, «4 графічних процесора». Якщо ви хочете перевірити окремі результати, ви можете перевірити лише один графічний процесор або натиснути кнопку Результати, щоб відкрити вікно результатів.

Якщо у вас є два пристрої GPU, і ви відключили ЦП перевірити, знявши прапорець, панель перейде в режим подвійного GPU, де перший стовпець використовується для відображення результатів для GPU1, а другий для GPU2. Якщо ви хочете побачити сукупну продуктивність обох графічних процесорів, просто поставте прапорець ЦП знову після завершення тесту, і інтерфейс повернеться до макета за замовчуванням.