"192.102.6.94 - 192.102.6.94"

Вопросы с тегом 'gpgpu'

GPGPU является акронимом для области компьютерной науки, известной как "вычисления общего назначения на графическом процессоре (GPU)"
24 отв.

Самый быстрый тип фиксированной длины 6 int array

Отвечая на другой вопрос (этот), я наткнулся на интересную подзадачу. Какой самый быстрый способ сортировки массива из 6 целых чисел? Как вопрос очень низкого уровня: мы не можем предполагать, что библиотеки доступны (и сам вызов имеет свою стоимо...
07 мая '10 в 10:24
14 отв.

Использование GPU с С#

Я пытаюсь получить больше вычислительной мощности из своей сетки. Я использую все процессоры cpus/core, можно ли использовать GPU с С#. Кто-нибудь знает какие-либо библиотеки или получает какой-либо пример кода?
17 дек. '08 в 18:55
2 отв.

Как CUDA блокирует/перекосы/потоки на ядра CUDA?

Я использую CUDA в течение нескольких недель, но у меня есть некоторые сомнения в распределении блоков /warps/thread. Я изучаю архитектуру с дидактической точки зрения (университетский проект), поэтому достижение максимальной производительности не ...
05 мая '12 в 12:58
10 отв.

NVIDIA против AMD: производительность GPGPU

Я бы хотел услышать от людей с опытом кодирования для обоих. Я сам имею опыт работы с NVIDIA. NVIDIA CUDA кажется намного более популярной, чем конкуренция. (Только подсчет вопросительных тегов на этом форуме, "cuda" превосходит "opencl" 3: 1, а "nv...
09 янв. '11 в 11:27
8 отв.

Лучший подход для GPGPU/CUDA/OpenCL в Java?

Универсальные вычисления на графических процессорах (GPGPU) - очень привлекательная концепция для использования мощности GPU для любого типа вычислительной техники. Мне бы хотелось использовать GPGPU для обработки изображений, частиц и быстрых геоме...
14 апр. '10 в 0:53
10 отв.

OpenGL против OpenCL, который выбрать и почему?

Какие функции делают OpenCL уникальным для выбора OpenGL с помощью GLSL для расчетов? Несмотря на графическую связанную терминологию и практические типы данных, существует ли какое-либо реальное препятствие для OpenGL? Например, оценка параллельной ...
26 окт. '11 в 21:57
9 отв.

OpenCL/AMD: глубокое обучение

В то время как "googl'ing" и некоторые исследования я не смог найти любую серьезную/популярную структуру /sdk для научных GPGPU-Computing и OpenCL на оборудовании AMD. Есть ли какая-либо литература и/или программное обеспечение, которое я пропусти...
03 июня '15 в 17:20
2 отв.

Ускорение кода MATLAB с использованием графических процессоров?

AccelerEyes объявила в декабре 2012 года, что она работает с Mathworks по коду GPU и прекратила выпуск своего продукта Jacket для MATLAB: http://blog.accelereyes.com/blog/2012/12/12/exciting-updates-from-accelereyes/ К сожалению, они больше не про...
05 июня '13 в 18:18
2 отв.

Программирование GPU, CUDA или OpenCL?

Я новичок в программировании на GPU. У меня есть ноутбук с картой NVIDIA GeForce GT 640. Я столкнулся с двумя дилеммами, предложения приветствуются. Если я перехожу на CUDA - Ubuntu или Windows. Ясно, что CUDA более подходит для окон, хотя это мо...
02 авг. '13 в 13:09
2 отв.

В чем разница между OpenCL и OpenGL compute shader?

Я знаю, что OpenCL обеспечивает управление архитектурой памяти GPU и, таким образом, обеспечивает лучшую оптимизацию, но, оставив это в стороне, мы можем использовать Compute Shaders для векторных операций (сложение, умножение, инверсия и т.д.)?
08 апр. '13 в 1:16
6 отв.

Библиотека компрессии с использованием Nvidia CUDA

Кто-нибудь знает проект, который реализует стандартные методы сжатия (например, Zip, GZip, BZip2, LZMA,...) с использованием NVIDIA CUDA library Мне было интересно, не будут ли алгоритмы, которые могут использовать множество параллельных задач (напр...
19 янв. '09 в 10:54
5 отв.

Модель CUDA - какой размер основы?

Какова связь между максимальным размером рабочей группы и размером основы? Допустим, мое устройство имеет 240 потоковых процессоров CUDA (SP) и возвращает следующую информацию - CL_DEVICE_MAX_COMPUTE_UNITS: 30 CL_DEVICE_MAX_WORK_ITEM_SIZES: 512/512...
31 авг. '10 в 9:52
3 отв.

CUDA: Сколько одновременных потоков в целом?

У меня есть GeForce GTX 580, и я хочу сделать выражение об общем количестве потоков, которые могут (в идеале) выполняться параллельно, для сравнения с 2 или 4 многоядерными процессорами. deviceQuery дает мне следующую возможную информацию: CUDA Cap...
27 июня '11 в 11:58
3 отв.

Когда вызывать cudaDeviceSynchronize?

когда вы вызываете функцию cudaDeviceSynchronize, которая действительно нужна?. Насколько я понимаю из документации CUDA, ядра CUDA являются асинхронными, поэтому кажется, что после каждого запуска ядра мы должны вызвать cudaDeviceSynchronize. Те...
09 авг. '12 в 20:25
2 отв.

Должен ли я объединить два похожих ядра с выражением "if", рискуя потерями производительности?

У меня есть две очень похожие функции ядра, в том смысле, что код почти тот же, но с небольшой разницей. В настоящее время у меня есть 2 варианта: Напишите два разных метода (но очень похожих) Напишите одно ядро ​​и поместите блоки кода, которые о...
30 мая '11 в 20:45