Вопросы с тегом 'gpgpu'

GPGPU является акронимом для области компьютерной науки, известной как "вычисления общего назначения на графическом процессоре (GPU)"
23
ответов

Самый быстрый тип фиксированной длины 6 int array

Отвечая на другой вопрос (этот), я наткнулся на интересную подзадачу. Каков самый быстрый способ сортировки массива из 6 ints? Как вопрос очень низкий уровень: мы не можем предположить, что библиотеки доступны (и сам вызов имеет свою стоимость), т...
задан 07 мая '10 в 10:24
14
ответов

Использование GPU с С#

Я пытаюсь получить больше вычислительной мощности из своей сетки. Я использую все процессоры cpus/core, можно ли использовать GPU с С#. Кто-нибудь знает какие-либо библиотеки или получает какой-либо пример кода?
задан 17 дек. '08 в 18:55
2
ответов

Как CUDA блокирует/перекосы/потоки на ядра CUDA?

Я использую CUDA в течение нескольких недель, но у меня есть некоторые сомнения в распределении блоков /warps/thread. Я изучаю архитектуру с дидактической точки зрения (университетский проект), поэтому достижение максимальной производительности не ...
задан 05 мая '12 в 12:58
10
ответов

NVIDIA против AMD: производительность GPGPU

Я бы хотел услышать от людей с опытом кодирования для обоих. Я сам имею опыт работы с NVIDIA. NVIDIA CUDA кажется намного более популярной, чем конкуренция. (Только подсчет вопросительных тегов на этом форуме, "cuda" превосходит "opencl" 3: 1, а "nv...
задан 09 янв. '11 в 11:27
8
ответов

Лучший подход для GPGPU/CUDA/OpenCL в Java?

Универсальные вычисления на графических процессорах (GPGPU) - очень привлекательная концепция для использования мощности GPU для любого типа вычислительной техники. Мне бы хотелось использовать GPGPU для обработки изображений, частиц и быстрых геоме...
задан 14 апр. '10 в 0:53
10
ответов

OpenGL против OpenCL, который выбрать и почему?

Какие функции делают OpenCL уникальным для выбора OpenGL с помощью GLSL для расчетов? Несмотря на графическую связанную терминологию и практические типы данных, существует ли какое-либо реальное препятствие для OpenGL? Например, оценка параллельной ...
задан 26 окт. '11 в 21:57
2
ответов

Ускорение кода MATLAB с использованием графических процессоров?

AccelerEyes объявила в декабре 2012 года, что она работает с Mathworks по коду GPU и прекратила выпуск своего продукта Jacket для MATLAB: http://blog.accelereyes.com/blog/2012/12/12/exciting-updates-from-accelereyes/ К сожалению, они больше не про...
задан 05 июня '13 в 18:18
2
ответов

Программирование GPU, CUDA или OpenCL?

Я новичок в программировании на GPU. У меня есть ноутбук с картой NVIDIA GeForce GT 640. Я столкнулся с двумя дилеммами, предложения приветствуются. Если я перехожу на CUDA - Ubuntu или Windows. Ясно, что CUDA более подходит для окон, хотя это мо...
задан 02 авг. '13 в 13:09
2
ответов

В чем разница между OpenCL и OpenGL compute shader?

Я знаю, что OpenCL обеспечивает управление архитектурой памяти GPU и, таким образом, обеспечивает лучшую оптимизацию, но, оставив это в стороне, мы можем использовать Compute Shaders для векторных операций (сложение, умножение, инверсия и т.д.)?
задан 08 апр. '13 в 1:16
8
ответов

OpenCL/AMD: глубокое обучение

В то время как "googl'ing" и некоторые исследования я не смог найти любую серьезную/популярную структуру /sdk для научных GPGPU-Computing и OpenCL на оборудовании AMD. Есть ли какая-либо литература и/или программное обеспечение, которое я пропусти...
задан 03 июня '15 в 17:20
6
ответов

Библиотека компрессии с использованием Nvidia CUDA

Кто-нибудь знает проект, который реализует стандартные методы сжатия (например, Zip, GZip, BZip2, LZMA,...) с использованием NVIDIA CUDA library Мне было интересно, не будут ли алгоритмы, которые могут использовать множество параллельных задач (напр...
задан 19 янв. '09 в 10:54
5
ответов

Модель CUDA - какой размер основы?

Какова связь между максимальным размером рабочей группы и размером основы? Допустим, мое устройство имеет 240 потоковых процессоров CUDA (SP) и возвращает следующую информацию - CL_DEVICE_MAX_COMPUTE_UNITS: 30 CL_DEVICE_MAX_WORK_ITEM_SIZES: 512/512...
задан 31 авг. '10 в 9:52
3
ответов

CUDA: Сколько одновременных потоков в целом?

У меня есть GeForce GTX 580, и я хочу сделать выражение об общем количестве потоков, которые могут (в идеале) выполняться параллельно, для сравнения с 2 или 4 многоядерными процессорами. deviceQuery дает мне следующую возможную информацию: CUDA Cap...
задан 27 июня '11 в 11:58
3
ответов

Когда вызывать cudaDeviceSynchronize?

когда вы вызываете функцию cudaDeviceSynchronize, которая действительно нужна?. Насколько я понимаю из документации CUDA, ядра CUDA являются асинхронными, поэтому кажется, что после каждого запуска ядра мы должны вызвать cudaDeviceSynchronize. Те...
задан 09 авг. '12 в 20:25
2
ответов

Должен ли я объединить два похожих ядра с выражением "if", рискуя потерями производительности?

У меня есть две очень похожие функции ядра, в том смысле, что код почти тот же, но с небольшой разницей. В настоящее время у меня есть 2 варианта: Напишите два разных метода (но очень похожих) Напишите одно ядро ​​и поместите блоки кода, которые о...
задан 30 мая '11 в 20:45