Вопросы с тегом 'cuda'

CUDA - это параллельная вычислительная платформа и модель программирования для графических процессоров Nvidia (графические процессоры). CUDA предоставляет интерфейс для графических процессоров Nvidia с помощью различных языков программирования, библиотек и API.
2

CUDA NPP GaussFilter повреждает изображения

Я пытаюсь использовать CUDA с Qt для размытия изображения. Я использую библиотеку NPP, nppiFilterGauss_8u_C1R отлично работает void cuda_npp_gauss_filter_qt(uchar* pSourceData, uchar* pResultData, const int &ImageLineStep, const int &ImageWi...
03 дек. '16 в 17:21
1

CUDA: память Cuda отличается от OpenCL? Что вызывает этот незаконный доступ к памяти?

Поэтому я написал версию программы OpenCL от Cuda, которую я написал. Работают версии OpenCL, а версия Cuda - нет. Теперь преобразование кода OpenCL в код Cuda не является 1-к-1, но я смущен тем, почему версия cuda не будет работать после того, как ...
17 дек. '16 в 1:10
1

Вложенный цикл с переменными диапазонами внутреннего цикла в CUDA С++

Мне нужно распараллелить с CUDA вложенный цикл: for(int ix=0; ix<Nx; ix++) { for(int iy=0; iy<Ny[ix]; iy++) { SomeFunction(ix, iy); ... где Ny[] - массив в глобальной памяти CUDA. Этот цикл вызывается несколько раз за один про...
17 дек. '16 в 14:11
1

Ошибки Anano для использования GPU

Я пытаюсь использовать theano для pthon на моем GPU (980 м) с GCC 6.2.0 и G++ 6.2.0 для Python 3.5.1 на Ubuntu 16.04. Я установил все предварительные условия в соответствии с инструкциями, и Theano не дал ошибок при импорте. Однако, когда я запускаю...
28 дек. '16 в 22:26
2

Ошибка "неопределенная ссылка на" __cudaRegisterLinkedBinary "при компиляции CUDA с CMake

Я пытаюсь скомпилировать программу, использующую C++ и CUDA с помощью CMake. Часть CMakeLists, которая компилирует файлы C++, уже была сделана, и я добавляю эту часть для компиляции файлов CUDA. Я добавил источники, и они скомпилируются в порядке, н...
29 дек. '16 в 18:34
1

Зависимость CUDA + CMake от целевой библиотеки ломается на разных машинах

Недавно я попытался создать свои https://github.com/eyalroz/cuda-api-wrappers/ примеры библиотек после перехода на другой дистрибутив Linux на том же компьютере. Как ни странно, я столкнулся с проблемой связывания. Команда: /usr/bin/c++ -Wall -std...
01 янв. '16 в 15:18
1

Внедрение простого Z-буфера в CUDA

У меня есть облако 3D-точек, и я проецирую пиксели на плоскость изображения. Поскольку некоторые 3D-точки отображаются на один и тот же пиксель, мне нужен только пиксель с самым низким значением Z для моей камеры. Я использую Z-Buffer - массив с пла...
03 янв. '17 в 10:44
2

Библиотеки библиотек Fortran для разных компиляторов fortran

Могу ли я скомпилировать подпрограммы fortran, содержащие ядра CUDA через компилятор PGI в виде DLL, затем использовать их в программе fortran, скомпилированной другими компиляторами fortran (Fortran Powerstation)? Я не могу скомпилировать мою стар...
06 янв. '17 в 18:25
1

row-major или основной доступ к индексу потока в cuda?

Я смущен, сохранено ли изображение в строчном порядке или в столбце-главном порядке в глобальной памяти устройства. Я получаю два разных выхода изображения при обращении к изображению в обоих ордерах. При доступе в ряд основных order- int x = threa...
06 янв. '17 в 19:25
1

Значительная разница во времени в CUDA при использовании побитового сдвига вместо мода

Я относительно новичок в программировании CUDA, и я тестировал разные простые ядра, чтобы увидеть разницу во времени выполнения. У меня есть два ядра, которые делают то же самое для меня: __global__ void mathKernel2(float *c) { int tid = blockIdx.x...
08 янв. '17 в 19:43
1

Ошибка: был обнаружен незаконный доступ к памяти

Я задал сомнительную ошибку: вызов функции __host__ из функции __global__ не разрешен, и я получил ans. соответственно, я изменил свой код bt, я не могу получить доступ к d_point [i]. как я могу получить доступ к этому. __global__ void densefun(in...
11 янв. '17 в 6:59
1

CUDA не может найти GPU на Mac

Пару дней назад мне удалось заставить CUDA работать с тензорным потоком на моем Mac с GeForce GTX 780M. Однако сегодня я заметил, что он больше не работает. Я не уверен, что изменилось, но я проверил, что библиотеки (особенно cudann) по-прежнему уст...
12 янв. '17 в 14:30
1

GPU-Computation (CUDA) tex2d/tex3d - Как работать с анизотропным пикселем/вокселом

Я новичок в программировании cuda, и у меня есть вопрос о функции texXD. Моя цель - реализовать простой трассировщик луча на основе графического процессора, используя оптимизированные функциональные возможности CUDA. См. API текстуры CUDA, который ...
20 янв. '17 в 14:40
1

curand дает одинаковое число каждый раз в потоке

Когда я вызываю curand, я всегда получаю то же число в потоке. Однако они различны для каждой нити. Что я делаю неправильно в следующем коде? #define MAXTHREADS 2 #define NBBLOCKS 2 __global__ void testRand ( curandState * state, int nb ){ int...
21 янв. '17 в 10:09
1

Параллельное программирование Udacity, неустановленная сбой запуска

Я пытаюсь выполнить домашнее задание № 3 для параллельного программирования курса Udacity. Я столкнулся с следующей ошибкой CUDA: CUDA error at: student_func.cu:150 unspecified launch failure cudaGetLastError() Ошибка возникает при запуске ядра,...
23 янв. '17 в 12:48