Вопросы с тегом 'cuda'

CUDA - это параллельная вычислительная платформа и модель программирования для графических процессоров Nvidia (графические процессоры). CUDA предоставляет интерфейс для графических процессоров Nvidia с помощью различных языков программирования, библиотек и API.
5
ответов

Использование cudamalloc(). Почему двойной указатель?

В настоящее время я изучаю примеры учебников на http://code.google.com/p/stanford-cs193g-sp2010/, чтобы узнать CUDA. Код, который демонстрирует функции __global__, приведен ниже. Он просто создает два массива: один на процессоре и один на графическом...
задан 03 нояб. '11 в 3:37
2
ответов

Могу ли я использовать __syncthreads() после сброса потоков?

Можно ли использовать __syncthreads() в блоке, где я целенаправленно удалял потоки с помощью return? В документации указано, что __syncthreads() должен быть вызван каждым потоком в блоке, иначе он приведет к взаимоблокировке, но на практике я нико...
задан 12 июля '11 в 18:04
1
ответ

Каковы различия между возможностями CUDA?

Что может вычислить возможность 2.0 добавить более 1.3, 2.1 более 2.0 и 3.0 более 2.1?
задан 09 июня '12 в 16:32
3
ответов

Cuda gridDim и blockDim

Я получаю, что такое blockDim.. Но у меня проблема с gridDim. Blockdim дает размер блока, но что такое gridDim? В Интернете говорится, что gridDim.x дает количество блоков в координате x. Как я могу узнать, что blockDim.x * gridDim.x? Как узнать, ...
задан 18 мая '13 в 2:38
6
ответов

Возможно ли запустить CUDA на графических процессорах AMD?

Я хотел бы расширить свой набор навыков в вычислениях на GPU. Я знаком с raytracing и графикой в ​​реальном времени (OpenGL), но следующее поколение графических и высокопроизводительных вычислений похоже на графические процессоры или что-то в этом ро...
задан 11 окт. '12 в 0:02
8
ответов

Время ожидания приложений CUDA и отказ через несколько секунд - как обойти это?

Я заметил, что приложения CUDA имеют приблизительное максимальное время выполнения 5-15 секунд, прежде чем они потерпят неудачу и выйдут. Я понимаю, что идеально, чтобы приложение CUDA не выполнялось так долго, но предполагая, что это правильный выбо...
задан 31 янв. '09 в 2:29
2
ответов

CUDA и классы

Я искал всю информацию о том, как именно использовать классы с CUDA, и хотя существует общее мнение, что это можно сделать и, по-видимому, делают люди, мне было трудно узнать как это сделать на самом деле. У меня есть класс, который реализует базовы...
задан 08 авг. '11 в 9:48
4
ответов

Использование std::vector в коде устройства CUDA

Вопрос в том, что: существует ли способ использования класса "вектор" в ядрах Cuda? Когда я пытаюсь, я получаю следующую ошибку: error : calling a host function("std::vector<int, std::allocator<int> > ::push_back") from a __device__/__gl...
задан 29 апр. '12 в 23:23
1
ответ

Разве дивергенция отрасли действительно так плохо?

Я видел много вопросов, разбросанных по всему Интернету о разветвленности веток, и о том, как избежать этого. Однако даже после чтения десятков статей о том, как работает CUDA, , я не вижу, как избежать в большинстве случаев отклонения от ветки.. Пр...
задан 20 июня '13 в 23:58
3
ответов

Как я могу сделать schedorflow на GPU с возможностью 2.0?

Я успешно установил tenorflow (GPU) на Linux Ubuntu 16.04 и сделал небольшие изменения, чтобы заставить его работать с новой версией Ubuntu LTS. Однако, я подумал (кто знает, почему), что мой графический процессор удовлетворяет минимальному требован...
задан 23 июля '16 в 17:17
4
ответов

CUDA для .net?

Я знаю, что существует много языковых привязок CUDA, таких как PyCUDA, но есть ли хорошие привязки для .Net? Единственное, что я видел, это этот, но я хотел бы знать, есть ли другие.
задан 23 окт. '08 в 9:40
4
ответов

Как начать новый проект CUDA в Visual Studio 2008?

Это невероятно важный вопрос, но как мне начать новый проект CUDA в Visual Studio 2008? Я нашел тонны и тонны документации по вопросам, связанным с CUDA, но не знаю, как начать новый проект. Я работаю с Windows 7 x64 Visual Studio 2008 С++. Мне бы оч...
задан 12 янв. '10 в 5:04
8
ответов

Программирование на GPU высокого уровня в С++

Я изучал библиотеки/расширения для С++, что позволит обрабатывать GPU на высоком уровне. Я не специалист по программированию на GPU, и я не хочу копать слишком глубоко. У меня есть нейронная сеть, состоящая из классов с виртуальными функциями. Мне ну...
задан 08 мая '13 в 13:17
1
ответ

Почему AtomAdd не был реализован для парных?

Почему hasnt atomicAdd() для двойников был реализован явно как часть CUDA 4.0 или выше? В приложении F Страница 97 Руководства по программированию CUDA 4.1 приведены следующие версии atomicAdd реализованы. int atomicAdd(int* address, int val); uns...
задан 27 сент. '12 в 19:37
2
ответов

Какова цель использования нескольких флагов "arch" в компиляторе Nvidia NVCC?

Недавно я узнал, как NVCC компилирует код устройства CUDA для разных вычислительных архитектур. С моей точки зрения, при использовании опции NVCC -gencode "arch" - это минимальная вычислительная архитектура, требуемая программным приложением, а такж...
задан 11 июля '13 в 19:54