Вопросы с тегом 'gpu'

Сокращение для "Graphics Processing Unit". Для программирования традиционных графических приложений см. Запись тега для "графического программирования". Для общего назначения с использованием графических процессоров см. Запись тега для "gpgpu". Для конкретных технологий программирования GPU см. Популярные записи тегов для "opencl", "cuda" и "thrust".
2 отв.

Как измерить внутреннее время ядра в NVIDIA CUDA?

Я хочу измерить время внутреннего ядра графического процессора, как его измерить в NVIDIA CUDA? например. __global__ void kernelSample() { some code here get start time some code here get stop time some code here }
14 мая '12 в 18:06
3 отв.

Почему бы не использовать GPU в качестве процессора?

Я знаю, что вопрос связан только с частичным программированием, потому что ответ, который я хотел бы получить, исходит из этих двух вопросов: Почему число ядер процессора настолько невелико (против GPU)? и почему мы не используем графические процесс...
13 июня '12 в 1:24
2 отв.

помогите мне понять куду

У меня возникли проблемы с пониманием потоков в архитектуре NVIDIA gpu с cuda. ​​ Пожалуйста, кто-нибудь может прояснить эту информацию: 8800 gpu имеет 16 SM с 8 SP каждый. поэтому у нас есть 128 SP. Я просматривал презентацию в формате stanford, и...
05 февр. '10 в 15:37
3 отв.

почему a * b * a занимает больше времени (a '* (a * b)') 'при использовании gpuArray в скриптах Matlab?

Нижеприведенный код выполняет операцию с той же операцией на gpuArrays a и b двумя разными способами. Первая часть вычисляет (a'*(a*b)')', а вторая часть вычисляет a*b*a. Затем результаты проверяются одинаковыми. %function test clear rng('default');...
01 мая '18 в 6:36
1 отв.

CUDA, как получить сетку, блок, размер резьбы и рассчитать вычисление не квадратной матрицы

Я новичок в CUDA и нуждаюсь в помощи в понимании некоторых вещей. Мне нужна помощь, распараллеливающая эти два цикла. В частности, как настроить dimBlock и dimGrid, чтобы сделать этот запуск быстрее. Я знаю, что это похоже на пример добавления вектор...
13 апр. '11 в 3:33
1 отв.

Выполнение целочисленных и побитовых операций на графическом процессоре

Хотя графические процессоры предназначены для использования с типами данных с плавающей запятой, меня бы интересовало, насколько быстро процесс GPU может обрабатывать побитовые операции. Это самые быстрые возможности для CPU, но делает ли GPU эмулиро...
30 дек. '12 в 23:25
2 отв.

Может ли ядро ​​CUDA вызвать функцию cublas?

Я знаю, это звучит странно, но вот мой сценарий: Мне нужно сделать матрично-матричное умножение (A (n * k) * B (k * n)), но мне нужны только диагональные элементы для вычисления выходной матрицы. Я искал библиотеку cublas и не нашел никаких функций ...
14 нояб. '12 в 3:09
1 отв.

Как использовать закрепленную память/карту памяти в OpenCL

Чтобы сократить время передачи от хоста к устройству для моего приложения, я хочу использовать закрепленную память. Руководство по лучшей практике NVIDIA предлагает отображать буферы и записывать данные, используя следующий код: cDataIn = (unsigned ...
11 июня '14 в 12:10
1 отв.

Как запустить GPGPU внутри изображения докеров с отличием от версии ядра ядра и версии драйвера GPU

У меня есть машина с несколькими графическими процессорами. Моя идея - прикрепить их к разным экземплярам докеров, чтобы использовать эти экземпляры в вычислениях CUDA (или OpenCL). Моя цель - установить изображение докеры с довольно старыми Ubuntu ...
14 окт. '15 в 17:56
1 отв.

nvidia-smi Неустойчивое использование GPU-использования?

Я знаю, что nvidia-smi -l 1 будет использовать GPU каждую секунду (аналогично следующему). Тем не менее, я был бы признателен за объяснение того, что действительно означает Volatile GPU-Util. Является ли это количеством используемых SM по сравнению ...
02 дек. '16 в 20:31
1 отв.

tf.reduce_sum на GPU терпит неудачу в сочетании с заполнителем в качестве формы ввода

UPDATE: все еще происходит в Tensorflow 1.7.0 UPDATE: я написал записную книжку с коллабом, которая воспроизводит эту ошибку на оборудовании google gpu: https://drive.google.com/file/d/13V87kSTyyFVMM7NoJNk9QTsCYS7FRbyz/view?usp=sharing ОБНОВЛЕНИЕ:...
27 марта '18 в 21:49
4 отв.

Запуск MSIL на GPU

Может быть, сумасшедший вопрос, но можно ли запускать потоки на GPU? Причина, о которой я прошу, заключается в том, что у меня есть довольно сложное вычисление для выполнения (это в основном математика и массивы), и мне хотелось бы узнать, могу ли я...
19 окт. '11 в 18:05
4 отв.

Использование Delphi для использования технологии GPGPU?

GPGPU - это принцип использования параллельных процессоров на видеокартах для значительного увеличения производительности. Есть ли у кого-нибудь идеи об использовании GPGPU в Delphi, используя OpenCL или CUDA? CUDA была/является только NVidia, но он...
20 дек. '09 в 7:25
2 отв.

Каков наилучший способ обращения с FBO в OpenGL?

Интересно, что долгое время было бы лучшим способом обработки OpenGL FrameBuffer Objects (FBO). Переключение FBOs может быть дорогостоящим, но также определять новые вложения. Как вы это делаете быстро? Я колеблюсь между этими 3: 1 FBO для всег...
04 февр. '10 в 12:30
1 отв.

Каков механизм переключения контекста в GPU?

Как я знаю, графические процессоры переключаются между перекосами, чтобы скрыть задержку памяти. Но мне интересно, в каком состоянии, деформация будет отключена? Например, если деформация выполняет нагрузку, а данные уже находятся в кеше. Так что вар...
07 июля '11 в 6:46