Вопросы с тегом 'sse2'

x86 Streaming SIMD Extensions 2 добавляет поддержку упакованных целых чисел и плавающих чисел с двойной точностью в 128-байтных векторных регистрах XMM. Он всегда поддерживается на x86-64 и поддерживается на каждом процессоре x86 с 2003 года или позже.
8 отв.

Почему strcmp не оптимизирован SIMD?

Я попытался скомпилировать эту программу на компьютере x64: #include <cstring> int main(int argc, char* argv[]) { return ::std::strcmp(argv[0], "really really really really really really really really really" "really really really r...
27 окт. '14 в 13:59
2 отв.

Опция SSE2 в Visual С++ (x64)

Я добавил конфигурацию x64 в мой проект на С++ для компиляции 64-разрядной версии моего приложения. Все выглядит отлично, но компилятор дает следующее предупреждение: `cl : Command line warning D9002 : ignoring unknown option '/arch:SSE2'` Оптимиз...
01 июля '09 в 9:53
4 отв.

Оптимизация производительности сборки x86-64 - Выравнивание и прогнозирование ветвлений

Im в настоящее время кодирует высоко оптимизированные версии некоторых стандартных функций библиотеки библиотеки C99, таких как strlen(), memset() и т.д., используя сборку x86-64 с инструкциями SSE-2. Пока мне удалось добиться отличных результатов ...
08 авг. '13 в 0:18
4 отв.

Расширенная (80-разрядная) двойная с плавающей запятой в x87, а не SSE2 - мы ее не пропустили?

Я читал сегодня о исследователях, обнаруживших, что библиотеки NVidia Phys-X используют x87 FP против SSE2. Очевидно, что это будет субоптимально для параллельных наборов данных, где скорость превосходит точность. Однако автор статьи далее цитирует: ...
08 июля '10 в 19:57
4 отв.

Проверка целостности целых SSE2

При использовании инструкций SSE2, таких как PADDD (т.е. _mm_add_epi32 intrinsic), есть ли способ проверить, не переполнилось ли какое-либо из операций? Я думал, что, возможно, флаг в регистре управления MXCSR может быть установлен после переполнен...
09 мая '12 в 9:44
2 отв.

Умножение SSE на 4 32-битных целых числа

Как умножить четыре 32-битных целых числа на 4 целых числа? Я не нашел инструкции, которая может это сделать.
08 мая '12 в 17:37
4 отв.

Определить поддержку процессора для SSE2?

Мне нужно определить поддержку процессора для SSE2 перед установкой программного обеспечения. Насколько я понимаю, я придумал это: bool TestSSE2(char * szErrorMsg) { __try { __asm { xorpd xmm0, xmm0 // ...
08 марта '10 в 21:22
1 отв.

Лучший способ загрузить 64-битное целое число в регистр SSE2 с двойной точностью?

Каков наилучший/самый быстрый способ загрузки 64-разрядного целочисленного значения в регистр xmm SSE2 в 32-битном режиме? В 64-битном режиме может использоваться cvtsi2sd, но в 32-битном режиме он поддерживает только 32-разрядные целые числа. До...
22 марта '13 в 14:16
2 отв.

Valgrind и Java

Я хочу использовать Valgrind 3.7.0, чтобы найти утечки памяти в моем собственном коде Java. Я использую jdk1.6.0._29. Для этого мне нужно установить флаг -trace-children = yes. Установив этот флаг, я больше не могу запускать valgrind в любом Java-пр...
09 февр. '12 в 21:43
4 отв.

Быстрый подсчет количества равных байтов между двумя массивами

Я написал функцию int compare_16bytes(__m128i lhs, __m128i rhs), чтобы сравнить два 16 байтовых номера с помощью инструкций SSE: эта функция возвращает количество байтов, равное после выполнения сравнения. Теперь я хотел бы использовать указанную в...
09 марта '13 в 20:20
3 отв.

Какая разница между логическими SSE-характеристиками?

Есть ли разница между логическими SSE-функциями для разных типов? Например, если мы берем операцию ИЛИ, есть три свойства: _mm_or_ps, _mm_or_pd и _mm_or_si128, все из которых выполняют одно и то же: вычисляют побитовое ИЛИ их операндов. Мои вопросы: ...
10 мая '10 в 20:32
2 отв.

Суммирование сокращения беззнаковых байтов без переполнения с использованием SSE2 на Intel

Я пытаюсь найти сокращение суммы из 32 элементов (каждый 1 байт данных) на процессоре Intel i3. Я сделал это: s=0; for (i=0; i<32; i++) { s = s + a[i]; } Однако, это занимает больше времени, так как мое приложение - приложение в режиме р...
07 июня '12 в 16:13
5 отв.

Как проверить, поддерживает ли ваша Linux поддержка SSE2

На самом деле у меня есть 2 вопроса: Совместимость SSE2 с проблемой CPU или компилятором? Как проверить, поддерживает ли ваш процессор или компилятор SSE2? Я использую версию GCC: gcc (GCC) 4.5.1 Когда я попытался скомпилировать код, он дал мне...
17 нояб. '10 в 12:54
1 отв.

SSE работает медленно после использования AVX

У меня странная проблема с некоторыми SSE2 и кодом AVX, над которыми я работал. Я создаю свое приложение, используя GCC, которое обнаруживает функцию cpu. Объектные файлы создаются с отдельными флагами для каждой функции ЦП, например: g++ -c -o Conv...
15 окт. '15 в 16:16
3 отв.

Набор инструкций SSE не включен

У меня возникают проблемы с этой ошибкой: "Набор инструкций SSE не включен". Как я могу это понять? У меня ACER i7, Ubuntu 11.10, пожалуйста, кто-нибудь может мне помочь? Любая помощь будет оценена! Также работает: sudo cat /proc/cpuinfo | grep ...
05 февр. '12 в 0:06