intrinsics Examples and Free Source Code

Is there an equivalent of _mm_slli_si128(__m128i a, int num) for floats?...

c x86 vectorization sse intrinsics

How to check inf for AVX intrinsic __m256...

c++c sse intrinsics avx

The Effect of Architecture When Using SSE / AVX Intrinisics...

gcc sse intrinsics avx icc

How do Compute Capabilities 7.x & 8.x assist cooperative group operations?...

cuda gpu nvidia intrinsics

Rust target-cpu=native gets slower SIMD execution...

rust simd intrinsics avx

Why can't Clang get __m128's data by index in constexpr function...

c++clang simd constexpr intrinsics

Why don't gcc/clang vectorize 128-bit SIMD intrinsics into 256-bit when possible?...

gcc x86 clang intrinsics avx2

SIMD and difference between packed and scalar double precision...

c++x86 sse simd intrinsics

What is the difference between Java intrinsic and native methods?...

java native intrinsics

Will intel -03 convert pairs of __m256d instructions into __m512d...

performance compiler-optimization intrinsics icc avx512

_mm_loadu_si32 not recognized by GCC on Ubuntu...

c gcc sse intrinsics

Cast array of wrapper structs to SIMD vector...

c++language-lawyer undefined-behavior simd intrinsics

Intel intrinsics: vector comparison result to array of bool conversion...

c x86 boolean sse intrinsics

Sorting 64-bit structs using AVX?...

c++sorting simd intrinsics avx

AVX2 - storing integers at arbitrary indices in an array...

c simd intrinsics avx2

does the instruction sqrtpd calculate the sqrt at the same time?...

parallel-processing cpu-architecture simd sse intrinsics

C++ error: intrinsic function was not declared in scope...

c++gcc intrinsics avx avx2

Accessing components of __m128d intrinsics in Visual Studio vs. Xcode doesn't work the same way?...

c++visual-c++clang sse intrinsics

How do I fake a user log in for unit testing purposes using fakeiteasy within asp.net mvc 2...

asp.net-mvc-2 intrinsics mspec

overflow instead of saturation on 16bit add AVX2...

c++unsigned intrinsics integer-overflow avx2

count number of unique values in a 128bit avx vector, or detecting if all elements are equal?...

c simd sse intrinsics avx

How to emulate _mm256_loadu_epi32 with gcc or clang?...

c++c intrinsics avx512

Why does does SSE set (_mm_set_ps) reverse the order of arguments...

c++c simd sse intrinsics

Difference between __builtin_addcll and _addcarry_u64...

c++clang intel intrinsics built-in

Can't use uint64_t with rdrand as it expects unsigned long long, but uint64_t is defined as unsi...

c++long-integer portability intrinsics rdrand

Linking error when building without CRT, memcpy and memset intrinsic functions...

c++memcpy intrinsics crt memset

Efficient overflow-immune arithmetic mean in C/C++...

c++c optimization compiler-optimization intrinsics

Manipulate vector register as float32x4_t C variable in ARM...

c assembly inline-assembly arm64 intrinsics

Why does Clang complain about alignment on SSE intrinsic unaligned loads...

clang sse intrinsics memory-alignment

Population count in AVX512...

simd intrinsics avx512 hammingweight