es.davy.ai

Preguntas y respuestas de programación confiables

¿Tienes una pregunta?

Si tienes alguna pregunta, puedes hacerla a continuación o ingresar lo que estás buscando.

Tag: AVX2

¿FFTW determina dinámicamente la versión SIMD?

Por ejemplo, si compilo FFTW con soporte AVX2 y lo ejecuto en una máquina que solo tiene SSE3, ¿verificará y usará las instrucciones SSE3 o se estrellará inmediatamente? Si no determina de forma dinámica la versión de SIMD, lo compilaría en una máquina de destino más baja.

¿Cómo puedo utilizar el truco de pasos (stride) en la multiplicación de Karatsuba de polinomios?

¿Alguien puede explicar qué es el “stride trick” en general? ¿Cómo puedo usarlo al implementar algoritmos de multiplicación polinomial en los que los polinomios se representan como arreglos de coeficientes? ¿Cómo puede el “stride trick” hacer que la implementación sea más eficiente? ¿Es algo más adecuado para instrucciones vectoriales AVX/AVX2? . . . Read more

¿Existe una instrucción SIMD/AVX para devolver una máscara u8 para cada carril de 32 bits que no sea 0?

Digamos que tengo un vector de 256 bits de ancho como este: 00000000 00000000 11100110 00000000 00000000 00000000 00000000 00000000 00000000 00000000 10000101 00000000 00000000 00000000 01111110 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00000000 00001100 00000000 00000000 00000000 00000000 00000000 ¿Cuál sería la forma más eficiente . . . Read more