SSE4
|
SSE4 es un conjunto de instrucciones que amplía la capacidad de las anteriores SSE. Fue formalmente anunciada el 27 de septiembre de 2006 y volviéndose disponible en hardware a principios del 2007 para ambos procesadores Intel y AMD.
Instrucciones
Algunas de las instrucciones de SSE4.1
- mpsadbw - Suma de las restas absolutas. Calcula 8 sumas de desplazamientos de restas absoultas, 4 a la vez: |x0−y0|+|x1−y1|+|x2−y2|+|x3−y3|,|x0−y1|+|x1−y2|+|x2−y3|+|x3−y4|,...,|x0−y7|+|x1−y8|+|x2−y9|+|x3−y10|)
- phminposuw - Extracción del índice+mínimo (16bit word).
- pmuldq - Multiplicación empaquetada.
- dpps - Producto de punto, de simple precisión.
- dppd - Producto de punto, de doble precisión.
- blendps - Copia condicional.
- inserps - complex data shuffling
Algunas de las instrucciones de SSE4.2
- CRC32 - Acumula el valor CRC32C usando el polinomio 0x11EDC6F41.
- pcmpestri - Compara la longitud explícita de cadenas, devuelve el Index.
- pcmpgtq - Comparación empaquetada, mayor que.
- popcnt - Conteo de población.
Algunas de las instrucciones de SSE4a
Estas instrucciones solo están presente en la arquitectura Barcelona de AMD.
- lzcnt - Leading Zero Count.
- extrq - Operación de Máscara de desplazamiento.
- movntsd - Movimiento de doble precisión No-temporal.
Véase también
Fuentes
This article is issued from
Ecured.
The text is licensed under Creative
Commons - Attribution - Sharealike.
Additional terms may apply for the media files.