Skip to content

Commit e0fbb9f

Browse files
authored
Avx512bw (#971)
1 parent f1ed228 commit e0fbb9f

File tree

2 files changed

+3462
-93
lines changed

2 files changed

+3462
-93
lines changed

crates/core_arch/avx512bw.md

Lines changed: 132 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -62,17 +62,37 @@
6262
* [x] [`_mm512_avg_epu16`]
6363
* [x] [`_mm512_mask_avg_epu16`]
6464
* [x] [`_mm512_maskz_avg_epu16`]
65+
* [x] [`_mm_mask_avg_epu16`]
66+
* [x] [`_mm_maskz_avg_epu16`]
67+
* [x] [`_mm256_mask_avg_epu16`]
68+
* [x] [`_mm256_maskz_avg_epu16`]
6569
* [x] [`_mm512_avg_epu8`]
6670
* [x] [`_mm512_mask_avg_epu8`]
6771
* [x] [`_mm512_maskz_avg_epu8`]
72+
* [x] [`_mm_mask_avg_epu8`]
73+
* [x] [`_mm_maskz_avg_epu8`]
74+
* [x] [`_mm256_mask_avg_epu8`]
75+
* [x] [`_mm256_maskz_avg_epu8`]
6876
* [x] [`_mm512_mask_blend_epi16`]
77+
* [x] [`_mm_mask_blend_epi16`]
78+
* [x] [`_mm256_mask_blend_epi16`]
6979
* [x] [`_mm512_mask_blend_epi8`]
7080
* [x] [`_mm512_broadcastb_epi8`]
81+
* [x] [`_mm_mask_blend_epi8`]
82+
* [x] [`_mm256_mask_blend_epi8`]
7183
* [x] [`_mm512_mask_broadcastb_epi8`]
7284
* [x] [`_mm512_maskz_broadcastb_epi8`]
85+
* [x] [`_mm_mask_broadcastb_epi8`]
86+
* [x] [`_mm_maskz_broadcastb_epi8`]
87+
* [x] [`_mm256_mask_broadcastb_epi8`]
88+
* [x] [`_mm256_maskz_broadcastb_epi8`]
7389
* [x] [`_mm512_broadcastw_epi16`]
7490
* [x] [`_mm512_mask_broadcastw_epi16`]
7591
* [x] [`_mm512_maskz_broadcastw_epi16`]
92+
* [x] [`_mm_mask_broadcastw_epi16`]
93+
* [x] [`_mm_maskz_broadcastw_epi16`]
94+
* [x] [`_mm256_mask_broadcastw_epi16`]
95+
* [x] [`_mm256_maskz_broadcastw_epi16`]
7696
* [x] [`_mm512_bslli_epi128`]
7797
* [x] [`_mm512_bsrli_epi128`]
7898
* [x] [`_mm512_cmp_epi16_mask`]
@@ -199,9 +219,17 @@
199219
* [x] [`_mm512_madd_epi16`]
200220
* [x] [`_mm512_mask_madd_epi16`]
201221
* [x] [`_mm512_maskz_madd_epi16`]
222+
* [x] [`_mm_mask_madd_epi16`]
223+
* [x] [`_mm_maskz_madd_epi16`]
224+
* [x] [`_mm256_mask_madd_epi16`]
225+
* [x] [`_mm256_maskz_madd_epi16`]
202226
* [x] [`_mm512_maddubs_epi16`]
203227
* [x] [`_mm512_mask_maddubs_epi16`]
204228
* [x] [`_mm512_maskz_maddubs_epi16`]
229+
* [x] [`_mm_mask_maddubs_epi16`]
230+
* [x] [`_mm_maskz_maddubs_epi16`]
231+
* [x] [`_mm256_mask_maddubs_epi16`]
232+
* [x] [`_mm256_maskz_maddubs_epi16`]
205233
* [x] [`_mm512_mask_max_epi16`]
206234
* [x] [`_mm512_maskz_max_epi16`]
207235
* [x] [`_mm512_max_epi16`]
@@ -260,8 +288,16 @@
260288
* [x] [`_mm256_maskz_min_epu8`]
261289
* [x] [`_mm512_mask_mov_epi16`]
262290
* [x] [`_mm512_maskz_mov_epi16`]
291+
* [x] [`_mm_mask_mov_epi16`]
292+
* [x] [`_mm_maskz_mov_epi16`]
293+
* [x] [`_mm256_mask_mov_epi16`]
294+
* [x] [`_mm256_maskz_mov_epi16`]
263295
* [x] [`_mm512_mask_mov_epi8`]
264296
* [x] [`_mm512_maskz_mov_epi8`]
297+
* [x] [`_mm_mask_mov_epi8`]
298+
* [x] [`_mm_maskz_mov_epi8`]
299+
* [x] [`_mm256_mask_mov_epi8`]
300+
* [x] [`_mm256_maskz_mov_epi8`]
265301
* [x] [`_mm512_movepi16_mask`]
266302
* [x] [`_mm512_movepi8_mask`]
267303
* [x] [`_mm512_movm_epi16`]
@@ -297,27 +333,65 @@
297333
* [x] [`_mm512_mask_packs_epi16`]
298334
* [x] [`_mm512_maskz_packs_epi16`]
299335
* [x] [`_mm512_packs_epi16`]
336+
* [x] [`_mm_mask_packs_epi16`]
337+
* [x] [`_mm_maskz_packs_epi16`]
338+
* [x] [`_mm256_mask_packs_epi16`]
339+
* [x] [`_mm256_maskz_packs_epi16`]
300340
* [x] [`_mm512_mask_packs_epi32`]
301341
* [x] [`_mm512_maskz_packs_epi32`]
302342
* [x] [`_mm512_packs_epi32`]
343+
* [x] [`_mm_mask_packs_epi32`]
344+
* [x] [`_mm_maskz_packs_epi32`]
345+
* [x] [`_mm256_mask_packs_epi32`]
346+
* [x] [`_mm256_maskz_packs_epi32`]
303347
* [x] [`_mm512_mask_packus_epi16`]
304348
* [x] [`_mm512_maskz_packus_epi16`]
305349
* [x] [`_mm512_packus_epi16`]
350+
* [x] [`_mm_mask_packus_epi16`]
351+
* [x] [`_mm_maskz_packus_epi16`]
352+
* [x] [`_mm256_mask_packus_epi16`]
353+
* [x] [`_mm256_maskz_packus_epi16`]
306354
* [x] [`_mm512_mask_packus_epi32`]
307355
* [x] [`_mm512_maskz_packus_epi32`]
308356
* [x] [`_mm512_packus_epi32`]
357+
* [x] [`_mm_mask_packus_epi32`]
358+
* [x] [`_mm_maskz_packus_epi32`]
359+
* [x] [`_mm256_mask_packus_epi32`]
360+
* [x] [`_mm256_maskz_packus_epi32`]
309361
* [x] [`_mm512_mask_permutex2var_epi16`]
310362
* [x] [`_mm512_mask2_permutex2var_epi16`]
311363
* [x] [`_mm512_maskz_permutex2var_epi16`]
312364
* [x] [`_mm512_permutex2var_epi16`]
365+
* [x] [`_mm_mask_permutex2var_epi16`]
366+
* [x] [`_mm_mask2_permutex2var_epi16`]
367+
* [x] [`_mm_maskz_permutex2var_epi16`]
368+
* [x] [`_mm_permutex2var_epi16`]
369+
* [x] [`_mm256_mask_permutex2var_epi16`]
370+
* [x] [`_mm256_mask2_permutex2var_epi16`]
371+
* [x] [`_mm256_maskz_permutex2var_epi16`]
372+
* [x] [`_mm256_permutex2var_epi16`]
313373
* [x] [`_mm512_mask_permutexvar_epi16`]
314374
* [x] [`_mm512_maskz_permutexvar_epi16`]
315375
* [x] [`_mm512_permutexvar_epi16`]
376+
* [x] [`_mm_mask_permutexvar_epi16`]
377+
* [x] [`_mm_maskz_permutexvar_epi16`]
378+
* [x] [`_mm_permutexvar_epi16`]
379+
* [x] [`_mm256_mask_permutexvar_epi16`]
380+
* [x] [`_mm256_maskz_permutexvar_epi16`]
381+
* [x] [`_mm256_permutexvar_epi16`]
316382
* [x] [`_mm512_sad_epu8`]
317383
* [x] [`_mm512_mask_set1_epi16`]
318384
* [x] [`_mm512_maskz_set1_epi16`]
385+
* [x] [`_mm_mask_set1_epi16`]
386+
* [x] [`_mm_maskz_set1_epi16`]
387+
* [x] [`_mm256_mask_set1_epi16`]
388+
* [x] [`_mm256_maskz_set1_epi16`]
319389
* [x] [`_mm512_mask_set1_epi8`]
320390
* [x] [`_mm512_maskz_set1_epi8`]
391+
* [x] [`_mm_mask_set1_epi8`]
392+
* [x] [`_mm_maskz_set1_epi8`]
393+
* [x] [`_mm256_mask_set1_epi8`]
394+
* [x] [`_mm256_maskz_set1_epi8`]
321395
* [x] [`_mm512_mask_shuffle_epi8`]
322396
* [x] [`_mm512_maskz_shuffle_epi8`]
323397
* [x] [`_mm512_shuffle_epi8`]
@@ -330,30 +404,72 @@
330404
* [x] [`_mm512_mask_sll_epi16`]
331405
* [x] [`_mm512_maskz_sll_epi16`]
332406
* [x] [`_mm512_sll_epi16`]
407+
* [x] [`_mm_mask_sll_epi16`]
408+
* [x] [`_mm_maskz_sll_epi16`]
409+
* [x] [`_mm256_mask_sll_epi16`]
410+
* [x] [`_mm256_maskz_sll_epi16`]
333411
* [x] [`_mm512_mask_slli_epi16`]
334412
* [x] [`_mm512_maskz_slli_epi16`]
335413
* [x] [`_mm512_slli_epi16`]
414+
* [x] [`_mm_mask_slli_epi16
415+
* [x] [`_mm_maskz_slli_epi16
416+
* [x] [`_mm256_mask_slli_epi16
417+
* [x] [`_mm256_maskz_slli_epi16
336418
* [x] [`_mm512_mask_sllv_epi16`]
337419
* [x] [`_mm512_maskz_sllv_epi16`]
338420
* [x] [`_mm512_sllv_epi16`]
421+
* [x] [`_mm_mask_sllv_epi16`]
422+
* [x] [`_mm_maskz_sllv_epi16`]
423+
* [x] [`_mm_sllv_epi16`]
424+
* [x] [`_mm256_mask_sllv_epi16`]
425+
* [x] [`_mm256_maskz_sllv_epi16`]
426+
* [x] [`_mm256_sllv_epi16`]
339427
* [x] [`_mm512_mask_sra_epi16`]
340428
* [x] [`_mm512_maskz_sra_epi16`]
341429
* [x] [`_mm512_sra_epi16`]
430+
* [x] [`_mm_mask_sra_epi16`]
431+
* [x] [`_mm_maskz_sra_epi16`]
432+
* [x] [`_mm256_mask_sra_epi16`]
433+
* [x] [`_mm256_maskz_sra_epi16`]
342434
* [x] [`_mm512_mask_srai_epi16`]
343435
* [x] [`_mm512_maskz_srai_epi16`]
344436
* [x] [`_mm512_srai_epi16`]
437+
* [x] [`_mm_mask_srai_epi16`]
438+
* [x] [`_mm_maskz_srai_epi16`]
439+
* [x] [`_mm256_mask_srai_epi16`]
440+
* [x] [`_mm256_maskz_srai_epi16`]
345441
* [x] [`_mm512_mask_srav_epi16`]
346442
* [x] [`_mm512_maskz_srav_epi16`]
347443
* [x] [`_mm512_srav_epi16`]
444+
* [_] [`_mm_mask_srav_epi16`]
445+
* [_] [`_mm_maskz_srav_epi16`]
446+
* [_] [`_mm_srav_epi16`]
447+
* [_] [`_mm256_mask_srav_epi16`]
448+
* [_] [`_mm256_maskz_srav_epi16`]
449+
* [_] [`_mm256_srav_epi16`]
348450
* [x] [`_mm512_mask_srl_epi16`]
349451
* [x] [`_mm512_maskz_srl_epi16`]
350452
* [x] [`_mm512_srl_epi16`]
453+
* [x] [`_mm_mask_srl_epi16`]
454+
* [x] [`_mm_maskz_srl_epi16`]
455+
* [x] [`_mm256_mask_srl_epi16`]
456+
* [x] [`_mm256_maskz_srl_epi16`]
351457
* [x] [`_mm512_mask_srli_epi16`]
352458
* [x] [`_mm512_maskz_srli_epi16`]
353459
* [x] [`_mm512_srli_epi16`]
460+
* [x] [`_mm_mask_srli_epi16`]
461+
* [x] [`_mm_maskz_srli_epi16`]
462+
* [x] [`_mm256_mask_srli_epi16`]
463+
* [x] [`_mm256_maskz_srli_epi16`]
354464
* [x] [`_mm512_mask_srlv_epi16`]
355465
* [x] [`_mm512_maskz_srlv_epi16`]
356466
* [x] [`_mm512_srlv_epi16`]
467+
* [x] [`_mm_mask_srlv_epi16`]
468+
* [x] [`_mm_maskz_srlv_epi16`]
469+
* [x] [`_mm_srlv_epi16`]
470+
* [x] [`_mm256_mask_srlv_epi16`]
471+
* [x] [`_mm256_maskz_srlv_epi16`]
472+
* [x] [`_mm256_srlv_epi16`]
357473
* [x] [`_store_mask32`]
358474
* [x] [`_store_mask64`]
359475
* [_] [`_mm512_mask_storeu_epi16`]
@@ -413,14 +529,30 @@
413529
* [x] [`_mm512_mask_unpackhi_epi16`]
414530
* [x] [`_mm512_maskz_unpackhi_epi16`]
415531
* [x] [`_mm512_unpackhi_epi16`]
532+
* [x] [`_mm_mask_unpackhi_epi16`]
533+
* [x] [`_mm_maskz_unpackhi_epi16`]
534+
* [x] [`_mm256_mask_unpackhi_epi16`]
535+
* [x] [`_mm256_maskz_unpackhi_epi16`]
416536
* [x] [`_mm512_mask_unpackhi_epi8`]
417537
* [x] [`_mm512_maskz_unpackhi_epi8`]
418538
* [x] [`_mm512_unpackhi_epi8`]
539+
* [x] [`_mm_mask_unpackhi_epi8`]
540+
* [x] [`_mm_maskz_unpackhi_epi8`]
541+
* [x] [`_mm256_mask_unpackhi_epi8`]
542+
* [x] [`_mm256_maskz_unpackhi_epi8`]
419543
* [x] [`_mm512_mask_unpacklo_epi16`]
420544
* [x] [`_mm512_maskz_unpacklo_epi16`]
421545
* [x] [`_mm512_unpacklo_epi16`]
546+
* [x] [`_mm_mask_unpacklo_epi16`]
547+
* [x] [`_mm_maskz_unpacklo_epi16`]
548+
* [x] [`_mm256_mask_unpacklo_epi16`]
549+
* [x] [`_mm256_maskz_unpacklo_epi16`]
422550
* [x] [`_mm512_mask_unpacklo_epi8`]
423551
* [x] [`_mm512_maskz_unpacklo_epi8`]
424552
* [x] [`_mm512_unpacklo_epi8`]
553+
* [x] [`_mm_mask_unpacklo_epi8`]
554+
* [x] [`_mm_maskz_unpacklo_epi8`]
555+
* [x] [`_mm256_mask_unpacklo_epi8`]
556+
* [x] [`_mm256_maskz_unpacklo_epi8`]
425557

426558
</p>

0 commit comments

Comments
 (0)