@@ -300,10 +300,20 @@ entry:
300
300
}
301
301
302
302
define <16 x i8 > @test_load_nt16xi8 (<16 x i8 >* nocapture %ptr ) {
303
- ; SSE-LABEL: test_load_nt16xi8:
304
- ; SSE: # %bb.0: # %entry
305
- ; SSE-NEXT: movntdqa (%rdi), %xmm0
306
- ; SSE-NEXT: retq
303
+ ; SSE2-LABEL: test_load_nt16xi8:
304
+ ; SSE2: # %bb.0: # %entry
305
+ ; SSE2-NEXT: movdqa (%rdi), %xmm0
306
+ ; SSE2-NEXT: retq
307
+ ;
308
+ ; SSE4A-LABEL: test_load_nt16xi8:
309
+ ; SSE4A: # %bb.0: # %entry
310
+ ; SSE4A-NEXT: movdqa (%rdi), %xmm0
311
+ ; SSE4A-NEXT: retq
312
+ ;
313
+ ; SSE41-LABEL: test_load_nt16xi8:
314
+ ; SSE41: # %bb.0: # %entry
315
+ ; SSE41-NEXT: movntdqa (%rdi), %xmm0
316
+ ; SSE41-NEXT: retq
307
317
;
308
318
; AVX-LABEL: test_load_nt16xi8:
309
319
; AVX: # %bb.0: # %entry
@@ -320,10 +330,20 @@ entry:
320
330
}
321
331
322
332
define <8 x i16 > @test_load_nt8xi16 (<8 x i16 >* nocapture %ptr ) {
323
- ; SSE-LABEL: test_load_nt8xi16:
324
- ; SSE: # %bb.0: # %entry
325
- ; SSE-NEXT: movntdqa (%rdi), %xmm0
326
- ; SSE-NEXT: retq
333
+ ; SSE2-LABEL: test_load_nt8xi16:
334
+ ; SSE2: # %bb.0: # %entry
335
+ ; SSE2-NEXT: movdqa (%rdi), %xmm0
336
+ ; SSE2-NEXT: retq
337
+ ;
338
+ ; SSE4A-LABEL: test_load_nt8xi16:
339
+ ; SSE4A: # %bb.0: # %entry
340
+ ; SSE4A-NEXT: movdqa (%rdi), %xmm0
341
+ ; SSE4A-NEXT: retq
342
+ ;
343
+ ; SSE41-LABEL: test_load_nt8xi16:
344
+ ; SSE41: # %bb.0: # %entry
345
+ ; SSE41-NEXT: movntdqa (%rdi), %xmm0
346
+ ; SSE41-NEXT: retq
327
347
;
328
348
; AVX-LABEL: test_load_nt8xi16:
329
349
; AVX: # %bb.0: # %entry
@@ -340,10 +360,20 @@ entry:
340
360
}
341
361
342
362
define <4 x i32 > @test_load_nt4xi32 (<4 x i32 >* nocapture %ptr ) {
343
- ; SSE-LABEL: test_load_nt4xi32:
344
- ; SSE: # %bb.0: # %entry
345
- ; SSE-NEXT: movntdqa (%rdi), %xmm0
346
- ; SSE-NEXT: retq
363
+ ; SSE2-LABEL: test_load_nt4xi32:
364
+ ; SSE2: # %bb.0: # %entry
365
+ ; SSE2-NEXT: movdqa (%rdi), %xmm0
366
+ ; SSE2-NEXT: retq
367
+ ;
368
+ ; SSE4A-LABEL: test_load_nt4xi32:
369
+ ; SSE4A: # %bb.0: # %entry
370
+ ; SSE4A-NEXT: movdqa (%rdi), %xmm0
371
+ ; SSE4A-NEXT: retq
372
+ ;
373
+ ; SSE41-LABEL: test_load_nt4xi32:
374
+ ; SSE41: # %bb.0: # %entry
375
+ ; SSE41-NEXT: movntdqa (%rdi), %xmm0
376
+ ; SSE41-NEXT: retq
347
377
;
348
378
; AVX-LABEL: test_load_nt4xi32:
349
379
; AVX: # %bb.0: # %entry
@@ -360,10 +390,20 @@ entry:
360
390
}
361
391
362
392
define <2 x i64 > @test_load_nt2xi64 (<2 x i64 >* nocapture %ptr ) {
363
- ; SSE-LABEL: test_load_nt2xi64:
364
- ; SSE: # %bb.0: # %entry
365
- ; SSE-NEXT: movntdqa (%rdi), %xmm0
366
- ; SSE-NEXT: retq
393
+ ; SSE2-LABEL: test_load_nt2xi64:
394
+ ; SSE2: # %bb.0: # %entry
395
+ ; SSE2-NEXT: movdqa (%rdi), %xmm0
396
+ ; SSE2-NEXT: retq
397
+ ;
398
+ ; SSE4A-LABEL: test_load_nt2xi64:
399
+ ; SSE4A: # %bb.0: # %entry
400
+ ; SSE4A-NEXT: movdqa (%rdi), %xmm0
401
+ ; SSE4A-NEXT: retq
402
+ ;
403
+ ; SSE41-LABEL: test_load_nt2xi64:
404
+ ; SSE41: # %bb.0: # %entry
405
+ ; SSE41-NEXT: movntdqa (%rdi), %xmm0
406
+ ; SSE41-NEXT: retq
367
407
;
368
408
; AVX-LABEL: test_load_nt2xi64:
369
409
; AVX: # %bb.0: # %entry
0 commit comments