JuliaGPU
diff --git a/‎test/bpf.jl
Lines changed: 21 additions & 8 deletions b/‎test/bpf.jl
Lines changed: 21 additions & 8 deletions
diff --git a/‎test/gcn.jl
Lines changed: 62 additions & 39 deletions b/‎test/gcn.jl
Lines changed: 62 additions & 39 deletions
diff --git a/‎test/metal.jl
Lines changed: 53 additions & 34 deletions b/‎test/metal.jl
Lines changed: 53 additions & 34 deletions
@@ -1,20 +1,30 @@
 @testset "No-op" begin
     kernel() = 0
 
-    output = sprint(io->BPF.code_native(io, kernel, ()))
-    @test occursin("\tr0 = 0\n\texit", output)
+    @test @filecheck begin
+        check"CHECK: r0 = 0"
+        check"CHECK-NEXT: exit"
+        BPF.code_native(kernel, ())
+    end
 end
 @testset "Return argument" begin
     kernel(x) = x
 
-    output = sprint(io->BPF.code_native(io, kernel, (UInt64,)))
-    @test occursin("\tr0 = r1\n\texit", output)
+    @test @filecheck begin
+        check"CHECK: r0 = r1"
+        check"CHECK-NEXT: exit"
+        BPF.code_native(kernel, (UInt64,))
+    end
 end
 @testset "Addition" begin
     kernel(x) = x+1
 
-    output = sprint(io->BPF.code_native(io, kernel, (UInt64,)))
-    @test occursin("\tr0 = r1\n\tr0 += 1\n\texit", output)
+    @test @filecheck begin
+        check"CHECK: r0 = r1"
+        check"CHECK-NEXT: r0 += 1"
+        check"CHECK-NEXT: exit"
+        BPF.code_native(kernel, (UInt64,))
+    end
 end
 @testset "Errors" begin
     kernel(x) = fakefunc(x)
@@ -26,8 +36,11 @@ end
         goodcall(x) = Base.llvmcall("%2 = call i64 inttoptr (i64 3 to i64 (i64)*)(i64 %0)\nret i64 %2", Int, Tuple{Int}, x)
         kernel(x) = goodcall(x)
 
-        output = sprint(io->BPF.code_native(io, kernel, (Int,)))
-        @test occursin(r"\tcall .*\n\texit", output)
+        @test @filecheck begin
+            check"CHECK: call"
+            check"CHECK-NEXT: exit"
+            BPF.code_native(kernel, (Int,))
+        end
     end
     @testset "invalid" begin
         badcall(x) = Base.llvmcall("%2 = call i64 inttoptr (i64 3000 to i64 (i64)*)(i64 %0)\nret i64 %2", Int, Tuple{Int}, x)
 
@@ -4,12 +4,15 @@ if :AMDGPU in LLVM.backends()
 @testset "kernel calling convention" begin
     kernel() = return
 
-    ir = sprint(io->GCN.code_llvm(io, kernel, Tuple{}; dump_module=true))
-    @test !occursin("amdgpu_kernel", ir)
+    @test @filecheck begin
+        check"CHECK-NOT: amdgpu_kernel"
+        GCN.code_llvm(kernel, Tuple{}; dump_module=true)
+    end
 
-    ir = sprint(io->GCN.code_llvm(io, kernel, Tuple{};
-                                         dump_module=true, kernel=true))
-    @test occursin("amdgpu_kernel", ir)
+    @test @filecheck begin
+        check"CHECK: amdgpu_kernel"
+        GCN.code_llvm(kernel, Tuple{}; dump_module=true, kernel=true)
+    end
 end
 
 end
@@ -27,8 +30,10 @@ end
         return
     end
 
-    asm = sprint(io->GCN.code_native(io, kernel, Tuple{}))
-    @test occursin("s_trap 2", asm)
+    @test @filecheck begin
+        check"CHECK: s_trap 2"
+        GCN.code_native(kernel, Tuple{})
+    end
     @test_skip occursin("s_cbranch_execz", asm)
     if Base.libllvm_version < v"9"
         @test_broken occursin("v_readfirstlane", asm)
@@ -44,9 +49,11 @@ end
         return
     end
 
-    asm = sprint(io->GCN.code_native(io, parent, Tuple{Int64}; dump_module=true))
-    @test occursin(r"s_add_u32.*(julia|j)_child_.*@rel32@", asm)
-    @test occursin(r"s_addc_u32.*(julia|j)_child_.*@rel32@", asm)
+    @test @filecheck begin
+        check"CHECK: s_add_u32{{.*(julia|j)_child_.*}}@rel32@"
+        check"CHECK: s_addc_u32{{.*(julia|j)_child_.*}}@rel32@"
+        GCN.code_native(parent, Tuple{Int64}; dump_module=true)
+    end
 end
 
 @testset "kernel functions" begin
@@ -56,10 +63,12 @@ end
         return
     end
 
-    asm = sprint(io->GCN.code_native(io, entry, Tuple{Int64}; dump_module=true, kernel=true))
-    @test occursin(r"\.amdhsa_kernel \w*entry", asm)
-    @test !occursin(r"\.amdhsa_kernel \w*nonentry", asm)
-    @test occursin(r"\.type.*\w*nonentry\w*,@function", asm)
+    @test @filecheck begin
+        check"CHECK-NOT: .amdhsa_kernel {{.*}}nonentry"
+        check"CHECK: .type {{.*nonentry.*}},@function"
+        check"CHECK: .amdhsa_kernel {{.*entry.*}}"
+        GCN.code_native(entry, Tuple{Int64}; dump_module=true, kernel=true)
+    end
 end
 
 @testset "child function reuse" begin
@@ -80,11 +89,15 @@ end
         end
     end
 
-    asm = sprint(io->GCN.code_native(io, mod.parent1, Tuple{Int}; dump_module=true))
-    @test occursin(r"\.type.*(julia|j)_[[:alnum:]_.]*child_\d*,@function", asm)
+    @test @filecheck begin
+        check"CHECK: .type {{.*child.*}},@function"
+        GCN.code_native(mod.parent1, Tuple{Int}; dump_module=true)
+    end
 
-    asm = sprint(io->GCN.code_native(io, mod.parent2, Tuple{Int}; dump_module=true))
-    @test occursin(r"\.type.*(julia|j)_[[:alnum:]_.]*child_\d*,@function", asm)
+    @test @filecheck begin
+        check"CHECK: .type {{.*child.*}},@function"
+        GCN.code_native(mod.parent2, Tuple{Int}; dump_module=true)
+    end
 end
 
 @testset "child function reuse bis" begin
@@ -106,13 +119,17 @@ end
         end
     end
 
-    asm = sprint(io->GCN.code_native(io, mod.parent1, Tuple{Int}; dump_module=true))
-    @test occursin(r"\.type.*(julia|j)_[[:alnum:]_.]*child1_\d*,@function", asm)
-    @test occursin(r"\.type.*(julia|j)_[[:alnum:]_.]*child2_\d*,@function", asm)
+    @test @filecheck begin
+        check"CHECK-DAG: .type {{.*child1.*}},@function"
+        check"CHECK-DAG: .type {{.*child2.*}},@function"
+        GCN.code_native(mod.parent1, Tuple{Int}; dump_module=true)
+    end
 
-    asm = sprint(io->GCN.code_native(io, mod.parent2, Tuple{Int}; dump_module=true))
-    @test occursin(r"\.type.*(julia|j)_[[:alnum:]_.]*child1_\d*,@function", asm)
-    @test occursin(r"\.type.*(julia|j)_[[:alnum:]_.]*child2_\d*,@function", asm)
+    @test @filecheck begin
+        check"CHECK-DAG: .type {{.*child1.*}},@function"
+        check"CHECK-DAG: .type {{.*child2.*}},@function"
+        GCN.code_native(mod.parent2, Tuple{Int}; dump_module=true)
+    end
 end
 
 @testset "indirect sysimg function use" begin
@@ -127,9 +144,11 @@ end
         return
     end
 
-    asm = sprint(io->GCN.code_native(io, kernel, Tuple{Ptr{Int32}}))
-    @test !occursin("jl_throw", asm)
-    @test !occursin("jl_invoke", asm)   # forced recompilation should still not invoke
+    @test @filecheck begin
+        check"CHECK-NOT: jl_throw"
+        check"CHECK-NOT: jl_invoke"
+        GCN.code_native(kernel, Tuple{Ptr{Int32}})
+    end
 end
 
 @testset "LLVM intrinsics" begin
@@ -171,12 +190,14 @@ false && @testset "GC and TLS lowering" begin
         end
     end
 
-    asm = sprint(io->GCN.code_native(io, mod.kernel, Tuple{Int}))
-    @test occursin("gpu_gc_pool_alloc", asm)
-    @test !occursin("julia.push_gc_frame", asm)
-    @test !occursin("julia.pop_gc_frame", asm)
-    @test !occursin("julia.get_gc_frame_slot", asm)
-    @test !occursin("julia.new_gc_frame", asm)
+    @test @filecheck begin
+        check"CHECK-NOT: jl_push_gc_frame"
+        check"CHECK-NOT: jl_pop_gc_frame"
+        check"CHECK-NOT: jl_get_gc_frame_slot"
+        check"CHECK-NOT: jl_new_gc_frame"
+        check"CHECK: gpu_gc_pool_alloc"
+        GCN.code_native(mod.kernel, Tuple{Int})
+    end
 
     # make sure that we can still ellide allocations
     function ref_kernel(ptr, i)
@@ -191,10 +212,10 @@ false && @testset "GC and TLS lowering" begin
         return nothing
     end
 
-    asm = sprint(io->GCN.code_native(io, ref_kernel, Tuple{Ptr{Int64}, Int}))
-
-
-    @test !occursin("gpu_gc_pool_alloc", asm)
+    @test @filecheck begin
+        check"CHECK-NOT: gpu_gc_pool_alloc"
+        GCN.code_native(ref_kernel, Tuple{Ptr{Int64}, Int})
+    end
 end
 
 @testset "float boxes" begin
@@ -208,8 +229,10 @@ end
         return
     end
 
-    ir = sprint(io->GCN.code_llvm(io, kernel, Tuple{Float32,Ptr{Float32}}))
-    @test occursin("jl_box_float32", ir)
+    @test @filecheck begin
+        check"CHECK: jl_box_float32"
+        GCN.code_llvm(kernel, Tuple{Float32,Ptr{Float32}})
+    end
     GCN.code_native(devnull, kernel, Tuple{Float32,Ptr{Float32}})
 end
 
 
@@ -4,44 +4,54 @@
 @testset "byref aggregates" begin
     kernel(x) = return
 
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{Tuple{Int}}))
-    @test occursin(r"@\w*kernel\w*\(({ i64 }|\[1 x i64\])\*", ir) ||
-          occursin(r"@\w*kernel\w*\(ptr", ir)
+    @test @filecheck begin
+        check"TYPED: @{{.*kernel.*}}({{(\{ i64 \}|\[1 x i64\])}}*"
+        check"OPAQUE: @{{.*kernel.*}}(ptr"
+        Metal.code_llvm(kernel, Tuple{Tuple{Int}})
+    end
 
     # for kernels, every pointer argument needs to take an address space
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{Tuple{Int}}; kernel=true))
-    @test occursin(r"@\w*kernel\w*\(({ i64 }|\[1 x i64\]) addrspace\(1\)\*", ir) ||
-          occursin(r"@\w*kernel\w*\(ptr addrspace\(1\)", ir)
+    @test @filecheck begin
+        check"TYPED: @{{.*kernel.*}}({{(\{ i64 \}|\[1 x i64\])}} addrspace(1)*"
+        check"OPAQUE: @{{.*kernel.*}}(ptr addrspace(1)"
+        Metal.code_llvm(kernel, Tuple{Tuple{Int}}; kernel=true)
+    end
 end
 
 @testset "byref primitives" begin
     kernel(x) = return
 
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{Int}))
-    @test occursin(r"@\w*kernel\w*\(i64 ", ir)
+    @test @filecheck begin
+        check"CHECK: @{{.*kernel.*}}(i64 "
+        Metal.code_llvm(kernel, Tuple{Int})
+    end
 
     # for kernels, every pointer argument needs to take an address space
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{Int}; kernel=true))
-    @test occursin(r"@\w*kernel\w*\(i64 addrspace\(1\)\*", ir) ||
-          occursin(r"@\w*kernel\w*\(ptr addrspace\(1\)", ir)
+    @test @filecheck begin
+        check"TYPED: @{{.*kernel.*}}(i64 addrspace(1)*"
+        check"OPAQUE: @{{.*kernel.*}}(ptr addrspace(1)"
+        Metal.code_llvm(kernel, Tuple{Int}; kernel=true)
+    end
 end
 
 @testset "module metadata" begin
     kernel() = return
 
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{};
-                                    dump_module=true, kernel=true))
-    @test occursin("air.version", ir)
-    @test occursin("air.language_version", ir)
-    @test occursin("air.max_device_buffers", ir)
+    @test @filecheck begin
+        check"CHECK: air.version"
+        check"CHECK: air.language_version"
+        check"CHECK: air.max_device_buffers"
+        Metal.code_llvm(kernel, Tuple{}; dump_module=true, kernel=true)
+    end
 end
 
 @testset "argument metadata" begin
     kernel(x) = return
 
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{Int};
-                                    dump_module=true, kernel=true))
-    @test occursin("air.buffer", ir)
+    @test @filecheck begin
+        check"CHECK: air.buffer"
+        Metal.code_llvm(kernel, Tuple{Int}; dump_module=true, kernel=true)
+    end
 
     # XXX: perform more exhaustive testing of argument passing metadata here,
     #      or just defer to execution testing in Metal.jl?
@@ -54,23 +64,29 @@ end
         return
     end
 
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{Core.LLVMPtr{Int,1}}))
-    @test occursin(r"@\w*kernel\w*\(.* addrspace\(1\)\* %.+\)", ir) ||
-          occursin(r"@\w*kernel\w*\(ptr addrspace\(1\) %.+\)", ir)
-    @test occursin(r"call i32 @julia.air.thread_position_in_threadgroup.i32", ir)
+    @test @filecheck begin
+        check"TYPED: @{{.*kernel.*}}({{.*}} addrspace(1)* %{{.+}})"
+        check"OPAQUE: @{{.*kernel.*}}(ptr addrspace(1) %{{.+}})"
+        check"CHECK: call i32 @julia.air.thread_position_in_threadgroup.i32"
+        Metal.code_llvm(kernel, Tuple{Core.LLVMPtr{Int,1}})
+    end
 
-    ir = sprint(io->Metal.code_llvm(io, kernel, Tuple{Core.LLVMPtr{Int,1}}; kernel=true))
-    @test occursin(r"@\w*kernel\w*\(.* addrspace\(1\)\* %.+, i32 %thread_position_in_threadgroup\)", ir) ||
-          occursin(r"@\w*kernel\w*\(ptr addrspace\(1\) %.+, i32 %thread_position_in_threadgroup\)", ir)
-    @test !occursin(r"call i32 @julia.air.thread_position_in_threadgroup.i32", ir)
+    @test @filecheck begin
+        check"TYPED: @{{.*kernel.*}}({{.*}} addrspace(1)* %{{.+}}, i32 %thread_position_in_threadgroup)"
+        check"OPAQUE: @{{.*kernel.*}}(ptr addrspace(1) %{{.+}}, i32 %thread_position_in_threadgroup)"
+        check"CHECK-NOT: call i32 @julia.air.thread_position_in_threadgroup.i32"
+        Metal.code_llvm(kernel, Tuple{Core.LLVMPtr{Int,1}}; kernel=true)
+    end
 end
 
 @testset "vector intrinsics" begin
     foo(x, y) = ccall("llvm.smax.v2i64", llvmcall, NTuple{2, VecElement{Int64}},
                       (NTuple{2, VecElement{Int64}}, NTuple{2, VecElement{Int64}}), x, y)
 
-    ir = sprint(io->Metal.code_llvm(io, foo, (NTuple{2, VecElement{Int64}}, NTuple{2, VecElement{Int64}})))
-    @test occursin("air.max.s.v2i64", ir)
+    @test @filecheck begin
+        check"CHECK: air.max.s.v2i64"
+        Metal.code_llvm(foo, (NTuple{2, VecElement{Int64}}, NTuple{2, VecElement{Int64}}))
+    end
 end
 
 @testset "unsupported type detection" begin
@@ -104,8 +120,10 @@ end
         return
     end
 
-    ir = sprint(io->Metal.code_llvm(io, kernel1, Tuple{Core.LLVMPtr{Float32,1}}; validate=true))
-    @test occursin("@metal_os_log", ir)
+    @test @filecheck begin
+        check"CHECK: @metal_os_log"
+        Metal.code_llvm(kernel1, Tuple{Core.LLVMPtr{Float32,1}}; validate=true)
+    end
 
     function kernel2(ptr)
         val = unsafe_load(ptr)
@@ -130,9 +148,10 @@ end
         end
     end
 
-    ir = sprint(io->Metal.code_llvm(io, mod.kernel, Tuple{Core.LLVMPtr{Float32,1}, Int};
-                                    dump_module=true, kernel=true))
-    @test occursin("addrspace(2) constant [2 x float]", ir)
+    @test @filecheck begin
+        check"CHECK: addrspace(2) constant [2 x float]"
+        Metal.code_llvm(mod.kernel, Tuple{Core.LLVMPtr{Float32,1}, Int}; dump_module=true, kernel=true)
+    end
 end
 
 end