Partially handle convolution

pxl-th · pxl-th · commit 211ab212b6e9 · 2023-02-16T01:03:34.000+02:00
diff --git a/ext/AMDGPUExt/functor.jl b/ext/AMDGPUExt/functor.jl
@@ -18,7 +18,23 @@ adapt_storage(::FluxAMDAdaptor, x::AbstractRNG) = error("""
     Cannot map RNG of type $(typeof(x)) to AMDGPU.
     AMDGPU execution only supports Random.default_rng().""")
 
-# TODO adaptor for Conv
+function adapt_storage(to::FluxAMDAdaptor, m::Flux.Conv)
+    Flux.Conv(
+        Adapt.adapt(to, m.σ),
+        Adapt.adapt(to, m.weight[end:-1:1, end:-1:1, :, :]),
+        Adapt.adapt(to, m.bias),
+        m.stride, m.pad, m.dilation, m.groups)
+end
+
+# # Don't adapt again.
+# function adapt_storage(
+#     to::FluxAMDAdaptor, m::Flux.Conv{N, M, F, A, V},
+# ) where {N, M, F, A <: ROCArray, V}
+#     return m
+# end
+
+# TODO GPU -> CPU adaptor
+# TODO don't adapt again when already on AMDGPU
 
 adapt_storage(::FluxCPUAdaptor, x::AMDGPU.rocRAND.RNG) = Random.default_rng()
 
@@ -40,3 +56,12 @@ function _amd(x)
         fmap(x -> Adapt.adapt(FluxAMDAdaptor(), x), x; exclude=_isleaf) :
         x
 end
+
+function _amd(m::Flux.Conv)
+    to = FluxAMDAdaptor()
+    Flux.Conv(
+        Adapt.adapt(to, m.σ),
+        Adapt.adapt(to, m.weight[end:-1:1, end:-1:1, :, :]),
+        Adapt.adapt(to, m.bias),
+        m.stride, m.pad, m.dilation, m.groups)
+end
diff --git a/test/amd/basic.jl b/test/amd/basic.jl
@@ -1,60 +1,72 @@
 @test Flux.AMDGPU_LOADED[]
 
-@testset "Basic GPU movement" begin
-    @test Flux.amd(rand(Float64, 16)) isa ROCArray{Float32, 1}
-    @test Flux.amd(rand(Float64, 16, 16)) isa ROCArray{Float32, 2}
-    @test Flux.amd(rand(Float32, 16, 16)) isa ROCArray{Float32, 2}
-    @test Flux.amd(rand(Float16, 16, 16, 16)) isa ROCArray{Float16, 3}
+# @testset "Basic GPU movement" begin
+#     @test Flux.amd(rand(Float64, 16)) isa ROCArray{Float32, 1}
+#     @test Flux.amd(rand(Float64, 16, 16)) isa ROCArray{Float32, 2}
+#     @test Flux.amd(rand(Float32, 16, 16)) isa ROCArray{Float32, 2}
+#     @test Flux.amd(rand(Float16, 16, 16, 16)) isa ROCArray{Float16, 3}
 
-    @test gradient(x -> sum(Flux.amd(x)), rand(Float32, 4, 4)) isa Tuple
-    @test gradient(x -> sum(cpu(x)), AMDGPU.rand(Float32, 4, 4)) isa Tuple
-end
+#     @test gradient(x -> sum(Flux.amd(x)), rand(Float32, 4, 4)) isa Tuple
+#     @test gradient(x -> sum(cpu(x)), AMDGPU.rand(Float32, 4, 4)) isa Tuple
+# end
 
-@testset "Dense no bias" begin
-    m = Dense(3 => 4; bias=false) |> Flux.amd
-    x = zeros(Float32, 3, 4) |> Flux.amd
-    @test sum(m(x)) ≈ 0f0
-    gs = gradient(m -> sum(m(x)), m)
-    @test isnothing(gs[1].bias)
-end
+# @testset "Dense no bias" begin
+#     m = Dense(3 => 4; bias=false) |> Flux.amd
+#     x = zeros(Float32, 3, 4) |> Flux.amd
+#     @test sum(m(x)) ≈ 0f0
+#     gs = gradient(m -> sum(m(x)), m)
+#     @test isnothing(gs[1].bias)
+# end
 
-@testset "Chain of Dense layers" begin
-    m = Chain(Dense(10, 5, tanh), Dense(5, 2), softmax) |> f32
-    x = rand(Float32, 10, 10)
-    amdgputest(m, x)
-end
+# @testset "Chain of Dense layers" begin
+#     m = Chain(Dense(10, 5, tanh), Dense(5, 2), softmax) |> f32
+#     x = rand(Float32, 10, 10)
+#     amdgputest(m, x)
+# end
 
-@testset "Cross-correlation" begin
-    m = CrossCor((2, 2), 3 => 4) |> f32
-    x = rand(Float32, 10, 10, 3, 2)
-    amdgputest(m, x; atol=1f-3)
+@testset "Convolution" begin
+    m = Conv((2, 2), 1 => 1) |> f32
+    x = rand(Float32, 4, 4, 1, 1)
+    amdgputest(m, x; atol=1f-3, checkgrad=false)
+
+    # Gradients are flipped as well.
+    md, xd = Flux.amd.((m, x))
+    gs = gradient(m -> sum(m(x)), m)
+    gsd = gradient(m -> sum(m(xd)), md)
+    @test gs[1].weight[end:-1:1, end:-1:1, :, :] ≈ Array(gsd[1].weight) atol=1f-3
 end
 
-@testset "Restructure" begin
-    m = Dense(1, 1) |> Flux.amd
-    θ, m̂ = Flux.destructure(m)
-    foo(x) = sum(re(p)(x))
+# @testset "Cross-correlation" begin
+#     m = CrossCor((2, 2), 3 => 4) |> f32
+#     x = rand(Float32, 10, 10, 3, 2)
+#     amdgputest(m, x; atol=1f-3)
+# end
 
-    x = Flux.amd(rand(Float32, 1))
-    @test gradient(x -> sum(m̂(θ)(x)), x)[1] isa ROCArray{Float32}
-end
+# @testset "Restructure" begin
+#     m = Dense(1, 1) |> Flux.amd
+#     θ, m̂ = Flux.destructure(m)
+#     foo(x) = sum(re(p)(x))
 
-@testset "Flux.amd(x) on structured arrays" begin
-    g1 = Zygote.OneElement(1, (2, 3), axes(ones(4, 5)))
-    @test Flux.amd(g1) isa ROCMatrix{Int64}
-    g2 = Zygote.Fill(1f0, 2)
-    @test Flux.amd(g2) isa ROCArray{Float32, 1}
-    g3 = transpose(Float32[1 2; 3 4])
-    @test parent(Flux.amd(g3)) isa ROCMatrix{Float32}
-end
+#     x = Flux.amd(rand(Float32, 1))
+#     @test gradient(x -> sum(m̂(θ)(x)), x)[1] isa ROCArray{Float32}
+# end
 
-@testset "Flux.onecold gpu" begin
-    y = Flux.onehotbatch(ones(3), 1:10) |> Flux.amd
-    l = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
-    @test Flux.onecold(y) isa ROCArray
-    @test y[3, :] isa ROCArray
-    @test Flux.onecold(y, l) == ['a', 'a', 'a']
-end
+# @testset "Flux.amd(x) on structured arrays" begin
+#     g1 = Zygote.OneElement(1, (2, 3), axes(ones(4, 5)))
+#     @test Flux.amd(g1) isa ROCMatrix{Int64}
+#     g2 = Zygote.Fill(1f0, 2)
+#     @test Flux.amd(g2) isa ROCArray{Float32, 1}
+#     g3 = transpose(Float32[1 2; 3 4])
+#     @test parent(Flux.amd(g3)) isa ROCMatrix{Float32}
+# end
+
+# @testset "Flux.onecold gpu" begin
+#     y = Flux.onehotbatch(ones(3), 1:10) |> Flux.amd
+#     l = ['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h', 'i', 'j']
+#     @test Flux.onecold(y) isa ROCArray
+#     @test y[3, :] isa ROCArray
+#     @test Flux.onecold(y, l) == ['a', 'a', 'a']
+# end
 
 # FIXME scalar indexing. Needs NNlib.scatter?
 # @testset "Flux.onehot gpu" begin
diff --git a/test/amd/utils.jl b/test/amd/utils.jl
@@ -1,4 +1,4 @@
-function amdgputest(model, xs...; checkgrad=true, atol=1e-6, kws...)
+function amdgputest(model, xs...; checkgrad=true, atol=1e-6)
     cpu_model = model
     gpu_model = Flux.amd(model)
 
diff --git a/test/runtests.jl b/test/runtests.jl
@@ -11,55 +11,55 @@ Random.seed!(0)
 
 @testset verbose=true "Flux.jl" begin
 
-  @testset "Utils" begin
-    include("utils.jl")
-  end
+  # @testset "Utils" begin
+  #   include("utils.jl")
+  # end
 
-  @testset "Optimise / Train" begin
-    include("optimise.jl")
-    include("train.jl")
-  end
+  # @testset "Optimise / Train" begin
+  #   include("optimise.jl")
+  #   include("train.jl")
+  # end
 
-  @testset "Data" begin
-    include("data.jl")
-  end
+  # @testset "Data" begin
+  #   include("data.jl")
+  # end
 
-  @testset "Losses" begin
-    include("losses.jl")
-    include("ctc.jl")
-    CUDA.functional() && include("ctc-gpu.jl")
-  end
+  # @testset "Losses" begin
+  #   include("losses.jl")
+  #   include("ctc.jl")
+  #   CUDA.functional() && include("ctc-gpu.jl")
+  # end
 
-  @testset "Layers" begin
-    include("layers/basic.jl")
-    include("layers/normalisation.jl")
-    include("layers/stateless.jl")
-    include("layers/recurrent.jl")
-    include("layers/conv.jl")
-    include("layers/upsample.jl")
-    include("layers/show.jl")
-  end
+  # @testset "Layers" begin
+  #   include("layers/basic.jl")
+  #   include("layers/normalisation.jl")
+  #   include("layers/stateless.jl")
+  #   include("layers/recurrent.jl")
+  #   include("layers/conv.jl")
+  #   include("layers/upsample.jl")
+  #   include("layers/show.jl")
+  # end
 
-  @testset "outputsize" begin
-    using Flux: outputsize
-    include("outputsize.jl")
-  end
+  # @testset "outputsize" begin
+  #   using Flux: outputsize
+  #   include("outputsize.jl")
+  # end
 
-  @testset "CUDA" begin
-    if CUDA.functional()
-      include("cuda/runtests.jl")
-    else
-      @warn "CUDA unavailable, not testing GPU support"
-    end
-  end
+  # @testset "CUDA" begin
+  #   if CUDA.functional()
+  #     include("cuda/runtests.jl")
+  #   else
+  #     @warn "CUDA unavailable, not testing GPU support"
+  #   end
+  # end
 
-  @static if VERSION == v"1.6"
-    using Documenter
-    @testset "Docs" begin
-      DocMeta.setdocmeta!(Flux, :DocTestSetup, :(using Flux); recursive=true)
-      doctest(Flux)
-    end
-  end
+  # @static if VERSION == v"1.6"
+  #   using Documenter
+  #   @testset "Docs" begin
+  #     DocMeta.setdocmeta!(Flux, :DocTestSetup, :(using Flux); recursive=true)
+  #     doctest(Flux)
+  #   end
+  # end
 
     if get(ENV, "FLUX_TEST_AMDGPU", "false") == "true"
         using AMDGPU

Original file line number	Diff line number	Diff line change
`@@ -1,4 +1,4 @@`
`1`		`-function amdgputest(model, xs...; checkgrad=true, atol=1e-6, kws...)`
	`1`	`+function amdgputest(model, xs...; checkgrad=true, atol=1e-6)`
`2`	`2`	`cpu_model = model`
`3`	`3`	`gpu_model = Flux.amd(model)`
`4`	`4`