Optimized version of the artificial compressed sensing problems

Alexis Montoison · Alexis Montoison · commit acfba1036b3a · 2024-12-26T08:55:33.000-06:00
diff --git a/fft_example_1D.jl b/fft_example_1D.jl
@@ -29,6 +29,7 @@ function fft_example_1D(Nt::Int; gpu::Bool=false, rdft::Bool=false, check::Bool=
         centers = centering(DFTdim, DFTsize, missing_prob)
         radius = 1
         index_missing, z_zero = punching(DFTdim, DFTsize, centers, radius, y)
+        # println("length(index_missing) = ", length(index_missing))
     end
 
     M_perptz = M_perp_tz_wei(DFTdim, DFTsize, z_zero)  # M_perptz
diff --git a/fft_example_2D.jl b/fft_example_2D.jl
@@ -20,13 +20,14 @@ function fft_example_2D(Nt::Int, Ns::Int; gpu::Bool=false, rdft::Bool=false, che
 
     # randomly generate missing indices
     if check
-        index_missing_Cartesian = Int[]
+        index_missing = Int[]
         z_zero = y
     else
         missing_prob = 0.15
         centers = centering(DFTdim, DFTsize, missing_prob)
         radius = 1
-        index_missing_Cartesian, z_zero = punching(DFTdim, DFTsize, centers, radius, y)
+        index_missing, z_zero = punching(DFTdim, DFTsize, centers, radius, y)
+        # println("length(index_missing) = ", length(index_missing))
     end
 
     # unify parameters for barrier method
@@ -42,7 +43,7 @@ function fft_example_2D(Nt::Int, Ns::Int; gpu::Bool=false, rdft::Bool=false, che
     eps_barrier = 1e-6
     mu_barrier = 10
 
-    parameters = FFTParameters(DFTdim, DFTsize, M_perptz, lambda, index_missing_Cartesian, alpha_LS, gamma_LS, eps_NT, mu_barrier, eps_barrier)
+    parameters = FFTParameters(DFTdim, DFTsize, M_perptz, lambda, index_missing, alpha_LS, gamma_LS, eps_NT, mu_barrier, eps_barrier)
 
     t_init = 1
     beta_init = zeros(prod(DFTsize))
diff --git a/fft_example_3D.jl b/fft_example_3D.jl
@@ -21,13 +21,14 @@ function fft_example_3D(N1::Int, N2::Int, N3::Int; gpu::Bool=false, rdft::Bool=f
 
     # randomly generate missing indices
     if check
-        index_missing_Cartesian = Int[]
+        index_missing = Int[]
         z_zero = y
     else
         missing_prob = 0.15
         centers = centering(DFTdim, DFTsize, missing_prob)
         radius = 1
-        index_missing_Cartesian, z_zero = punching(DFTdim, DFTsize, centers, radius, y)
+        index_missing, z_zero = punching(DFTdim, DFTsize, centers, radius, y)
+        # println("length(index_missing) = ", length(index_missing))
     end
 
     # unify parameters for barrier method
@@ -43,7 +44,7 @@ function fft_example_3D(N1::Int, N2::Int, N3::Int; gpu::Bool=false, rdft::Bool=f
     eps_barrier = 1e-6
     mu_barrier = 10
 
-    parameters = FFTParameters(DFTdim, DFTsize, M_perptz, lambda, index_missing_Cartesian, alpha_LS, gamma_LS, eps_NT, mu_barrier, eps_barrier)
+    parameters = FFTParameters(DFTdim, DFTsize, M_perptz, lambda, index_missing, alpha_LS, gamma_LS, eps_NT, mu_barrier, eps_barrier)
 
     t_init = 1
     beta_init = zeros(prod(DFTsize))
@@ -67,7 +68,7 @@ function fft_example_3D(N1::Int, N2::Int, N3::Int; gpu::Bool=false, rdft::Bool=f
         nlp_scaling=false,
         dual_initialized=true,
         richardson_max_iter=0,
-        tol=1e-6,
+        tol=1e-8,
         richardson_tol=Inf,
     )
     results = ipm_solve!(solver)
diff --git a/fft_model.jl b/fft_model.jl
@@ -90,7 +90,8 @@ end
 include("kkt.jl")
 include("fft_wei.jl")
 include("fft_utils.jl")
-include("punching_centering.jl")
+# include("punching_centering.jl")
+include("punching_centering_v2.jl")
 
 function NLPModels.cons!(nlp::FFTNLPModel, x::AbstractVector, c::AbstractVector)
     increment!(nlp, :neval_cons)
diff --git a/punching_centering_v2.jl b/punching_centering_v2.jl
@@ -0,0 +1,201 @@
+## punching
+function punching(DFTdim, DFTsize, centers, radius, data)
+    if radius == 1
+        return punching_optimized(DFTdim, DFTsize, centers, data)
+    end
+    if DFTdim == 1
+        index_missing = punching1D(DFTsize, centers, radius)
+        data[index_missing] .= 0
+    elseif DFTdim == 2
+        index_missing = punching2D(DFTsize, centers, radius)
+        data[index_missing] .= 0
+    else
+        index_missing = punching3D(DFTsize, centers, radius)
+        data[index_missing] .= 0
+    end
+    return index_missing, data
+end
+
+function punching1D(DFTsize, centers, radius)
+    N = prod(DFTsize)
+    index_missing = Vector{CartesianIndex{1}}(undef, N)
+    pos = 0
+    for i = 1:DFTsize[1]
+        for center in centers
+            if abs(i - center[1]) <= radius
+                pos = pos + 1
+                index_missing[pos] = CartesianIndex{1}(i)
+            end
+        end
+    end
+    resize!(index_missing, pos)
+    return index_missing
+end
+
+function punching2D(DFTsize, centers, radius)
+    N = prod(DFTsize)
+    index_missing = Vector{CartesianIndex{2}}(undef, N)
+    pos = 0
+    for i = 1:DFTsize[1]
+        for j = 1:DFTsize[2]
+            for center in centers
+                if (center[1] - i)^2 + (center[2] - j)^2 <= radius^2
+                    pos = pos + 1
+                    index_missing[pos] = CartesianIndex{2}(i, j)
+                end
+            end
+        end
+    end
+    resize!(index_missing, pos)
+    return index_missing
+end
+
+function punching3D(DFTsize, centers, radius)
+    N = prod(DFTsize)
+    index_missing = Vector{CartesianIndex{3}}(undef, N)
+    pos = 0
+    for i = 1:DFTsize[1]
+        for j = 1:DFTsize[2]
+            for k = 1:DFTsize[3]
+                for center in centers
+                    if (center[1] - i)^2 + (center[2] - j)^2 + (center[3] - k)^2 <= radius^2
+                        pos = pos + 1
+                        index_missing[pos] = CartesianIndex{3}(i, j, k)
+                    end
+                end
+            end
+        end
+    end
+    resize!(index_missing, pos)
+    return index_missing
+end
+
+## centering
+function centering(DFTdim, DFTsize, missing_prob)
+    if DFTdim == 1
+        return center_1d(DFTsize, missing_prob)
+    elseif DFTdim == 2
+        return center_2d(DFTsize, missing_prob)
+    else
+        return center_3d(DFTsize, missing_prob)
+    end
+end
+
+function center_1d(DFTsize, missing_prob)
+    N = prod(DFTsize)
+    n = N*missing_prob/3
+    stepsize = ceil(N/n) |> Int
+    centers = CartesianIndices((1:stepsize:N))
+    return centers
+end
+
+function center_2d(DFTsize, missing_prob)
+    N = prod(DFTsize)
+    Nt = DFTsize[1]
+    Ns = DFTsize[2]
+    n = (N*missing_prob/5)^(1/2)
+    stepsize1 = ceil(Nt/n) |> Int
+    stepsize2 = ceil(Ns/n) |> Int
+    centers = CartesianIndices((1:stepsize1:Nt, 1:stepsize2:Ns))
+    return centers
+end
+
+function center_3d(DFTsize, missing_prob)
+    N = prod(DFTsize)
+    N1 = DFTsize[1]
+    N2 = DFTsize[2]
+    N3 = DFTsize[3]
+    n = (N*missing_prob/7)^(1/3)
+    stepsize1 = ceil(N1/n) |> Int
+    stepsize2 = ceil(N2/n) |> Int
+    stepsize3 = ceil(N3/n) |> Int
+    centers = CartesianIndices((1:stepsize1:N1, 1:stepsize2:N2, 1:stepsize3:N3))
+    return centers
+end
+
+## punching_optimized
+function punching_optimized(DFTdim, DFTsize, centers, data)
+    if DFTdim == 1
+        index_missing = punching_optimized_1D(DFTsize, centers)
+        data[index_missing] .= 0
+    elseif DFTdim == 2
+        index_missing = punching_optimized_2D(DFTsize, centers)
+        data[index_missing] .= 0
+    else
+        index_missing = punching_optimized_3D(DFTsize, centers)
+        data[index_missing] .= 0
+    end
+    return index_missing, data
+end
+
+function punching_optimized_1D(DFTsize, centers)
+    ncenters = prod(centers |> size)
+    index_missing = Vector{CartesianIndex{1}}(undef, 3*ncenters)
+    Nx = DFTsize[1]
+    pos = 0
+    for center in centers
+        for i in center[1]
+            for i2 = i-1:i+1
+                if 1 <= i2 <= Nx
+                    pos = pos + 1
+                    index_missing[pos] = CartesianIndex{1}(i2)
+                end
+            end
+        end
+    end
+    resize!(index_missing, pos)
+    return index_missing
+end
+
+function punching_optimized_2D(DFTsize, centers)
+    ncenters = prod(centers |> size)
+    index_missing = Vector{CartesianIndex{2}}(undef, 5*ncenters)
+    Nx = DFTsize[1]
+    Ny = DFTsize[2]
+    pos = 0
+    for center in centers
+        for i in center[1]
+            for j in center[2]
+                for i2 = i-1:i+1
+                    for j2 = j-1:j+1
+                        if (1 <= i2 <= Nx) && (1 <= j2 <= Ny) && (abs(i2 - i) + abs(j2 - j) <= 1)
+                            pos = pos + 1
+                            index_missing[pos] = CartesianIndex{2}(i2, j2)
+                        end
+                    end
+                end
+            end
+        end
+    end
+    resize!(index_missing, pos)
+    return index_missing
+end
+
+function punching_optimized_3D(DFTsize, centers)
+    ncenters = prod(centers |> size)
+    index_missing = Vector{CartesianIndex{3}}(undef, 7*ncenters)
+    Nx = DFTsize[1]
+    Ny = DFTsize[2]
+    Nz = DFTsize[3]
+    pos = 0
+    for center in centers
+        for i in center[1]
+            for j in center[2]
+                for k in center[3]
+                    for i2 = i-1:i+1
+                        for j2 = j-1:j+1
+                            for k2 = k-1:k+1
+                                if (1 <= i2 <= Nx) && (1 <= j2 <= Ny) && (1 <= k2 <= Nz) && (abs(i2 - i) + abs(j2 - j) + abs(k2 - k) <= 1)
+                                    pos = pos + 1
+                                    index_missing[pos] = CartesianIndex{3}(i2, j2, k2)
+                                end
+                            end
+                        end
+                    end
+                end
+            end
+        end
+    end
+    resize!(index_missing, pos)
+    return index_missing
+end
diff --git a/unit_tests.jl b/unit_tests.jl
@@ -26,14 +26,14 @@ if dim1
       @testset "1D -- CPU -- rdft=$rdft -- $N" begin
         nlp, solver, results = fft_example_1D(N; gpu=false, rdft, check=true)
 
-        z2 = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z, Int[]; rdft)
+        z2 = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
         @test z2 ≈ z
 
-        res1 = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z; rdft)
+        res1 = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z, nlp.fft_timer, nlp.mapping_timer; rdft)
         @test norm(res1) ≈ norm(z)
         @test res1_wei ≈ res1
 
-        res2 = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z, Int[]; rdft)
+        res2 = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
         @test norm(res2) ≈ norm(z)
         @test res2_wei ≈ res2
       end
@@ -44,14 +44,14 @@ if dim1
 
           z_gpu = CuArray(z)
 
-          z2_gpu = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z_gpu, Int[]; rdft)
+          z2_gpu = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z_gpu, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
           @test z2_gpu ≈ z_gpu
 
-          res1_gpu = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z_gpu; rdft)
+          res1_gpu = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z_gpu, nlp.fft_timer, nlp.mapping_timer; rdft)
           @test norm(res1_gpu) ≈ norm(z_gpu)
           @test res1_wei ≈ collect(res1_gpu)
 
-          res2_gpu = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z_gpu, Int[]; rdft)
+          res2_gpu = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 1, (N,), z_gpu, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
           @test norm(res2_gpu) ≈ norm(z_gpu)
           @test res2_wei ≈ collect(res2_gpu)
         end
@@ -78,14 +78,14 @@ if dim2
       @testset "2D -- CPU -- rdft=$rdft -- $N1 × $N2" begin
         nlp, solver, results = fft_example_2D(N1, N2; gpu=false, rdft, check=true)
 
-        z2 = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z, Int[]; rdft)
+        z2 = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
         @test z2 ≈ z
 
-        res1 = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), reshape(z, (N1, N2)); rdft)
+        res1 = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), reshape(z, (N1, N2)), nlp.fft_timer, nlp.mapping_timer; rdft)
         @test norm(res1) ≈ norm(z)
         @test res1_wei ≈ res1
 
-        res2 = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z, Int[]; rdft)
+        res2 = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
         @test norm(res2) ≈ norm(z)
         @test res2_wei ≈ res2
       end
@@ -96,14 +96,14 @@ if dim2
 
           z_gpu = CuArray(z)
 
-          z2_gpu = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z_gpu, Int[]; rdft)
+          z2_gpu = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z_gpu, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
           @test z2_gpu ≈ z_gpu
 
-          res1_gpu = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), reshape(z_gpu, (N1, N2)); rdft)
+          res1_gpu = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), reshape(z_gpu, (N1, N2)), nlp.fft_timer, nlp.mapping_timer; rdft)
           @test norm(res1_gpu) ≈ norm(z_gpu)
           @test res1_wei ≈ collect(res1_gpu)
 
-          res2_gpu = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z_gpu, Int[]; rdft)
+          res2_gpu = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 2, (N1, N2), z_gpu, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
           @test norm(res2_gpu) ≈ norm(z_gpu)
           @test res2_wei ≈ collect(res2_gpu)
         end
@@ -130,14 +130,14 @@ if dim3
       @testset "3D -- CPU -- rdft=$rdft -- $N1 × $N2 × $N3" begin
         nlp, solver, results = fft_example_3D(N1, N2, N3; gpu=false, rdft, check=true)
 
-        z2 = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z, Int[]; rdft)
+        z2 = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
         @test z2 ≈ z
 
-        res1 = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), reshape(z, (N1, N2, N3)); rdft)
+        res1 = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), reshape(z, (N1, N2, N3)), nlp.fft_timer, nlp.mapping_timer; rdft)
         @test norm(res1) ≈ norm(z)
         @test res1_wei ≈ res1
 
-        res2 = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z, Int[]; rdft)
+        res2 = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
         @test norm(res2) ≈ norm(z)
         @test res2_wei ≈ res2
       end
@@ -148,14 +148,14 @@ if dim3
 
           z_gpu = CuArray(z)
 
-          z2_gpu = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z_gpu, Int[]; rdft)
+          z2_gpu = M_perpt_M_perp_vec(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z_gpu, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
           @test z2_gpu ≈ z_gpu
 
-          res1_gpu = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), reshape(z_gpu, (N1, N2, N3)); rdft)
+          res1_gpu = M_perp_tz(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), reshape(z_gpu, (N1, N2, N3)), nlp.fft_timer, nlp.mapping_timer; rdft)
           @test norm(res1_gpu) ≈ norm(z_gpu)
           @test res1_wei ≈ collect(res1_gpu)
 
-          res2_gpu = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z_gpu, Int[]; rdft)
+          res2_gpu = M_perp_beta(nlp.buffer_real, nlp.buffer_complex1, nlp.buffer_complex2, nlp.op, 3, (N1, N2, N3), z_gpu, Int[], nlp.fft_timer, nlp.mapping_timer; rdft)
           @test norm(res2_gpu) ≈ norm(z_gpu)
           @test res2_wei ≈ collect(res2_gpu)
         end