restructure A_mul_B_odd/even_cols to use a loop over A_mul_B_col_J

MikaelSlevinsky · MikaelSlevinsky · commit a018a6dffefc · 2017-05-08T18:09:54.000-05:00
restructure coefficient matrix of spherical harmonics to include
negative modes. Interlaced as follows:

[c^{0} c^{-1} c^{1} c^{-2} c^{2} …]

to match ApproxFun’s interlacing of Laurent and Fourier modes.
diff --git a/src/SphericalHarmonics/fastplan.jl b/src/SphericalHarmonics/fastplan.jl
@@ -9,16 +9,17 @@ immutable FastSphericalHarmonicPlan{T}
 end
 
 function FastSphericalHarmonicPlan{T}(A::Matrix{T}, L::Int)
-    m, n = size(A)
+    M, N = size(A)
+    n = (N+1)÷2
     RP = RotationPlan(T, n-1)
     a1 = A[:,1]
     p1 = plan_normleg2cheb(a1)
     p2 = plan_normleg12cheb2(a1)
     p1inv = plan_cheb2normleg(a1)
     p2inv = plan_cheb22normleg1(a1)
     B = zeros(A)
-    Ce = eye(A)
-    Co = eye(A)
+    Ce = eye(T, M)
+    Co = eye(T, M)
     BF = Vector{Butterfly{T}}(n-2)
     for j = 1:2:n-2
         A_mul_B!(Ce, RP.layers[j])
@@ -37,12 +38,47 @@ end
 function A_mul_B!(Y::Matrix, FP::FastSphericalHarmonicPlan, X::Matrix)
     RP, BF, p1, p2, B = FP.RP, FP.BF, FP.p1, FP.p2, FP.B
     fill!(B, zero(eltype(B)))
-    copy!(B, 1, X, 1, 2size(X, 1))
-    for j = 3:size(X, 2)
-        A_mul_B_col_J!(B, BF[j-2], X, j)
+    M, N = size(X)
+    copy!(B, 1, X, 1, 3M)
+    for J = 2:N÷2
+        A_mul_B_col_J!(B, BF[J-1], X, 2J)
+        A_mul_B_col_J!(B, BF[J-1], X, 2J+1)
     end
-    A_mul_B_odd_cols!!(Y, p1, B)
-    A_mul_B_even_cols!!(Y, p2, B)
+
+    A_mul_B_col_J!!(Y, p1, B, 1)
+    for J = 2:4:N
+        A_mul_B_col_J!!(Y, p2, B, J)
+        A_mul_B_col_J!!(Y, p2, B, J+1)
+    end
+    for J = 4:4:N
+        A_mul_B_col_J!!(Y, p1, B, J)
+        A_mul_B_col_J!!(Y, p1, B, J+1)
+    end
+    Y
+end
+
+function At_mul_B!(Y::Matrix, FP::FastSphericalHarmonicPlan, X::Matrix)
+    RP, BF, p1inv, p2inv, B = FP.RP, FP.BF, FP.p1inv, FP.p2inv, FP.B
+    copy!(B, X)
+    M, N = size(X)
+    A_mul_B_col_J!!(Y, p1inv, B, 1)
+    for J = 2:4:N
+        A_mul_B_col_J!!(Y, p2inv, B, J)
+        A_mul_B_col_J!!(Y, p2inv, B, J+1)
+    end
+    for J = 4:4:N
+        A_mul_B_col_J!!(Y, p1inv, B, J)
+        A_mul_B_col_J!!(Y, p1inv, B, J+1)
+    end
+
+    copy!(B, Y)
+    for J = 2:N÷2
+        At_mul_B_col_J!(Y, BF[J-1], B, 2J)
+        At_mul_B_col_J!(Y, BF[J-1], B, 2J+1)
+    end
+    Y
 end
 
+Ac_mul_B!(Y::Matrix, FP::FastSphericalHarmonicPlan, X::Matrix) = At_mul_B!(Y, FP, X)
+
 allranks(FP::FastSphericalHarmonicPlan) = mapreduce(allranks,vcat,FP.BF)
diff --git a/src/SphericalHarmonics/slowplan.jl b/src/SphericalHarmonics/slowplan.jl
@@ -84,12 +84,15 @@ function RotationPlan{T}(::Type{T}, n::Int)
 end
 
 function A_mul_B!(P::RotationPlan, A::AbstractMatrix)
-    n = length(P.layers)+1
-    @inbounds for m = n-2:-1:0
+    M, N = size(A)
+    @inbounds for m = N÷2-2:-1:0
         layer = P.layers[m+1]
-        for ℓ = m+2:2:n
+        for ℓ = 2*(m+2):4:N
             @simd for i = 1:length(layer)
                 G = layer[i]
+                a1, a2 = A[G.i1,ℓ], A[G.i2,ℓ]
+                A[G.i1,ℓ] = G.c*a1 + G.s*a2
+                A[G.i2,ℓ] = G.c*a2 - G.s*a1
                 a1, a2 = A[G.i1,ℓ+1], A[G.i2,ℓ+1]
                 A[G.i1,ℓ+1] = G.c*a1 + G.s*a2
                 A[G.i2,ℓ+1] = G.c*a2 - G.s*a1
@@ -100,12 +103,15 @@ function A_mul_B!(P::RotationPlan, A::AbstractMatrix)
 end
 
 function At_mul_B!(P::RotationPlan, A::AbstractMatrix)
-    n = length(P.layers)+1
-    @inbounds for m = 0:n-2
+    M, N = size(A)
+    @inbounds for m = 0:N÷2-2
         layer = P.layers[m+1]
-        for ℓ = m+2:2:n
+        for ℓ = 2*(m+2):4:N
             @simd for i = length(layer):-1:1
                 G = layer[i]
+                a1, a2 = A[G.i1,ℓ], A[G.i2,ℓ]
+                A[G.i1,ℓ] = G.c*a1 - G.s*a2
+                A[G.i2,ℓ] = G.s*a1 + G.c*a2
                 a1, a2 = A[G.i1,ℓ+1], A[G.i2,ℓ+1]
                 A[G.i1,ℓ+1] = G.c*a1 - G.s*a2
                 A[G.i2,ℓ+1] = G.s*a1 + G.c*a2
@@ -128,7 +134,8 @@ immutable SlowSphericalHarmonicPlan{T}
 end
 
 function SlowSphericalHarmonicPlan{T}(A::Matrix{T})
-    m, n = size(A)
+    M, N = size(A)
+    n = (N+1)÷2
     RP = RotationPlan(T, n-1)
     a1 = A[:,1]
     p1 = plan_normleg2cheb(a1)
@@ -143,15 +150,32 @@ function A_mul_B!(Y::Matrix, SP::SlowSphericalHarmonicPlan, X::Matrix)
     RP, p1, p2, B = SP.RP, SP.p1, SP.p2, SP.B
     copy!(B, X)
     A_mul_B!(RP, B)
-    A_mul_B_odd_cols!!(Y, p1, B)
-    A_mul_B_even_cols!!(Y, p2, B)
+    M, N = size(X)
+    A_mul_B_col_J!!(Y, p1, B, 1)
+    for J = 2:4:N
+        A_mul_B_col_J!!(Y, p2, B, J)
+        A_mul_B_col_J!!(Y, p2, B, J+1)
+    end
+    for J = 4:4:N
+        A_mul_B_col_J!!(Y, p1, B, J)
+        A_mul_B_col_J!!(Y, p1, B, J+1)
+    end
+    Y
 end
 
 function At_mul_B!(Y::Matrix, SP::SlowSphericalHarmonicPlan, X::Matrix)
     RP, p1inv, p2inv, B = SP.RP, SP.p1inv, SP.p2inv, SP.B
     copy!(B, X)
-    A_mul_B_odd_cols!!(Y, p1inv, B)
-    A_mul_B_even_cols!!(Y, p2inv, B)
+    M, N = size(X)
+    A_mul_B_col_J!!(Y, p1inv, B, 1)
+    for J = 2:4:N
+        A_mul_B_col_J!!(Y, p2inv, B, J)
+        A_mul_B_col_J!!(Y, p2inv, B, J+1)
+    end
+    for J = 4:4:N
+        A_mul_B_col_J!!(Y, p1inv, B, J)
+        A_mul_B_col_J!!(Y, p1inv, B, J+1)
+    end
     At_mul_B!(RP, Y)
 end
 
diff --git a/src/hierarchical.jl b/src/hierarchical.jl
@@ -11,51 +11,27 @@ end
 # A_mul_B!! mutates x while overwriting y. The generic fallback assumes it doesn't mutate x.
 A_mul_B!!(y::AbstractVector, P::HierarchicalPlan, x::AbstractVector) = A_mul_B!(y, P, x)
 A_mul_B!!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix) = A_mul_B!(Y, P, X)
-A_mul_B_odd_cols!!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix) = A_mul_B_odd_cols!(Y, P, X)
-A_mul_B_even_cols!!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix) = A_mul_B_even_cols!(Y, P, X)
+A_mul_B_col_J!!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix, J::Int) = A_mul_B_col_J!(Y, P, X, J)
 
 # A_mul_B! falls back to the mutating version with a copy.
 A_mul_B!(y::AbstractVector, P::HierarchicalPlan, x::AbstractVector) = A_mul_B!!(y, P, copy(x))
 A_mul_B!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix) = A_mul_B!!(Y, P, copy(X))
-A_mul_B_odd_cols!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix) = A_mul_B_odd_cols!!(Y, P, copy(X))
-A_mul_B_even_cols!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix) = A_mul_B_even_cols!!(Y, P, copy(X))
+A_mul_B_col_J!(Y::AbstractMatrix, P::HierarchicalPlan, X::AbstractMatrix) = A_mul_B_col_J!!(Y, P, copy(X), J)
 
-function scale_odd_cols!(b::AbstractVector, A::AbstractMatrix)
+function scale_col_J!(b::AbstractVector, A::AbstractVecOrMat, J::Int)
     m, n = size(A)
-    @inbounds for j = 1:2:n
-        @simd for i = 1:m
-            A[i,j] *= b[i]
-        end
-    end
-    A
-end
-
-function scale_odd_cols!(b::Number, A::AbstractMatrix)
-    m, n = size(A)
-    @inbounds for j = 1:2:n
-        @simd for i = 1:m
-            A[i,j] *= b
-        end
+    COLSHIFT = m*(J-1)
+    @inbounds @simd for i = 1:m
+        A[i+COLSHIFT] *= b[i]
     end
     A
 end
 
-function scale_even_cols!(b::AbstractVector, A::AbstractMatrix)
+function scale_col_J!(b::Number, A::AbstractVecOrMat, J::Int)
     m, n = size(A)
-    @inbounds for j = 2:2:n
-        @simd for i = 1:m
-            A[i,j] *= b[i]
-        end
-    end
-    A
-end
-
-function scale_even_cols!(b::Number, A::AbstractMatrix)
-    m, n = size(A)
-    @inbounds for j = 2:2:n
-        @simd for i = 1:m
-            A[i,j] *= b
-        end
+    COLSHIFT = m*(J-1)
+    @inbounds @simd for i = 1:m
+        A[i+COLSHIFT] *= b
     end
     A
 end
@@ -348,27 +324,23 @@ function A_mul_B!(Y::Matrix, P::ChebyshevToNormalizedLegendrePlan, X::Matrix)
     scale!(P.scl, Y)
 end
 
-function A_mul_B_odd_cols!!(Y::Matrix, P::NormalizedLegendreToChebyshevPlan, X::Matrix)
+function A_mul_B_col_J!!(Y::Matrix, P::NormalizedLegendreToChebyshevPlan, X::Matrix, J::Int)
     m, n = size(X)
-    scale_odd_cols!(P.scl, X)
-    for j = 1:2:n
-        A_mul_B!(Y, P.even, X, 1+m*(j-1), 1+m*(j-1), 2, 2)
-        A_mul_B!(Y, P.odd, X, 2+m*(j-1), 2+m*(j-1), 2, 2)
-    end
-    scale_odd_cols!(2/π, Y)
-    @inbounds @simd for j = 1:2:n
-        Y[1+m*(j-1)] *= 0.5
-    end
+    COLSHIFT = m*(J-1)
+    scale_col_J!(P.scl, X, J)
+    A_mul_B!(Y, P.even, X, 1+COLSHIFT, 1+COLSHIFT, 2, 2)
+    A_mul_B!(Y, P.odd, X, 2+COLSHIFT, 2+COLSHIFT, 2, 2)
+    scale_col_J!(2/π, Y, J)
+    @inbounds Y[1+COLSHIFT] *= 0.5
     Y
 end
 
-function A_mul_B_odd_cols!(Y::Matrix, P::ChebyshevToNormalizedLegendrePlan, X::Matrix)
+function A_mul_B_col_J!(Y::Matrix, P::ChebyshevToNormalizedLegendrePlan, X::Matrix, J::Int)
     m, n = size(X)
-    for j = 1:2:n
-        A_mul_B!(Y, P.even, X, 1+m*(j-1), 1+m*(j-1), 2, 2)
-        A_mul_B!(Y, P.odd, X, 2+m*(j-1), 2+m*(j-1), 2, 2)
-    end
-    scale_odd_cols!(P.scl, Y)
+    COLSHIFT = m*(J-1)
+    A_mul_B!(Y, P.even, X, 1+COLSHIFT, 1+COLSHIFT, 2, 2)
+    A_mul_B!(Y, P.odd, X, 2+COLSHIFT, 2+COLSHIFT, 2, 2)
+    scale_col_J!(P.scl, Y, J)
 end
 
 ################################################################################
@@ -468,21 +440,19 @@ function A_mul_B!(Y::Matrix, P::Chebyshev2ToNormalizedLegendre1Plan, X::Matrix)
     scale!(P.scl, Y)
 end
 
-function A_mul_B_even_cols!!(Y::Matrix, P::NormalizedLegendre1ToChebyshev2Plan, X::Matrix)
+function A_mul_B_col_J!!(Y::Matrix, P::NormalizedLegendre1ToChebyshev2Plan, X::Matrix, J::Int)
     m, n = size(X)
-    scale_even_cols!(P.scl, X)
-    for j = 2:2:n
-        A_mul_B!(Y, P.even, X, 1+m*(j-1), 1+m*(j-1), 2, 2)
-        A_mul_B!(Y, P.odd, X, 2+m*(j-1), 2+m*(j-1), 2, 2)
-    end
+    COLSHIFT = m*(J-1)
+    scale_col_J!(P.scl, X, J)
+    A_mul_B!(Y, P.even, X, 1+COLSHIFT, 1+COLSHIFT, 2, 2)
+    A_mul_B!(Y, P.odd, X, 2+COLSHIFT, 2+COLSHIFT, 2, 2)
     Y
 end
 
-function A_mul_B_even_cols!(Y::Matrix, P::Chebyshev2ToNormalizedLegendre1Plan, X::Matrix)
+function A_mul_B_col_J!(Y::Matrix, P::Chebyshev2ToNormalizedLegendre1Plan, X::Matrix, J::Int)
     m, n = size(X)
-    for j = 2:2:n
-        A_mul_B!(Y, P.even, X, 1+m*(j-1), 1+m*(j-1), 2, 2)
-        A_mul_B!(Y, P.odd, X, 2+m*(j-1), 2+m*(j-1), 2, 2)
-    end
-    scale_even_cols!(P.scl, Y)
+    COLSHIFT = m*(J-1)
+    A_mul_B!(Y, P.even, X, 1+COLSHIFT, 1+COLSHIFT, 2, 2)
+    A_mul_B!(Y, P.odd, X, 2+COLSHIFT, 2+COLSHIFT, 2, 2)
+    scale_col_J!(P.scl, Y, J)
 end
diff --git a/test/butterflytests.jl b/test/butterflytests.jl
@@ -39,6 +39,28 @@ for n in 7:N
     println(norm(w-A[n]\u))
 end
 
+N = 10
+A = Vector{Matrix{Float64}}(N)
+for n in 1:N
+    A[n] = Float64[1/(i+j-1) for i = 1:2^n,j=1:2^n]
+    println(n)
+end
+
+for n in 7:N
+    println("N = ", n)
+    @time B = Butterfly(A[n], n-5)
+    b = rand(Float64,2^n)./(1:2^n)
+    u = zero(b)
+    @time uf = A[n]*b
+    @time A_mul_B!(u, B, b)
+    w = zero(b)
+    @time At_mul_B!(w, B, b)
+    println(norm(u-uf)/2^n)
+    println(norm(w-A[n]'b))
+    println(norm(u-w))
+end
+
+
 N = 10
 A = Vector{Matrix{Complex{Float64}}}(N)
 for n in 1:N
diff --git a/test/test_fastplan.jl b/test/test_fastplan.jl
diff --git a/test/test_slowplan.jl b/test/test_slowplan.jl