Merge branch 'master' of https://github.com/JuliaApproximation/MultivariateOrthogonalPolynomials.jl

dlfivefifty · dlfivefifty · commit c3d534ba0fb9 · 2018-09-16T12:53:46.000+01:00
diff --git a/src/gradient.jl b/src/gradient.jl
@@ -0,0 +1,123 @@
+# This file calculates the surface gradient of a scalar field.
+
+function gradient!(U::Matrix{T}, ∇θU::Matrix{T}, ∇φU::Matrix{T}) where T
+    @assert size(U) == size(∇θU) == size(∇φU)
+    N, M = size(U)
+
+    # The first column is easy.
+    @inbounds @simd for ℓ = 1:N-1
+        ∇θU[ℓ, 1] = -sqrt(T(ℓ*(ℓ+1)))*U[ℓ+1, 1]
+        ∇φU[ℓ, 1] = 0
+    end
+    ∇θU[N, 1] = 0
+    ∇φU[N, 1] = 0
+
+    # Next, we differentiate with respect to φ, which preserves the order. It swaps sines and cosines in longitude, though.
+    @inbounds for m = 1:M÷2
+        @simd for ℓ = 1:N+1-m
+            ∇φU[ℓ, 2m] = -m*U[ℓ, 2m+1]
+            ∇φU[ℓ, 2m+1] = m*U[ℓ, 2m]
+        end
+    end
+
+    # Then, we differentiate with respect to θ, which preserves the order but divides by sin(θ).
+
+    @inbounds for m = 1:M÷2
+        ℓ = 1
+        bℓ = -(ℓ+m+1)*sqrt(T(ℓ*(ℓ+2m))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+        ∇θU[ℓ, 2m] = bℓ*U[ℓ+1, 2m]
+        ∇θU[ℓ, 2m+1] = bℓ*U[ℓ+1, 2m+1]
+        @simd for ℓ = 2:N-m
+            aℓ = (ℓ+m-2)*sqrt(T((ℓ-1)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+            bℓ = -(ℓ+m+1)*sqrt(T(ℓ*(ℓ+2m))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+            ∇θU[ℓ, 2m] = aℓ*U[ℓ-1, 2m] + bℓ*U[ℓ+1, 2m]
+            ∇θU[ℓ, 2m+1] = aℓ*U[ℓ-1, 2m+1] + bℓ*U[ℓ+1, 2m+1]
+        end
+        ℓ = N-m+1
+        aℓ = (ℓ+m-2)*sqrt(T((ℓ-1)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+        ∇θU[ℓ, 2m] = aℓ*U[ℓ-1, 2m]
+        ∇θU[ℓ, 2m+1] = aℓ*U[ℓ-1, 2m+1]
+    end
+
+    # Finally, we divide by sin(θ), which can be done by decrementing the order P_ℓ^m ↘ P_ℓ^{m-1}.
+    @inbounds for m = 1:M÷2
+        ℓ = N+1-m
+        aℓ = sqrt(T((ℓ+2m-2)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+        ∇θU[ℓ, 2m] = ∇θU[ℓ, 2m]/aℓ
+        ∇θU[ℓ, 2m+1] = ∇θU[ℓ, 2m+1]/aℓ
+        ∇φU[ℓ, 2m] = ∇φU[ℓ, 2m]/aℓ
+        ∇φU[ℓ, 2m+1] = ∇φU[ℓ, 2m+1]/aℓ
+        ℓ = N+1-m-1
+        if ℓ > 0
+            aℓ = sqrt(T((ℓ+2m-2)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+            ∇θU[ℓ, 2m] = ∇θU[ℓ, 2m]/aℓ
+            ∇θU[ℓ, 2m+1] = ∇θU[ℓ, 2m+1]/aℓ
+            ∇φU[ℓ, 2m] = ∇φU[ℓ, 2m]/aℓ
+            ∇φU[ℓ, 2m+1] = ∇φU[ℓ, 2m+1]/aℓ
+        end
+        @simd for ℓ = N+1-m-2:-1:1
+            aℓ = sqrt(T((ℓ+2m-2)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+            bℓ = -sqrt(T(ℓ*(ℓ+1))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+            ∇θU[ℓ, 2m] = (∇θU[ℓ, 2m] - bℓ*∇θU[ℓ+2, 2m])/aℓ
+            ∇θU[ℓ, 2m+1] = (∇θU[ℓ, 2m+1] - bℓ*∇θU[ℓ+2, 2m+1])/aℓ
+            ∇φU[ℓ, 2m] = (∇φU[ℓ, 2m] - bℓ*∇φU[ℓ+2, 2m])/aℓ
+            ∇φU[ℓ, 2m+1] = (∇φU[ℓ, 2m+1] - bℓ*∇φU[ℓ+2, 2m+1])/aℓ
+        end
+    end
+
+    ∇θU
+end
+
+function curl!(U::Matrix, U1::Matrix, U2::Matrix)
+    gradient!(U, U2, U1)
+    N, M = size(U)
+    @inbounds for j = 1:M
+        for i = 1:N
+            U1[i,j] = -U1[i,j]
+        end
+    end
+    U1
+end
+
+
+function partial_gradient!(U::Matrix{T}, ∇θU::Matrix{T}, ∇φU::Matrix{T}) where T
+    @assert size(U) == size(∇θU) == size(∇φU)
+    N, M = size(U)
+
+    # The first column is easy.
+    @inbounds @simd for ℓ = 1:N-1
+        ∇θU[ℓ, 1] = -sqrt(T(ℓ*(ℓ+1)))*U[ℓ+1, 1]
+        ∇φU[ℓ, 1] = 0
+    end
+    ∇θU[N, 1] = 0
+    ∇φU[N, 1] = 0
+
+    # Next, we differentiate with respect to φ, which preserves the order. It swaps sines and cosines in longitude, though.
+    @inbounds for m = 1:M÷2
+        @simd for ℓ = 1:N+1-m
+            ∇φU[ℓ, 2m] = -m*U[ℓ, 2m+1]
+            ∇φU[ℓ, 2m+1] = m*U[ℓ, 2m]
+        end
+    end
+
+    # Then, we differentiate with respect to θ, which preserves the order but divides by sin(θ).
+
+    @inbounds for m = 1:M÷2
+        ℓ = 1
+        bℓ = -(ℓ+m+1)*sqrt(T(ℓ*(ℓ+2m))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+        ∇θU[ℓ, 2m] = bℓ*U[ℓ+1, 2m]
+        ∇θU[ℓ, 2m+1] = bℓ*U[ℓ+1, 2m+1]
+        @simd for ℓ = 2:N-m
+            aℓ = (ℓ+m-2)*sqrt(T((ℓ-1)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+            bℓ = -(ℓ+m+1)*sqrt(T(ℓ*(ℓ+2m))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+            ∇θU[ℓ, 2m] = aℓ*U[ℓ-1, 2m] + bℓ*U[ℓ+1, 2m]
+            ∇θU[ℓ, 2m+1] = aℓ*U[ℓ-1, 2m+1] + bℓ*U[ℓ+1, 2m+1]
+        end
+        ℓ = N-m+1
+        aℓ = (ℓ+m-2)*sqrt(T((ℓ-1)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+        ∇θU[ℓ, 2m] = aℓ*U[ℓ-1, 2m]
+        ∇θU[ℓ, 2m+1] = aℓ*U[ℓ-1, 2m+1]
+    end
+
+    ∇θU
+end
diff --git a/src/helmholtzhodge.jl b/src/helmholtzhodge.jl
@@ -0,0 +1,198 @@
+include("gradient.jl")
+
+using BandedMatrices
+
+import BandedMatrices: BandedQ
+
+# Store QR factorizations required to apply the Helmholtz-Hodge decomposition.
+struct HelmholtzHodge{T}
+    Q::Vector{BandedQ{T}}
+    R::Vector{BandedMatrix{T, Matrix{T}}}
+    X::Vector{T}
+end
+
+function HelmholtzHodge(::Type{T}, N::Int) where T
+    Q = Vector{BandedQ{T}}(undef, N)
+    R = Vector{BandedMatrix{T, Matrix{T}}}(undef, N)
+    for m = 1:N
+        Q[m], R[m] = qr(helmholtzhodgeconversion(T, N, m))
+    end
+    HelmholtzHodge(Q, R, zeros(T, 2N+2))
+end
+
+function helmholtzhodgeconversion(::Type{T}, N::Int, m::Int) where T
+    A = BandedMatrix(Zeros{T}(2N+4-2m, 2N+2-2m), (2, 2))
+    for ℓ = 1:N+1-m
+        A[2ℓ, 2ℓ-1] = m
+        A[2ℓ-1, 2ℓ] = m
+        cst = (m+ℓ-1)*sqrt(T(ℓ*(ℓ+2m))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+        A[2ℓ+2, 2ℓ] = cst
+        A[2ℓ+1, 2ℓ-1] = cst
+    end
+    for ℓ = 1:N-m
+        cst = -(m+ℓ+1)*sqrt(T(ℓ*(ℓ+2m))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+        A[2ℓ-1, 2ℓ+1] = cst
+        A[2ℓ, 2ℓ+2] = cst
+    end
+    A
+end
+
+# This function works in-place on the data stored in the factorization.
+function solvehelmholtzhodge!(HH::HelmholtzHodge{T}, m::Int) where T
+    Q = HH.Q[m]
+    R = HH.R[m]
+    X = HH.X
+
+    # Step 1: apply Q'
+
+    H=Q.H
+    m=Q.m
+
+    M=size(H,1)
+    x=pointer(X)
+    h=pointer(H)
+    st=stride(H,2)
+    sz=sizeof(T)
+
+    for k=1:min(size(H,2),m-M+1)
+        wp=h+sz*st*(k-1)
+        xp=x+sz*(k-1)
+
+        dt=BandedMatrices.dot(M,wp,1,xp,1)
+        BandedMatrices.axpy!(M,-2*dt,wp,1,xp,1)
+    end
+
+    for k=m-M+2:size(H,2)
+        p=k-m+M-1
+
+        wp=h+sz*st*(k-1)
+        xp=x+sz*(k-1)
+
+        dt=BandedMatrices.dot(M-p,wp,1,xp,1)
+        BandedMatrices.axpy!(M-p,-2*dt,wp,1,xp,1)
+    end
+
+    # Step 2: backsolve with (square) R
+
+    hhdtbsv!('U', 'N', 'N', size(R.data, 2), R.u, pointer(R.data), size(R.data, 1), pointer(X), 1)
+
+    X
+end
+
+
+function helmholtzhodge!(HH::HelmholtzHodge{T}, U1, U2, V1, V2) where T
+	N, M = size(V1)
+
+	# U1 is for e_theta and U2 is for e_phi.
+    # The first columns are easy.
+    U1[1, 1] = 0
+    U2[1, 1] = 0
+    @inbounds @simd for ℓ = 1:N-1
+        U1[ℓ+1, 1] = -V1[ℓ, 1]/sqrt(T(ℓ*(ℓ+1)))
+        U2[ℓ+1, 1] = -V2[ℓ, 1]/sqrt(T(ℓ*(ℓ+1)))
+    end
+
+    # First, we multiply by sin(θ), which can be done by incrementing the order P_ℓ^{m-1} ↗ P_ℓ^m.
+	@inbounds for m = 1:M÷2
+        @simd for ℓ = 1:N-1-m
+            aℓ = sqrt(T((ℓ+2m-2)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+            bℓ = -sqrt(T(ℓ*(ℓ+1))/T((2ℓ+2m-1)*(2ℓ+2m+1)))
+            V1[ℓ, 2m] = aℓ*V1[ℓ, 2m] + bℓ*V1[ℓ+2, 2m]
+            V1[ℓ, 2m+1] = aℓ*V1[ℓ, 2m+1] + bℓ*V1[ℓ+2, 2m+1]
+			V2[ℓ, 2m] = aℓ*V2[ℓ, 2m] + bℓ*V2[ℓ+2, 2m]
+            V2[ℓ, 2m+1] = aℓ*V2[ℓ, 2m+1] + bℓ*V2[ℓ+2, 2m+1]
+        end
+        ℓ = N-m
+        if ℓ > 0
+            aℓ = sqrt(T((ℓ+2m-2)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+            V1[ℓ, 2m] = aℓ*V1[ℓ, 2m]
+            V1[ℓ, 2m+1] = aℓ*V1[ℓ, 2m+1]
+    		V2[ℓ, 2m] = aℓ*V2[ℓ, 2m]
+            V2[ℓ, 2m+1] = aℓ*V2[ℓ, 2m+1]
+        end
+		ℓ = N+1-m
+        aℓ = sqrt(T((ℓ+2m-2)*(ℓ+2m-1))/T((2ℓ+2m-3)*(2ℓ+2m-1)))
+        V1[ℓ, 2m] = aℓ*V1[ℓ, 2m]
+        V1[ℓ, 2m+1] = aℓ*V1[ℓ, 2m+1]
+		V2[ℓ, 2m] = aℓ*V2[ℓ, 2m]
+        V2[ℓ, 2m+1] = aℓ*V2[ℓ, 2m+1]
+    end
+
+    # Next, we solve the banded linear systems.
+    for m = 1:M÷2
+        readin1!(HH.X, V1, V2, N, m)
+        solvehelmholtzhodge!(HH, m)
+        writeout1!(HH.X, U1, U2, N, m)
+        readin2!(HH.X, V1, V2, N, m)
+        solvehelmholtzhodge!(HH, m)
+        writeout2!(HH.X, U1, U2, N, m)
+    end
+
+    U1
+end
+
+function readin1!(X, V1, V2, N, m)
+	X[1] = V1[1, 2m]
+	X[2N+2-2m] = V2[N+1-m, 2m+1]
+	@inbounds for ℓ = 1:N-m
+		X[2ℓ] = V2[ℓ, 2m+1]
+		X[2ℓ+1] = V1[ℓ+1, 2m]
+	end
+    X[2N+3-2m] = X[2N+4-2m] = 0
+end
+
+function readin2!(X, V1, V2, N, m)
+	X[1] = V1[1, 2m+1]
+	X[2N+2-2m] = -V2[N+1-m, 2m]
+	@inbounds for ℓ = 1:N-m
+		X[2ℓ] = -V2[ℓ, 2m]
+		X[2ℓ+1] = V1[ℓ+1, 2m+1]
+	end
+    X[2N+3-2m] = X[2N+4-2m] = 0
+end
+
+function writeout1!(X, U1, U2, N, m)
+	U1[1, 2m] = X[1]
+    U2[1, 2m+1] = X[N+1-m]
+	@inbounds for ℓ = 1:N-1-m
+		U1[ℓ+1, 2m] = X[2ℓ+1]
+		U2[ℓ, 2m+1] = X[2ℓ]
+	end
+    U2[N-m, 2m+1] = X[2N-2m]
+end
+
+function writeout2!(X, U1, U2, N, m)
+	U1[1, 2m+1] = X[1]
+    U2[1, 2m] = X[N+1-m]
+	@inbounds for ℓ = 1:N-1-m
+		U1[ℓ+1, 2m+1] = X[2ℓ+1]
+		U2[ℓ, 2m] = -X[2ℓ]
+	end
+    U2[N-m, 2m] = -X[2N-2m]
+end
+
+using LinearAlgebra
+import LinearAlgebra: BlasInt
+import LinearAlgebra.BLAS: libblas, @blasfunc
+
+for (fname, elty) in ((:dtbsv_,:Float64),
+                      (:stbsv_,:Float32),
+                      (:ztbsv_,:ComplexF64),
+                      (:ctbsv_,:ComplexF32))
+    @eval begin
+        function hhdtbsv!(uplo::Char, trans::Char, diag::Char,
+                          n::Int, k::Int, A::Ptr{$elty}, lda::Int,
+                          x::Ptr{$elty}, incx::Int)
+            ccall((@blasfunc($fname), libblas), Nothing,
+                (Ref{UInt8}, Ref{UInt8}, Ref{UInt8},
+                 Ref{BlasInt}, Ref{BlasInt},
+                 Ptr{$elty}, Ref{BlasInt},
+                 Ptr{$elty}, Ref{BlasInt}),
+                 uplo, trans, diag,
+                 n, k,
+                 A, lda,
+                 x, incx)
+            x
+        end
+    end
+end
diff --git a/test/test_helmholtzhodge.jl b/test/test_helmholtzhodge.jl