improve type-stability of some special functions

MikaelSlevinsky · MikaelSlevinsky · commit bdef1961005b · 2016-04-26T12:00:22.000+01:00
add `half` and `two`
diff --git a/docs/api/FastTransforms.md b/docs/api/FastTransforms.md
@@ -13,7 +13,7 @@ See also [`icjt`](#method__icjt.1) and [`jjt`](#method__jjt.1).
 
 
 *source:*
-[FastTransforms/src/cjt.jl:127](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/cjt.jl#L127)
+[FastTransforms/src/cjt.jl:127](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/cjt.jl#L127)
 
 ---
 
@@ -23,7 +23,7 @@ Calculates the Gaunt coefficients in 64-bit floating-point arithmetic.
 
 
 *source:*
-[FastTransforms/src/gaunt.jl:24](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/gaunt.jl#L24)
+[FastTransforms/src/gaunt.jl:24](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/gaunt.jl#L24)
 
 ---
 
@@ -43,7 +43,7 @@ This is a Julia implementation of the stable recurrence described in:
 
 
 *source:*
-[FastTransforms/src/gaunt.jl:14](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/gaunt.jl#L14)
+[FastTransforms/src/gaunt.jl:14](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/gaunt.jl#L14)
 
 ---
 
@@ -56,7 +56,7 @@ See also [`cjt`](#method__cjt.1) and [`jjt`](#method__jjt.1).
 
 
 *source:*
-[FastTransforms/src/cjt.jl:135](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/cjt.jl#L135)
+[FastTransforms/src/cjt.jl:135](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/cjt.jl#L135)
 
 ---
 
@@ -69,7 +69,7 @@ See also [`cjt`](#method__cjt.1) and [`icjt`](#method__icjt.1).
 
 
 *source:*
-[FastTransforms/src/cjt.jl:143](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/cjt.jl#L143)
+[FastTransforms/src/cjt.jl:143](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/cjt.jl#L143)
 
 ---
 
@@ -88,7 +88,7 @@ Optionally:
 
 
 *source:*
-[FastTransforms/src/cjt.jl:157](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/cjt.jl#L157)
+[FastTransforms/src/cjt.jl:157](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/cjt.jl#L157)
 
 ---
 
@@ -107,7 +107,7 @@ Optionally:
 
 
 *source:*
-[FastTransforms/src/cjt.jl:176](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/cjt.jl#L176)
+[FastTransforms/src/cjt.jl:176](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/cjt.jl#L176)
 
 ## Internal
 
@@ -122,7 +122,7 @@ Modified Chebyshev moments of the first kind with respect to the Jacobi weight:
 
 
 *source:*
-[FastTransforms/src/specialfunctions.jl:362](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/specialfunctions.jl#L362)
+[FastTransforms/src/specialfunctions.jl:366](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/specialfunctions.jl#L366)
 
 ---
 
@@ -135,7 +135,7 @@ Modified Chebyshev moments of the second kind with respect to the Jacobi weight:
 
 
 *source:*
-[FastTransforms/src/specialfunctions.jl:380](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/specialfunctions.jl#L380)
+[FastTransforms/src/specialfunctions.jl:384](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/specialfunctions.jl#L384)
 
 ---
 
@@ -145,7 +145,7 @@ Compute weights of the Clenshaw—Curtis quadrature rule with a Jacobi weight.
 
 
 *source:*
-[FastTransforms/src/clenshawcurtis.jl:12](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/clenshawcurtis.jl#L12)
+[FastTransforms/src/clenshawcurtis.jl:12](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/clenshawcurtis.jl#L12)
 
 ---
 
@@ -155,7 +155,7 @@ Compute nodes and weights of the Clenshaw—Curtis quadrature rule with a Jacobi
 
 
 *source:*
-[FastTransforms/src/clenshawcurtis.jl:6](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/clenshawcurtis.jl#L6)
+[FastTransforms/src/clenshawcurtis.jl:6](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/clenshawcurtis.jl#L6)
 
 ---
 
@@ -165,7 +165,7 @@ Compute nodes and weights of Fejer's first quadrature rule with a Jacobi weight.
 
 
 *source:*
-[FastTransforms/src/fejer.jl:7](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/fejer.jl#L7)
+[FastTransforms/src/fejer.jl:7](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/fejer.jl#L7)
 
 ---
 
@@ -175,7 +175,7 @@ Compute nodes and weights of Fejer's second quadrature rule with a Jacobi weight
 
 
 *source:*
-[FastTransforms/src/fejer.jl:12](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/fejer.jl#L12)
+[FastTransforms/src/fejer.jl:12](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/fejer.jl#L12)
 
 ---
 
@@ -185,7 +185,7 @@ Compute weights of Fejer's first quadrature rule with a Jacobi weight.
 
 
 *source:*
-[FastTransforms/src/fejer.jl:21](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/fejer.jl#L21)
+[FastTransforms/src/fejer.jl:21](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/fejer.jl#L21)
 
 ---
 
@@ -195,7 +195,7 @@ Compute weights of Fejer's second quadrature rule with a Jacobi weight.
 
 
 *source:*
-[FastTransforms/src/fejer.jl:26](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/fejer.jl#L26)
+[FastTransforms/src/fejer.jl:26](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/fejer.jl#L26)
 
 ---
 
@@ -205,5 +205,5 @@ Pochhammer symbol (x)_n = Γ(x+n)/Γ(x) for the rising factorial.
 
 
 *source:*
-[FastTransforms/src/specialfunctions.jl:13](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/b1dce339ed19119766d44b5ec44d954932da58d3/src/specialfunctions.jl#L13)
+[FastTransforms/src/specialfunctions.jl:17](https://github.com/MikaelSlevinsky/FastTransforms.jl/tree/6efacfac1164ed74c673ec2325a5bbba3197aa71/src/specialfunctions.jl#L17)
 
diff --git a/src/specialfunctions.jl b/src/specialfunctions.jl
@@ -6,6 +6,10 @@ const BACKWARD = false
 const sqrtpi = 1.772453850905516027298
 const edivsqrt2pi = 1.084437551419227546612
 
+half(x::Number) = oftype(x,0.5)
+half{T<:Number}(::Type{T}) = convert(T,0.5)
+two(x::Number) = oftype(x,2)
+two{T<:Number}(::Type{T}) = convert(T,2)
 
 """
 Pochhammer symbol (x)_n = Γ(x+n)/Γ(x) for the rising factorial.
@@ -120,7 +124,7 @@ Anαβ{T<:Integer}(n::AbstractMatrix{T},α::Number,β::Number) = [ Anαβ(n[i,j]
 #
 # I. Bogaert and B. Michiels and J. Fostier, 𝒪(1) computation of Legendre polynomials and Gauss--Legendre nodes and weights for parallel computing, SIAM J. Sci. Comput., 34:C83--C101, 2012.
 #
-Cx(x::Number) = exp(lgamma(x+1/2)-lgamma(x+1))
+Cx(x::Number) = exp(lgamma(x+half(x))-lgamma(x+one(x)))
 function Cx(x::Float64)
     if x > 9.84475
         xp = x+0.25
@@ -132,12 +136,12 @@ end
 @vectorize_1arg Number Cx
 
 Cnλ(n::Integer,λ::Float64) = 2^λ/sqrtpi*Cx(n+λ)
-Cnλ(n::Integer,λ::Number) = 2^λ/sqrt(convert(typeof(λ),π))*Cx(n+λ)
+Cnλ(n::Integer,λ::Number) = 2^λ/sqrt(oftype(λ,π))*Cx(n+λ)
 function Cnλ{T<:Integer}(n::UnitRange{T},λ::Number)
     ret = Vector{typeof(λ)}(length(n))
     ret[1] = Cnλ(first(n),λ)
     for i=2:length(n)
-        ret[i] = (n[i]+λ-1/2)/(n[i]+λ)*ret[i-1]
+        ret[i] = (n[i]+λ-half(λ))/(n[i]+λ)*ret[i-1]
     end
     ret
 end
@@ -199,7 +203,7 @@ end
 function absf(α::Number,β::Number,m::Int,θ::Number)
     ret = zero(θ)
     for l=0:m
-        ret += pochhammer(1/2+α,l)*pochhammer(1/2-α,l)*pochhammer(1/2+β,m-l)*pochhammer(1/2-β,m-l)/factorial(l)/factorial(m-l)/sinpi(θ/2)^(l+α+1/2)/cospi(θ/2)^(m-l+β+1/2)
+        ret += pochhammer(half(α)+α,l)*pochhammer(half(α)-α,l)*pochhammer(half(β)+β,m-l)*pochhammer(half(β)-β,m-l)/factorial(l)/factorial(m-l)/sinpi(θ/2)^(l+α+half(α))/cospi(θ/2)^(m-l+β+half(β))
     end
     ret
 end
@@ -213,10 +217,10 @@ function absf{T<:Number}(α::Number,β::Number,m::Int,θ::AbstractArray{T,1})
     ret = zero(θ)
     cfs = zeros(T,m+1)
     for l=0:m
-        @inbounds cfs[l+1] = pochhammer(1/2+α,l)*pochhammer(1/2-α,l)*pochhammer(1/2+β,m-l)*pochhammer(1/2-β,m-l)/factorial(l)/factorial(m-l)
+        @inbounds cfs[l+1] = pochhammer(half(α)+α,l)*pochhammer(half(α)-α,l)*pochhammer(half(β)+β,m-l)*pochhammer(half(β)-β,m-l)/factorial(l)/factorial(m-l)
     end
     @inbounds for i=1:length(θ),l=0:m
-        ret[i] += cfs[l+1]/sinpi(θ[i]/2)^(l+α+1/2)/cospi(θ[i]/2)^(m-l+β+1/2)
+        ret[i] += cfs[l+1]/sinpi(θ[i]/2)^(l+α+half(α))/cospi(θ[i]/2)^(m-l+β+half(β))
     end
     ret
 end
@@ -245,12 +249,12 @@ end
 function compute_umvm!{T<:AbstractFloat}(um::Vector{T},vm::Vector{T},cfs::Matrix{T},α::T,β::T,tempcos::Vector{T},tempsin::Vector{T},tempcosβsinα::Vector{T},m::Int,θ::Vector{T},ir::UnitRange{Int64})
     @inbounds for i in ir
         temp = inv(tempcos[i]^m*tempcosβsinα[i])
-        ϑ = (α+1/2)/2-(α+β+m+1)*θ[i]/2
+        ϑ = (α+half(α))/2-(α+β+m+1)*θ[i]/2
         um[i] = cfs[m+1,1]*cospi(ϑ)*temp
         vm[i] = cfs[m+1,1]*sinpi(ϑ)*temp
         @inbounds for l=1:m
             temp *= tempcos[i]/tempsin[i]
-            ϑ = (α+l+1/2)/2-(α+β+m+1)*θ[i]/2
+            ϑ = (α+l+half(α))/2-(α+β+m+1)*θ[i]/2
             um[i] += cfs[m+1,l+1]*cospi(ϑ)*temp
             vm[i] += cfs[m+1,l+1]*sinpi(ϑ)*temp
         end
@@ -260,7 +264,7 @@ end
 function compute_umvm!{T<:AbstractFloat}(um::Vector{T},vm::Vector{T},λ::T,tempsin::Vector{T},tempsinλ::Vector{T},m::Int,θ::Vector{T},ir::UnitRange{Int64})
     @inbounds for i in ir
         temp = inv(tempsin[i]^m*tempsinλ[i])
-        ϑ = (m+λ)*(1/2-θ[i])
+        ϑ = (m+λ)*(half(T)-θ[i])
         um[i] = cospi(ϑ)*temp
         vm[i] = sinpi(ϑ)*temp
     end
@@ -325,7 +329,7 @@ end
 function init_cfs{T<:AbstractFloat}(α::T,β::T,M::Int)
     cfs = zeros(T,M+1,M+1)
     @inbounds for m=0:M,l=0:m
-        cfs[m+1,l+1] = pochhammer(1/2+α,l)*pochhammer(1/2-α,l)*pochhammer(1/2+β,m-l)*pochhammer(1/2-β,m-l)/factorial(l)/factorial(m-l)
+        cfs[m+1,l+1] = pochhammer(half(α)+α,l)*pochhammer(half(α)-α,l)*pochhammer(half(β)+β,m-l)*pochhammer(half(β)-β,m-l)/factorial(l)/factorial(m-l)
     end
     cfs
 end