some updates

sunxd3 · sunxd3 · commit 590d37f37102 · 2024-08-14T18:35:57.000+01:00
diff --git a/gibbs_example/Project.toml b/gibbs_example/Project.toml
@@ -0,0 +1,10 @@
+[deps]
+AbstractMCMC = "80f14c24-f653-4e6a-9b94-39d6b0f70001"
+Distributions = "31c24e10-a181-5473-b8eb-7969acd0382f"
+FillArrays = "1a297f60-69ca-5386-bcde-b61e274b549b"
+LinearAlgebra = "37e2e46d-f89d-539d-b4ee-838fcccc9c8e"
+LogDensityProblems = "6fdf6af0-433a-55f7-b3ed-c6c6e0b8df7c"
+OrderedCollections = "bac558e1-5e72-5ebc-8fee-abe8a469f55d"
+Random = "9a3f8284-a2c9-5f02-9a11-845980a1fd5c"
+Test = "8dfed614-e22c-5e08-85e1-65c5234f0b40"
+Turing = "fce5fe82-541a-59a6-adf8-730c64b5f9a0"
diff --git a/gibbs_example/gibbs.jl b/gibbs_example/gibbs.jl
@@ -0,0 +1,45 @@
+using LogDensityProblems, Distributions, LinearAlgebra, Random
+using OrderedCollections
+
+struct Gibbs <: AbstractMCMC.AbstractSampler
+    sampler_map::OrderedDict
+end
+
+struct GibbsState
+    values::NamedTuple
+    states::OrderedDict
+end
+
+struct GibbsTransition
+    values::NamedTuple
+end
+
+function AbstractMCMC.step(
+    rng::AbstractRNG, model, sampler::Gibbs, args...; initial_params::NamedTuple, kwargs...
+)
+    states = OrderedDict()
+    for group in keys(sampler.sampler_map)
+        sampler = sampler.sampler_map[group]
+        cond_val = NamedTuple{group}([initial_params[g] for g in group]...)
+        trans, state = AbstractMCMC.step(
+            rng, condition(model, cond_val), sampler, args...; kwargs...
+        )
+        states[group] = state
+    end
+    return GibbsTransition(initial_params), GibbsState(initial_params, states)
+end
+
+function AbstractMCMC.step(
+    rng::AbstractRNG, model, sampler::Gibbs, state::GibbsState, args...; kwargs...
+)
+    for group in collect(keys(sampler.sampler_map))
+        sampler = sampler.sampler_map[group]
+        state = state.states[group]
+        trans, state = AbstractMCMC.step(
+            rng, condition(model, state.values[group]), sampler, state, args...; kwargs...
+        )
+        # TODO: what values to condition on here? stored where?
+        state.states[group] = state
+    end
+    return nothing
+end
diff --git a/gibbs_example/gmm.jl b/gibbs_example/gmm.jl
@@ -0,0 +1,134 @@
+using LogDensityProblems
+
+abstract type AbstractGMM end
+
+struct GMM <: AbstractGMM
+    data::NamedTuple
+end
+
+struct ConditionedGMM{conditioned_vars} <: AbstractGMM
+    data::NamedTuple
+    conditioned_values::NamedTuple{conditioned_vars}
+end
+
+function log_joint(; μ, w, z, x)
+    # μ is mean of each component
+    # w is weights of each component
+    # z is assignment of each data point
+    # x is data
+
+    K = 2 # assume we know the number of components
+    D = 2 # dimension of each data point
+    N = size(x, 2) # number of data points
+    logp = 0.0
+
+    μ_prior = MvNormal(zeros(K), I)
+    logp += logpdf(μ_prior, μ)
+
+    w_prior = Dirichlet(K, 1.0)
+    logp += logpdf(w_prior, w)
+
+    z_prior = Categorical(w)
+    logp += sum([logpdf(z_prior, z[i]) for i in 1:N])
+
+    obs_priors = [MvNormal(fill(μₖ, D), I) for μₖ in μ]
+    for i in 1:N
+        logp += logpdf(obs_priors[z[i]], x[:, i])
+    end
+
+    return logp
+end
+
+function condition(gmm::GMM, conditioned_values::NamedTuple)
+    return ConditionedGMM(gmm.data, conditioned_values)
+end
+
+function _logdensity(gmm::ConditionedGMM{(:μ, :w)}, params)
+    return log_joint(;
+        μ=gmm.conditioned_values.μ, w=gmm.conditioned_values.w, z=params.z, x=gmm.data.x
+    )
+end
+function _logdensity(gmm::ConditionedGMM{(:z,)}, params)
+    return log_joint(; μ=params.μ, w=params.w, z=gmm.conditioned_values.z, x=gmm.data.x)
+end
+
+function LogDensityProblems.logdensity(
+    gmm::ConditionedGMM{(:μ, :w)}, params_vec::AbstractVector
+)
+    return _logdensity(gmm, (; z=params_vec))
+end
+function LogDensityProblems.logdensity(
+    gmm::ConditionedGMM{(:z,)}, params_vec::AbstractVector
+)
+    return _logdensity(gmm, (; μ=params_vec[1:2], w=params_vec[3:4]))
+end
+
+function LogDensityProblems.dimension(gmm::ConditionedGMM{(:μ, :w)})
+    return size(gmm.data.x, 1)
+end
+function LogDensityProblems.dimension(gmm::ConditionedGMM{(:z,)})
+    return size(gmm.data.x, 1)
+end
+
+## test using Turing
+
+# data generation
+
+using Distributions
+using FillArrays
+using LinearAlgebra
+using Random
+
+w = [0.5, 0.5]
+μ = [-3.5, 0.5]
+mixturemodel = Distributions.MixtureModel([MvNormal(Fill(μₖ, 2), I) for μₖ in μ], w)
+
+N = 60
+x = rand(mixturemodel, N);
+
+# Turing model from https://turinglang.org/docs/tutorials/01-gaussian-mixture-model/
+using Turing
+
+@model function gaussian_mixture_model(x)
+    # Draw the parameters for each of the K=2 clusters from a standard normal distribution.
+    K = 2
+    μ ~ MvNormal(Zeros(K), I)
+
+    # Draw the weights for the K clusters from a Dirichlet distribution with parameters αₖ = 1.
+    w ~ Dirichlet(K, 1.0)
+    # Alternatively, one could use a fixed set of weights.
+    # w = fill(1/K, K)
+
+    # Construct categorical distribution of assignments.
+    distribution_assignments = Categorical(w)
+
+    # Construct multivariate normal distributions of each cluster.
+    D, N = size(x)
+    distribution_clusters = [MvNormal(Fill(μₖ, D), I) for μₖ in μ]
+
+    # Draw assignments for each datum and generate it from the multivariate normal distribution.
+    k = Vector{Int}(undef, N)
+    for i in 1:N
+        k[i] ~ distribution_assignments
+        x[:, i] ~ distribution_clusters[k[i]]
+    end
+
+    return μ, w, k, __varinfo__
+end
+
+model = gaussian_mixture_model(x);
+
+using Test
+# full model
+μ, w, k, vi = model()
+@test log_joint(; μ=μ, w=w, z=k, x=x) ≈ DynamicPPL.getlogp(vi)
+
+gmm = GMM((; x=x))
+
+# cond model on μ, w
+μ, w, k, vi = (DynamicPPL.condition(model, (μ=μ, w=w)))()
+@test _logdensity(condition(gmm, (; μ=μ, w=w)), (; z=k)) ≈ DynamicPPL.getlogp(vi)
+
+# cond model on z
+μ, w, k, vi = (DynamicPPL.condition(model, (z = k)))()
+@test _logdensity(condition(gmm, (; z=k)), (; μ=μ, w=w)) ≈ DynamicPPL.getlogp(vi)
diff --git a/gibbs_example/mh.jl b/gibbs_example/mh.jl
@@ -0,0 +1,64 @@
+struct RWMH <: AbstractMCMC.AbstractSampler
+    σ
+end
+
+struct MHTransition{T} where {T}
+    params::T
+end
+
+struct MHState{T} where {T}
+    params::T
+    logp::Float64
+end
+
+getparams(state::MHState) = state.params
+setparams!!(state::MHState, params) = MHState(params, state.logp)
+getlogp(state::MHState) = state.logp
+setlogp!!(state::MHState, logp) = MHState(state.params, logp)
+
+function AbstractMCMC.step(rng::AbstractRNG, logdensity, sampler::RWMH, args...; kwargs...)
+    params = rand(rng, LogDensityProblems.dimension(logdensity))
+    return MHTransition(params),
+    MHState(params, LogDensityProblems.logdensity(logdensity, params))
+end
+
+function AbstractMCMC.step(
+    rng::AbstractRNG, logdensity, sampler::RWMH, state::MHState, args...; kwargs...
+)
+    params = getparams(state)
+    proposal_dist = MvNormal(params, sampler.σ)
+    proposal = rand(rng, proposal_dist)
+    logp_proposal = logpdf(proposal_dist, proposal)
+    accepted = log(rand(rng)) < log1pexp(min(0, logp_proposal - getlogp(state)))
+    if accepted
+        return MHTransition(proposal), MHState(proposal, logp_proposal)
+    else
+        return MHTransition(params), MHState(params, getlogp(state))
+    end
+end
+
+struct PriorMH <: AbstractMCMC.AbstractSampler
+    prior_dist
+end
+
+function AbstractMCMC.step(
+    rng::AbstractRNG, logdensity, sampler::PriorMH, args...; kwargs...
+)
+    params = rand(rng, sampler.prior_dist)
+    return MHTransition(params), MHState(params, logdensity(params))
+end
+
+function AbstractMCMC.step(
+    rng::AbstractRNG, logdensity, sampler::PriorMH, state::MHState, args...; kwargs...
+)
+    params = getparams(state)
+    proposal_dist = sampler.prior_dist
+    proposal = rand(rng, proposal_dist)
+    logp_proposal = logpdf(proposal_dist, proposal)
+    accepted = log(rand(rng)) < log1pexp(min(0, logp_proposal - getlogp(state)))
+    if accepted
+        return MHTransition(proposal), MHState(proposal, logp_proposal)
+    else
+        return MHTransition(params), MHState(params, getlogp(state))
+    end
+end
diff --git a/src/AbstractMCMC.jl b/src/AbstractMCMC.jl
@@ -84,11 +84,18 @@ The `MCMCSerial` algorithm allows users to sample serially, with no thread or pr
 struct MCMCSerial <: AbstractMCMCEnsemble end
 
 """
-    recompute_logprob!!(rng, model, sampler, state)
+    get_logprob(state)
 
-Recompute the log-probability of the `model` based on the given `state` and return the resulting state.
+Returns the log-probability of the last sampling step, stored in `state`.
 """
-function recompute_logprob!!(rng, model, sampler, state) end
+function get_logprob(state) end
+
+"""
+    set_logprob!(state, logprob)
+
+Set the log-probability of the last sampling step, stored in `state`.
+"""
+function set_logprob!!(state, logprob) end
 
 """
     getparams(state)
@@ -97,6 +104,13 @@ Returns the values of the parameters in the state.
 """
 function getparams(state) end
 
+"""
+    setparams!(state, params)
+
+Set the values of the parameters in the state.
+"""
+function setparams!!(state, params) end
+
 include("samplingstats.jl")
 include("logging.jl")
 include("interface.jl")
diff --git a/src/example.jl b/src/example.jl