Bayesian-Graphical-Modelling-Lab
diff --git a/‎R/RcppExports.R‎
Lines changed: 4 additions & 0 deletions b/‎R/RcppExports.R‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎man/bgm.Rd‎
Lines changed: 20 additions & 4 deletions b/‎man/bgm.Rd‎
Lines changed: 20 additions & 4 deletions
diff --git a/‎showcase_newton_raphson.R‎
Lines changed: 219 additions & 0 deletions b/‎showcase_newton_raphson.R‎
Lines changed: 219 additions & 0 deletions
diff --git a/‎src/RcppExports.cpp‎
Lines changed: 25 additions & 0 deletions b/‎src/RcppExports.cpp‎
Lines changed: 25 additions & 0 deletions
@@ -9,6 +9,10 @@ sample_bcomrf_gibbs <- function(no_states, no_variables, no_categories, interact
     .Call(`_bgms_sample_bcomrf_gibbs`, no_states, no_variables, no_categories, interactions, thresholds, variable_type, reference_category, iter)
 }
 
+optimize_log_pseudoposterior_interaction <- function(initial_value, pairwise_effects, main_effects, observations, num_categories, num_persons, variable1, variable2, proposed_state, current_state, residual_matrix, is_ordinal_variable, reference_category, interaction_scale) {
+    .Call(`_bgms_optimize_log_pseudoposterior_interaction`, initial_value, pairwise_effects, main_effects, observations, num_categories, num_persons, variable1, variable2, proposed_state, current_state, residual_matrix, is_ordinal_variable, reference_category, interaction_scale)
+}
+
 run_gibbs_sampler_for_bgm <- function(observations, num_categories, interaction_scale, edge_prior, inclusion_probability, beta_bernoulli_alpha, beta_bernoulli_beta, dirichlet_alpha, lambda, interaction_index_matrix, iter, burnin, num_obs_categories, sufficient_blume_capel, threshold_alpha, threshold_beta, na_impute, missing_index, is_ordinal_variable, reference_category, save_main = FALSE, save_pairwise = FALSE, save_indicator = FALSE, display_progress = FALSE, edge_selection = TRUE, update_method = "adaptive-metropolis") {
     .Call(`_bgms_run_gibbs_sampler_for_bgm`, observations, num_categories, interaction_scale, edge_prior, inclusion_probability, beta_bernoulli_alpha, beta_bernoulli_beta, dirichlet_alpha, lambda, interaction_index_matrix, iter, burnin, num_obs_categories, sufficient_blume_capel, threshold_alpha, threshold_beta, na_impute, missing_index, is_ordinal_variable, reference_category, save_main, save_pairwise, save_indicator, display_progress, edge_selection, update_method)
 }
 
@@ -0,0 +1,219 @@
+library(bgms)
+
+pseudolikelihood_numerator <- function(thresholds, interactions, suffstats, seen, threshold_counts_without_0, P) {
+  result <- 0.0
+
+  for (i in seq_len(P)) {
+    for (u in seq_len(seen[i] - 1)) {
+      result <- result + threshold_counts_without_0[i, u] * thresholds[i, u]
+    }
+  }
+
+  result <- result + sum(interactions * suffstats)
+
+  return(result)
+}
+
+
+pseudo_logposterior_full_aij2 <- function(a, i, j, thresholds, interactions, suffstats, seen, threshold_counts_without_0, X, P, N,
+                                          prior_cauchy_scale = 2.5) {
+
+  interactions[i, j] <- interactions[j, i] <- a
+
+  pseudolikelihood_numerator(
+    thresholds                 = thresholds,
+    interactions               = interactions,
+    suffstats                  = suffstats,
+    seen                       = seen,
+    threshold_counts_without_0 = threshold_counts_without_0,
+    P                          = P
+  ) +
+    pseudolikelihood_denominator2(
+      thresholds                 = thresholds,
+      interactions               = interactions,
+      suffstats                  = suffstats,
+      seen                       = seen,
+      X                          = X,
+      P                          = P,
+      N                          = N,
+      i0                         = i,
+      j0                         = j
+    ) +
+    sum(dcauchy(interactions[lower.tri(interactions)], 0, prior_cauchy_scale, log = TRUE))
+}
+
+pseudolikelihood_denominator2 <- function(thresholds, interactions, suffstats, seen, X, P, N, i0, j0) {
+  result <- 0.0
+
+  for (v in seq_len(N)) {
+    for (i in c(i0, j0)) {
+      temp1 <- c(crossprod(interactions[i, ], X[v, ]))
+
+      temp2 <- 1.0
+      for (u in seq_len(seen[i] - 1)) {
+        temp2 <- temp2 + exp(thresholds[i, u] + u * temp1)
+      }
+
+      result <- result - log(temp2)
+    }
+  }
+
+  return(result)
+}
+
+log_pseudolikelihood_full2 <- function(a, i, j, Mu, Sigma, iter, x, suffstats, seen, threshold_counts_without_0) {
+
+
+  n <- nrow(x)  # Number of observations
+  p <- ncol(x)
+
+  MuIter <- Mu[iter, ]
+  MuMat <- matrix(0, p, ncol(threshold_counts_without_0))  # Initialize matrix for thresholds
+  idx <- 1
+  for (ii in 1:p) {
+    for (jj in 1:ncol(MuMat)) {
+      MuMat[ii, jj] <- MuIter[idx]
+      idx <- idx + 1# Fill matrix with threshold values
+    }
+  }
+  SigmaIter <- Sigma[iter, ]
+  SigmaMat = matrix(0, p, p)  # Initialize matrix for interactions
+  SigmaMat[lower.tri(SigmaMat)] = SigmaIter  # Fill lower triangle with Sigma values
+  SigmaMat = SigmaMat + t(SigmaMat)  # Make symmetric
+
+  D = length(a)  # Number of elements in a
+  log_pl = numeric(length = D)  # Initialize log pseudolikelihood vector
+
+  # colMax <- unname(matrixStats::colMaxs(x))
+  # log_p <- numeric(length = max(colMax) + 1)  # Initialize log probability vector
+
+  for (d in 1:D) {
+    log_pl[d] = pseudo_logposterior_full_aij2(a[d], i, j, thresholds = MuMat, interactions = SigmaMat, X = x, N = n, P = p,
+                                              seen = seen, suffstats = suffstats, threshold_counts_without_0 = threshold_counts_without_0)
+  }
+
+  return(log_pl)  # Return log pseudolikelihood
+}
+
+
+x0 = Wenchuan[1:50, 1:5]  # Select the first 5 columns of Wenchuan dataset
+p = ncol(x0)  # Get the number of variables (columns)
+
+samples = bgm(x0, save = TRUE)  # Run the bgm function and save samples
+Mu    = samples$main_effect_samples  # Extract threshold estimates
+Sigma = samples$pairwise_effect_samples  # Extract interaction estimates
+
+data = bgms:::reformat_data(x = x0,
+                            na_action = "listwise",
+                            variable_bool = rep(TRUE, p),
+                            reference_category = rep(1, p))
+
+x = data$x  # Extract reformatted data
+no_categories = data$no_categories  # Get number of categories per variable
+no_categories = cumsum(no_categories)  # Cumulative sum for indexing
+start = 1 + c(0, no_categories[-length(no_categories)])  # Start indices
+stop = no_categories  # Stop indices
+
+K <- max(x)
+threshold_counts_wench <- apply(x, 2, \(y) c(table(c(y, 0:K)) - 1))
+threshold_counts_without_0_wench <- apply(threshold_counts_wench, 2L, \(y) {
+  c(y[y > 0], rep(0, sum(y == 0)))[-1L]
+})
+threshold_counts_without_0_wench <- t(matrix(threshold_counts_without_0_wench, K, p))
+
+seen_wench <- unname(apply(x, 2, \(y) length(unique(y))))
+suffstats_wench <- unname(crossprod(x))
+
+
+i <- 2; j <- 1
+log_pseudolikelihood_full2(c(.2, .5), i, j, Mu, Sigma, iter = 10000, x = x,
+                           seen = seen_wench, suffstats = suffstats_wench,
+                           threshold_counts_without_0 = threshold_counts_without_0_wench)
+
+optim_res <- optim(Sigma[i, j], function(a) {
+  returnVal <- log_pseudolikelihood_full2(a, i, j, Mu, Sigma, iter = 10000, x = x,
+                             seen = seen_wench, suffstats = suffstats_wench,
+                             threshold_counts_without_0 = threshold_counts_without_0_wench)
+  if (any(!is.finite(returnVal))) {
+    for (i in seq_along(returnVal)) {
+      # if (!is.finite(returnVal[i])) {
+      #   print(sprintf("a: %f, returnVal: %f", a[i], returnVal[i]))
+      # }
+      if (!is.finite(returnVal[i]) && returnVal[i] < 0) {
+        returnVal[i] <- -.Machine$double.xmax
+      }
+    }
+  }
+  return(returnVal)
+}, method = "Brent", lower = -100, upper = 100, control = list(fnscale = -1, trace = 5))
+
+
+# setup arguments for C++
+iter <- 10000
+MuMat <- matrix(0, p, ncol(threshold_counts_without_0_wench))  # Initialize matrix for thresholds
+idx <- 1
+for (ii in 1:p) {
+  for (jj in 1:ncol(MuMat)) {
+    MuMat[ii, jj] <- Mu[iter, idx]
+    idx <- idx + 1# Fill matrix with threshold values
+  }
+}
+SigmaMat = matrix(0, p, p)  # Initialize matrix for interactions
+SigmaMat[lower.tri(SigmaMat)] = Sigma[iter, ]  # Fill lower triangle with Sigma values
+SigmaMat = SigmaMat + t(SigmaMat)  # Make symmetric
+
+
+pairwise_effects <- SigmaMat
+main_effects     <- MuMat
+
+# const double
+initial_value <- Sigma[i, j]
+# const arma::mat&
+pairwise_effects <- SigmaMat
+# const arma::mat&
+main_effects <- MuMat
+# const arma::imat&
+observations <- x
+# const arma::ivec&
+num_categories <- seen_wench
+# const int
+num_persons <- nrow(x)
+# const int
+variable1 <- i
+# const int
+variable2 <- j
+# TODO: these two are unused?
+# const double
+proposed_state <- 0.0
+# const double
+current_state <- 0.0
+# const arma::mat&
+residual_matrix <- matrix(0, nrow(x), p)
+# const arma::uvec&
+is_ordinal_variable <- rep(1, p)
+# const arma::ivec&
+reference_category <- data$reference_category
+# const double
+interaction_scale <- 2.5
+
+newton_raphson_x <- bgms:::optimize_log_pseudoposterior_interaction(
+  initial_value       = c(initial_value),
+  pairwise_effects    = pairwise_effects,
+  main_effects        = main_effects,
+  observations        = observations,
+  num_categories      = num_categories - 1,
+  num_persons         = num_persons,
+  variable1           = variable1 - 1,
+  variable2           = variable2 - 1,
+  proposed_state      = proposed_state,
+  current_state       = current_state,
+  residual_matrix     = residual_matrix,
+  is_ordinal_variable = is_ordinal_variable,
+  reference_category  = reference_category,
+  interaction_scale   = interaction_scale
+)
+newton_raphson_fx <- log_pseudolikelihood_full2(newton_raphson, i, j, Mu, Sigma, iter = 10000, x = x,
+                                                seen = seen_wench, suffstats = suffstats_wench,
+                                                threshold_counts_without_0 = threshold_counts_without_0_wench)
+matrix(c(newton_raphson_x, newton_raphson_fx, optim_res$par, optim_res$value),
+       nrow = 2, dimnames = list(c("x", "f(x)"), c("Newton-Raphson", "Optim")))
@@ -45,6 +45,30 @@ BEGIN_RCPP
     return rcpp_result_gen;
 END_RCPP
 }
+// optimize_log_pseudoposterior_interaction
+double optimize_log_pseudoposterior_interaction(const double initial_value, arma::mat& pairwise_effects, const arma::mat& main_effects, const arma::imat& observations, const arma::ivec& num_categories, const int num_persons, const int variable1, const int variable2, const double proposed_state, const double current_state, const arma::mat& residual_matrix, const arma::uvec& is_ordinal_variable, const arma::ivec& reference_category, const double interaction_scale);
+RcppExport SEXP _bgms_optimize_log_pseudoposterior_interaction(SEXP initial_valueSEXP, SEXP pairwise_effectsSEXP, SEXP main_effectsSEXP, SEXP observationsSEXP, SEXP num_categoriesSEXP, SEXP num_personsSEXP, SEXP variable1SEXP, SEXP variable2SEXP, SEXP proposed_stateSEXP, SEXP current_stateSEXP, SEXP residual_matrixSEXP, SEXP is_ordinal_variableSEXP, SEXP reference_categorySEXP, SEXP interaction_scaleSEXP) {
+BEGIN_RCPP
+    Rcpp::RObject rcpp_result_gen;
+    Rcpp::RNGScope rcpp_rngScope_gen;
+    Rcpp::traits::input_parameter< const double >::type initial_value(initial_valueSEXP);
+    Rcpp::traits::input_parameter< arma::mat& >::type pairwise_effects(pairwise_effectsSEXP);
+    Rcpp::traits::input_parameter< const arma::mat& >::type main_effects(main_effectsSEXP);
+    Rcpp::traits::input_parameter< const arma::imat& >::type observations(observationsSEXP);
+    Rcpp::traits::input_parameter< const arma::ivec& >::type num_categories(num_categoriesSEXP);
+    Rcpp::traits::input_parameter< const int >::type num_persons(num_personsSEXP);
+    Rcpp::traits::input_parameter< const int >::type variable1(variable1SEXP);
+    Rcpp::traits::input_parameter< const int >::type variable2(variable2SEXP);
+    Rcpp::traits::input_parameter< const double >::type proposed_state(proposed_stateSEXP);
+    Rcpp::traits::input_parameter< const double >::type current_state(current_stateSEXP);
+    Rcpp::traits::input_parameter< const arma::mat& >::type residual_matrix(residual_matrixSEXP);
+    Rcpp::traits::input_parameter< const arma::uvec& >::type is_ordinal_variable(is_ordinal_variableSEXP);
+    Rcpp::traits::input_parameter< const arma::ivec& >::type reference_category(reference_categorySEXP);
+    Rcpp::traits::input_parameter< const double >::type interaction_scale(interaction_scaleSEXP);
+    rcpp_result_gen = Rcpp::wrap(optimize_log_pseudoposterior_interaction(initial_value, pairwise_effects, main_effects, observations, num_categories, num_persons, variable1, variable2, proposed_state, current_state, residual_matrix, is_ordinal_variable, reference_category, interaction_scale));
+    return rcpp_result_gen;
+END_RCPP
+}
 // run_gibbs_sampler_for_bgm
 List run_gibbs_sampler_for_bgm(arma::imat& observations, const arma::ivec& num_categories, const double interaction_scale, const String& edge_prior, arma::mat& inclusion_probability, const double beta_bernoulli_alpha, const double beta_bernoulli_beta, const double dirichlet_alpha, const double lambda, const arma::imat& interaction_index_matrix, const int iter, const int burnin, arma::imat& num_obs_categories, arma::imat& sufficient_blume_capel, const double threshold_alpha, const double threshold_beta, const bool na_impute, const arma::imat& missing_index, const arma::uvec& is_ordinal_variable, const arma::ivec& reference_category, const bool save_main, const bool save_pairwise, const bool save_indicator, const bool display_progress, bool edge_selection, const std::string& update_method);
 RcppExport SEXP _bgms_run_gibbs_sampler_for_bgm(SEXP observationsSEXP, SEXP num_categoriesSEXP, SEXP interaction_scaleSEXP, SEXP edge_priorSEXP, SEXP inclusion_probabilitySEXP, SEXP beta_bernoulli_alphaSEXP, SEXP beta_bernoulli_betaSEXP, SEXP dirichlet_alphaSEXP, SEXP lambdaSEXP, SEXP interaction_index_matrixSEXP, SEXP iterSEXP, SEXP burninSEXP, SEXP num_obs_categoriesSEXP, SEXP sufficient_blume_capelSEXP, SEXP threshold_alphaSEXP, SEXP threshold_betaSEXP, SEXP na_imputeSEXP, SEXP missing_indexSEXP, SEXP is_ordinal_variableSEXP, SEXP reference_categorySEXP, SEXP save_mainSEXP, SEXP save_pairwiseSEXP, SEXP save_indicatorSEXP, SEXP display_progressSEXP, SEXP edge_selectionSEXP, SEXP update_methodSEXP) {
@@ -143,6 +167,7 @@ END_RCPP
 static const R_CallMethodDef CallEntries[] = {
     {"_bgms_sample_omrf_gibbs", (DL_FUNC) &_bgms_sample_omrf_gibbs, 6},
     {"_bgms_sample_bcomrf_gibbs", (DL_FUNC) &_bgms_sample_bcomrf_gibbs, 8},
+    {"_bgms_optimize_log_pseudoposterior_interaction", (DL_FUNC) &_bgms_optimize_log_pseudoposterior_interaction, 14},
     {"_bgms_run_gibbs_sampler_for_bgm", (DL_FUNC) &_bgms_run_gibbs_sampler_for_bgm, 26},
     {"_bgms_compare_anova_gibbs_sampler", (DL_FUNC) &_bgms_compare_anova_gibbs_sampler, 34},
     {"_bgms_compute_Vn_mfm_sbm", (DL_FUNC) &_bgms_compute_Vn_mfm_sbm, 4},
Original file line number	Diff line number	Diff line change
`@@ -9,6 +9,10 @@ sample_bcomrf_gibbs <- function(no_states, no_variables, no_categories, interact`
`9`	`9`	.Call(`_bgms_sample_bcomrf_gibbs`, no_states, no_variables, no_categories, interactions, thresholds, variable_type, reference_category, iter)
`10`	`10`	`}`
`11`	`11`
	`12`	`+optimize_log_pseudoposterior_interaction <- function(initial_value, pairwise_effects, main_effects, observations, num_categories, num_persons, variable1, variable2, proposed_state, current_state, residual_matrix, is_ordinal_variable, reference_category, interaction_scale) {`
	`13`	+ .Call(`_bgms_optimize_log_pseudoposterior_interaction`, initial_value, pairwise_effects, main_effects, observations, num_categories, num_persons, variable1, variable2, proposed_state, current_state, residual_matrix, is_ordinal_variable, reference_category, interaction_scale)
	`14`	`+}`
	`15`	`+`
`12`	`16`	run_gibbs_sampler_for_bgm <- function(observations, num_categories, interaction_scale, edge_prior, inclusion_probability, beta_bernoulli_alpha, beta_bernoulli_beta, dirichlet_alpha, lambda, interaction_index_matrix, iter, burnin, num_obs_categories, sufficient_blume_capel, threshold_alpha, threshold_beta, na_impute, missing_index, is_ordinal_variable, reference_category, save_main = FALSE, save_pairwise = FALSE, save_indicator = FALSE, display_progress = FALSE, edge_selection = TRUE, update_method = "adaptive-metropolis") {
`13`	`17`	.Call(`_bgms_run_gibbs_sampler_for_bgm`, observations, num_categories, interaction_scale, edge_prior, inclusion_probability, beta_bernoulli_alpha, beta_bernoulli_beta, dirichlet_alpha, lambda, interaction_index_matrix, iter, burnin, num_obs_categories, sufficient_blume_capel, threshold_alpha, threshold_beta, na_impute, missing_index, is_ordinal_variable, reference_category, save_main, save_pairwise, save_indicator, display_progress, edge_selection, update_method)
`14`	`18`	`}`