pivots running but weights all zero

Jelena Markovic · Jelena Markovic · commit 3ce4ea204409 · 2017-11-05T14:59:24.000-08:00
diff --git a/selectiveInference/R/RcppExports.R b/selectiveInference/R/RcppExports.R
@@ -0,0 +1,35 @@
+# Generated by using Rcpp::compileAttributes() -> do not edit by hand
+# Generator token: 10BE3573-1514-4C36-9D1C-5A225CD40393
+
+solve_QP <- function(Sigma, bound, maxiter, theta, linear_func, gradient, ever_active, nactive, kkt_tol, objective_tol, parameter_tol, max_active, kkt_stop, objective_stop, param_stop) {
+    .Call('selectiveInference_solve_QP', PACKAGE = 'selectiveInference', Sigma, bound, maxiter, theta, linear_func, gradient, ever_active, nactive, kkt_tol, objective_tol, parameter_tol, max_active, kkt_stop, objective_stop, param_stop)
+}
+
+solve_QP_wide <- function(X, bound, ridge_term, maxiter, theta, linear_func, gradient, X_theta, ever_active, nactive, kkt_tol, objective_tol, parameter_tol, max_active, kkt_stop, objective_stop, param_stop) {
+    .Call('selectiveInference_solve_QP_wide', PACKAGE = 'selectiveInference', X, bound, ridge_term, maxiter, theta, linear_func, gradient, X_theta, ever_active, nactive, kkt_tol, objective_tol, parameter_tol, max_active, kkt_stop, objective_stop, param_stop)
+}
+
+update1_ <- function(Q2, w, m, k) {
+    .Call('selectiveInference_update1_', PACKAGE = 'selectiveInference', Q2, w, m, k)
+}
+
+downdate1_ <- function(Q1, R, j0, m, n) {
+    .Call('selectiveInference_downdate1_', PACKAGE = 'selectiveInference', Q1, R, j0, m, n)
+}
+
+log_density_gaussian_ <- function(noise_scale, internal_linear, internal_state, optimization_linear, optimization_state, offset) {
+    .Call('selectiveInference_log_density_gaussian_', PACKAGE = 'selectiveInference', noise_scale, internal_linear, internal_state, optimization_linear, optimization_state, offset)
+}
+
+log_density_gaussian_conditional_ <- function(noise_scale, optimization_linear, optimization_state, offset) {
+    .Call('selectiveInference_log_density_gaussian_conditional_', PACKAGE = 'selectiveInference', noise_scale, optimization_linear, optimization_state, offset)
+}
+
+log_density_laplace_ <- function(noise_scale, internal_linear, internal_state, optimization_linear, optimization_state, offset) {
+    .Call('selectiveInference_log_density_laplace_', PACKAGE = 'selectiveInference', noise_scale, internal_linear, internal_state, optimization_linear, optimization_state, offset)
+}
+
+log_density_laplace_conditional_ <- function(noise_scale, optimization_linear, optimization_state, offset) {
+    .Call('selectiveInference_log_density_laplace_conditional_', PACKAGE = 'selectiveInference', noise_scale, optimization_linear, optimization_state, offset)
+}
+
diff --git a/selectiveInference/R/funs.randomized.R b/selectiveInference/R/funs.randomized.R
@@ -130,7 +130,7 @@ randomizedLASSO = function(X,
 
     # density for sampling optimization variables
 
-    observed_raw = -t(X) %*% Y
+    observed_raw = -t(X) %*% y
     inactive_lam = lam[inactive_set]
     inactive_start = sum(unpenalized) + sum(active)
     active_start = sum(unpenalized)
@@ -187,12 +187,12 @@ linear_decomposition = function(observed_target,
     var_target = as.matrix(var_target) 
     if (nrow(var_target) == 1) {
         nuisance = observed_internal - cov_target_internal * observed_target / var_target
-        target_linear = internal_transform$linear_part %*% cov_target_internal / var_target
+        target_linear = internal_transform$linear_term %*% cov_target_internal / var_target[1,1]
     } else {
         nuisance = observed_internal - cov_target_internal %*% solve(var_target) %*% observed_target 
-        target_linear = internal_transform$linear_part %*% cov_target_internal %*% solve(var_target)
+        target_linear = internal_transform$linear_term %*% cov_target_internal %*% solve(var_target)
     }
-    target_offset = internal_transform$linear_part %*% nuisance + internal_transform$offset
+    target_offset = internal_transform$linear_term %*% nuisance + internal_transform$offset_term
     return(list(linear_term=target_linear,
                 offset_term=target_offset))
 }
@@ -209,9 +209,9 @@ importance_weight = function(noise_scale,
     log_num = log_density_gaussian_(noise_scale,
                                     target_transform$linear_term,
                                     as.matrix(target_sample),
-                                    optimization_transform$linear_term,
-                                    as.matrix(opt_state),
-                                    target_transform$offset_term + optimization_transform$offset_term)
+                                    opt_transform$linear_term,
+                                    as.matrix(opt_sample),
+                                    target_transform$offset_term + opt_transform$offset_term)
 
     log_den = log_density_gaussian_conditional_(noise_scale,
                                                 opt_transform$linear_term,
diff --git a/tests/randomized/test_instances.R b/tests/randomized/test_instances.R
@@ -0,0 +1,121 @@
+#library(devtools)
+#devtools::install_github('jonathan-taylor/R-selective/selectiveInference')
+library(selectiveInference, lib.loc='/Users/Jelena/anaconda/lib/R/library')
+
+
+gaussian_instance = function(n, p, s, sigma=1, rho=0, signal=6, X=NA,
+                             random_signs=TRUE, scale=TRUE, center=TRUE, seed=NA){
+  if (!is.na(seed)){
+    set.seed(seed)
+  }
+  
+  if (is.na(X)){
+    X = sqrt(1-rho)*matrix(rnorm(n*p),n) + sqrt(rho)*matrix(rep(rnorm(n), p), nrow = n)
+    X = scale(X)/sqrt(n)
+  }
+  beta = rep(0, p)
+  if (s>0){
+    beta[1:s] = seq(3, 6, length.out=s)
+  }
+  beta = sample(beta)
+  if (random_signs==TRUE & s>0){
+    signs = sample(c(-1,1), s, replace = TRUE)
+    beta = beta * signs
+  }
+  y = X %*% beta + rnorm(n)*sigma
+  result = list(X=X,y=y,beta=beta)
+  return(result)
+}
+
+
+run_instance = function(n, p, s){
+  rho=0.3
+  lam=1.3
+  sigma=1
+  data = gaussian_instance(n=n,p=p,s=s, rho=rho, sigma=sigma)
+  X=data$X
+  print(dim(X))
+  y=data$y
+  ridge_term=sd(y)/sqrt(n)
+  noise_scale = sd(y)/2
+  lasso_soln=selectiveInference:::randomizedLASSO(X, y, lam, noise_scale, ridge_term)
+  
+  active_set = lasso_soln$active_set
+  inactive_set = lasso_soln$inactive_set
+  observed_raw = lasso_soln$observed_raw
+  opt_linear = lasso_soln$optimization_transform$linear_term
+  opt_offset =  lasso_soln$optimization_transform$offset_term
+  observed_opt_state = lasso_soln$observed_opt_state
+  
+  nactive = length(active_set)
+  print(paste("nactive",nactive))
+  B = opt_linear[,1:nactive]
+  beta_offset = observed_raw+opt_offset
+  if (nactive<p){
+    U=opt_linear[,(nactive+1):p]
+    beta_offset =+U %*% observed_opt_state[(nactive+1):p]
+  }
+  opt_transform = list(linear_term=B, offset_term = beta_offset)
+  reduced_B = chol(t(B) %*% B)
+  reduced_beta_offset = solve(t(reduced_B)) %*% (t(B) %*% beta_offset)
+    
+  log_condl_optimization_density = function(opt_state) {
+      
+      if  (sum(opt_state < 0) > 0) {
+        return(-Inf)
+      }
+      D = selectiveInference:::log_density_gaussian_conditional_(noise_scale,
+                                            reduced_B,
+                                            as.matrix(observed_opt_state[1:nactive]),
+                                            reduced_beta_offset)
+      return(D)
+    }
+  lasso_soln$log_optimization_density = log_condl_optimization_density
+  lasso_soln$observed_opt_state = observed_opt_state[1:nactive]
+  S = selectiveInference:::sample_opt_variables(lasso_soln, jump_scale=rep(1/sqrt(n), nactive), nsample=10000)
+  beta_samples = S$samples[2001:10000,]
+  print(paste("dim beta samples", dim(beta_samples)))
+  
+  X_E=X[, active_set]
+  X_minusE=X[, inactive_set]
+  target_cov = solve(t(X_E)%*%X_E)*sigma^2
+  cov_target_internal = rbind(target_cov, matrix(0, nrow=p-nactive, ncol=nactive)) * sigma^2
+  observed_target = solve(t(X_E) %*% X_E) %*% t(X_E) %*% y
+  observed_internal = c(observed_target, t(X_minusE) %*% (y-X_E%*% observed_target))
+  internal_transform = lasso_soln$internal_transform
+  
+  pivots = rep(0, nactive)
+  for (i in 1:nactive){
+    target_transform = selectiveInference:::linear_decomposition(observed_target[i], 
+                                                  observed_internal, 
+                                                  target_cov[i,i], 
+                                                  cov_target_internal[,i],
+                                                  internal_transform)
+    target_sample = rnorm(nrow(beta_samples)) * sqrt(target_cov[i,i])
+    
+    weights = selectiveInference:::importance_weight(noise_scale,
+                                                     t(as.matrix(target_sample)),
+                                                     t(beta_samples),
+                                                     opt_transform,
+                                                     target_transform,
+                                                     observed_raw)
+
+    pivots[i] = mean((target_sample<observed_target[i])*weights)/mean(weights)
+    print(pivots[i])
+  }
+  
+  return(pivots)
+}
+
+collect_instances = function(n,p,s, nsim=1){
+  
+  for (i in 1:nsim){
+    result = run_instance(n,p,s)
+  }
+}
+
+
+collect_instances(n=100, p=20, s=0)
+
+
+
diff --git a/tests/randomized/test_randomized.R b/tests/randomized/test_randomized.R
@@ -10,6 +10,7 @@ smoke_test = function() {
     ridge_term = .1 / sqrt(n)
     selectiveInference:::randomizedLASSO(X, y, lam, noise_scale, ridge_term)
 }
+
 A = smoke_test()
 
 sampler_test = function() {

Original file line number	Diff line number	Diff line change
`@@ -10,6 +10,7 @@ smoke_test = function() {`
`10`	`10`	`ridge_term = .1 / sqrt(n)`
`11`	`11`	`selectiveInference:::randomizedLASSO(X, y, lam, noise_scale, ridge_term)`
`12`	`12`	`}`
	`13`	`+`
`13`	`14`	`A = smoke_test()`
`14`	`15`
`15`	`16`	`sampler_test = function() {`