Merge branch 'jelena-markovic-randomized_jelena'

jonathan-taylor · jonathan-taylor · commit a8d50a6818f5 · 2017-11-06T11:37:40.000-08:00
diff --git a/selectiveInference/R/funs.randomized.R b/selectiveInference/R/funs.randomized.R
@@ -130,7 +130,7 @@ randomizedLASSO = function(X,
 
     # density for sampling optimization variables
 
-    observed_raw = -t(X) %*% Y
+    observed_raw = -t(X) %*% y
     inactive_lam = lam[inactive_set]
     inactive_start = sum(unpenalized) + sum(active)
     active_start = sum(unpenalized)
@@ -145,11 +145,10 @@ randomizedLASSO = function(X,
             (sum(opt_state[(active_start+1):inactive_start] < 0) > 0)) {
             return(-Inf)
         }
-
         D = log_density_gaussian_conditional_(noise_scale,
                                               opt_transform$linear_term,
                                               as.matrix(opt_state),
-                                              observed_raw)
+                                              observed_raw+opt_transform$offset_term)
         return(D)
     }
 
@@ -187,12 +186,12 @@ linear_decomposition = function(observed_target,
     var_target = as.matrix(var_target) 
     if (nrow(var_target) == 1) {
         nuisance = observed_internal - cov_target_internal * observed_target / var_target
-        target_linear = internal_transform$linear_part %*% cov_target_internal / var_target
+        target_linear = internal_transform$linear_term %*% cov_target_internal / var_target[1,1]
     } else {
         nuisance = observed_internal - cov_target_internal %*% solve(var_target) %*% observed_target 
-        target_linear = internal_transform$linear_part %*% cov_target_internal %*% solve(var_target)
+        target_linear = internal_transform$linear_term %*% cov_target_internal %*% solve(var_target)
     }
-    target_offset = internal_transform$linear_part %*% nuisance + internal_transform$offset
+    target_offset = internal_transform$linear_term %*% nuisance + internal_transform$offset_term
     return(list(linear_term=target_linear,
                 offset_term=target_offset))
 }
@@ -209,14 +208,14 @@ importance_weight = function(noise_scale,
     log_num = log_density_gaussian_(noise_scale,
                                     target_transform$linear_term,
                                     as.matrix(target_sample),
-                                    optimization_transform$linear_term,
-                                    as.matrix(opt_state),
-                                    target_transform$offset_term + optimization_transform$offset_term)
+                                    opt_transform$linear_term,
+                                    as.matrix(opt_sample),
+                                    target_transform$offset_term + opt_transform$offset_term)
 
     log_den = log_density_gaussian_conditional_(noise_scale,
                                                 opt_transform$linear_term,
                                                 as.matrix(opt_sample),
-                                                observed_raw)
+                                                observed_raw+opt_transform$offset_term)
     W = log_num - log_den
     W = W - max(W)
     return(exp(W))
diff --git a/tests/randomized/test_instances.R b/tests/randomized/test_instances.R
@@ -0,0 +1,162 @@
+library(selectiveInference)
+
+gaussian_instance = function(n, p, s, sigma=1, rho=0, signal=6, X=NA,
+                             random_signs=TRUE, scale=TRUE, center=TRUE, seed=NA){
+  if (!is.na(seed)){
+    set.seed(seed)
+  }
+  
+  if (is.na(X)){
+    X = sqrt(1-rho)*matrix(rnorm(n*p),n) + sqrt(rho)*matrix(rep(rnorm(n), p), nrow = n)
+    X = scale(X)/sqrt(n)
+  }
+  beta = rep(0, p)
+  if (s>0){
+    beta[1:s] = seq(3, 6, length.out=s)
+  }
+  beta = sample(beta)
+  if (random_signs==TRUE & s>0){
+    signs = sample(c(-1,1), s, replace = TRUE)
+    beta = beta * signs
+  }
+  y = X %*% beta + rnorm(n)*sigma
+  result = list(X=X,y=y,beta=beta)
+  return(result)
+}
+
+conditional_density = function(noise_scale, lasso_soln){
+  
+  active_set = lasso_soln$active_set
+  observed_raw = lasso_soln$observed_raw
+  opt_linear = lasso_soln$optimization_transform$linear_term
+  opt_offset =  lasso_soln$optimization_transform$offset_term
+  observed_opt_state = lasso_soln$observed_opt_state
+  
+  nactive = length(active_set)
+  B = opt_linear[,1:nactive]
+  beta_offset = opt_offset
+  p=length(observed_opt_state)
+  if (nactive<p){
+    beta_offset = beta_offset+(opt_linear[,(nactive+1):p] %*% observed_opt_state[(nactive+1):p])
+  }
+  opt_transform = list(linear_term=B, 
+                       offset_term = beta_offset)
+  reduced_B = chol(t(B) %*% B)
+  beta_offset = beta_offset+observed_raw
+  reduced_beta_offset = solve(t(reduced_B)) %*% (t(B) %*% beta_offset)
+  
+  log_condl_optimization_density = function(opt_state) {
+    if  (sum(opt_state < 0) > 0) {
+      return(-Inf)
+    }
+    D = selectiveInference:::log_density_gaussian_conditional_(noise_scale,
+                                                               reduced_B,
+                                                               as.matrix(opt_state),
+                                                               reduced_beta_offset)
+    return(D)
+  }
+  lasso_soln$log_optimization_density = log_condl_optimization_density
+  lasso_soln$observed_opt_state = observed_opt_state[1:nactive]
+  lasso_soln$optimization_transform = opt_transform
+  return(lasso_soln)
+}
+
+
+randomized_inference = function(X,y,sigma, lam, noise_scale, ridge_term){
+  n=nrow(X)
+  p=ncol(X)
+  lasso_soln=selectiveInference:::randomizedLASSO(X, y, lam, noise_scale, ridge_term)
+  active_set = lasso_soln$active_set
+  inactive_set = lasso_soln$inactive_set
+  nactive = length(active_set)
+  print(paste("nactive", nactive))
+  
+  #lasso_soln = conditional_density(noise_scale, lasso_soln)
+  
+  dim=length(lasso_soln$observed_opt_state)
+  print(paste("chain dim", dim))
+  S = selectiveInference:::sample_opt_variables(lasso_soln, jump_scale=rep(1/sqrt(n), dim), nsample=10000)
+  opt_samples = S$samples[2001:10000,]
+  print(paste("dim opt samples", toString(dim(opt_samples))))
+  
+  X_E=X[, active_set]
+  X_minusE=X[, inactive_set]
+  target_cov = solve(t(X_E) %*% X_E)*sigma^2
+  cov_target_internal = rbind(target_cov, matrix(0, nrow=p-nactive, ncol=nactive))
+  observed_target = solve(t(X_E) %*% X_E) %*% t(X_E) %*% y
+  observed_internal = c(observed_target, t(X_minusE) %*% (y-X_E%*% observed_target))
+  internal_transform = lasso_soln$internal_transform
+  opt_transform = lasso_soln$optimization_transform
+  observed_raw = lasso_soln$observed_raw
+  
+  pivots = rep(0, nactive)
+  ci = matrix(0, nactive, 2)
+  for (i in 1:nactive){
+    target_transform = selectiveInference:::linear_decomposition(observed_target[i], 
+                                                  observed_internal, 
+                                                  target_cov[i,i], 
+                                                  cov_target_internal[,i],
+                                                  internal_transform)
+    target_sample = rnorm(nrow(opt_samples)) * sqrt(target_cov[i,i])
+    
+    pivot = function(candidate){
+      weights = selectiveInference:::importance_weight(noise_scale,
+                                                     t(as.matrix(target_sample))+candidate,
+                                                     t(opt_samples),
+                                                     opt_transform,
+                                                     target_transform,
+                                                     observed_raw)
+      return(mean((target_sample<observed_target[i])*weights)/mean(weights))
+    }
+    level = 0.9
+    rootU = function(candidate){
+      return (pivot(observed_target[i]+candidate)-(1-level)/2)
+    }
+    rootL = function(candidate){
+      return (pivot(observed_target[i]+candidate)-(1+level)/2)
+    }
+    pivots[i] = pivot(0)
+    line_min = -10*sd(target_sample)
+    line_max = 10*sd(target_sample)
+    ci[i,1] = uniroot(rootU, c(line_min, line_max))$root+observed_target[i]
+    ci[i,2] = uniroot(rootL,c(line_min, line_max))$root+observed_target[i]
+  }
+  print(paste("pivots", toString(pivots)))
+  for (i in 1:nactive){
+    print(paste("CIs", toString(ci[i,])))
+  }
+  return(list(pivots=pivots, ci=ci))
+}
+
+collect_results = function(n,p,s, nsim=1){
+  rho=0.3
+  lam=1.
+  sigma=1
+  sample_pivots = NULL
+  for (i in 1:nsim){
+    data = gaussian_instance(n=n,p=p,s=s, rho=rho, sigma=sigma)
+    X=data$X
+    print(dim(X))
+    y=data$y
+    ridge_term=sd(y)/sqrt(n)
+    noise_scale = sd(y)/2
+    #X = matrix(rnorm(n * p), n, p)
+    #y = rnorm(n)
+    #lam = 20 / sqrt(n)
+    #noise_scale = 0.01 * sqrt(n)
+    #ridge_term = .1 / sqrt(n)
+    result = randomized_inference(X,y,sigma,lam,noise_scale,ridge_term)
+    sample_pivots = c(sample_pivots, result$pivots)
+  }
+  
+  jpeg('pivots.jpg')
+  plot(ecdf(sample_pivots), xlim=c(0,1),  main="Empirical CDF of null p-values", xlab="p-values", ylab="ecdf")
+  abline(0, 1, lty=2)
+  dev.off()
+}
+
+set.seed(1)
+collect_results(n=100, p=20, s=0)
+
+
+
diff --git a/tests/randomized/test_randomized.R b/tests/randomized/test_randomized.R
@@ -1,7 +1,6 @@
 library(selectiveInference)
 
 smoke_test = function() {
-
     n = 100; p = 50
     X = matrix(rnorm(n * p), n, p)
     y = rnorm(n)
@@ -10,6 +9,7 @@ smoke_test = function() {
     ridge_term = .1 / sqrt(n)
     selectiveInference:::randomizedLASSO(X, y, lam, noise_scale, ridge_term)
 }
+
 A = smoke_test()
 
 sampler_test = function() {