CoBrALab · Gab-D-G · Jul 22, 2024 · Jul 23, 2024 · Feb 5, 2025 · Mar 6, 2025
diff --git a/rabies/analysis_pkg/analysis_functions.py b/rabies/analysis_pkg/analysis_functions.py
diff --git a/rabies/analysis_pkg/analysis_math.py b/rabies/analysis_pkg/analysis_math.py
@@ -73,155 +73,3 @@ def dual_regression(all_IC_vectors, timeseries):
     # we thus output a model of the timeseries of the form X = W.dot((S*C).T)
     DR = {'C':C, 'W':W, 'S':S}
     return DR
-
-
-'''
-Convergence through alternating minimization using OLS
-'''
-
-from sklearn.utils import check_random_state
-
-def dual_OLS_fit(X, q=1, c_init=None, C_prior=None, W_prior=None, tol=1e-6, max_iter=200, verbose=1):
-    # X: time by voxel matrix
-    # q: number of new components to fit
-    # c_init: can specify an voxel by component number matrix for initiating weights
-    # C_prior: a voxel by component matrix of priors that are included in the fitting, but fixed as constant components
-
-    # q defines the number of new sources to fit
-    if c_init is None:
-        random_state = check_random_state(None)
-        c_init = random_state.normal(
-            size=(X.shape[1], q))
-
-    if C_prior is None:
-        C_prior = np.zeros([X.shape[1], 0])
-    C_prior /= np.sqrt((C_prior ** 2).sum(axis=0))
-
-    C = c_init
-    C /= np.sqrt((C ** 2).sum(axis=0))
-
-    if W_prior is None:
-        W_prior = np.zeros([X.shape[0], 0])
-    W_prior /= np.sqrt((W_prior ** 2).sum(axis=0))
-    num_prior_W = W_prior.shape[1]
-
-    Cw = closed_form(W_prior, X).T # compute an initial C representation of W_prior
-
-    for i in range(max_iter):
-        C_prev = C
-        C_ = np.concatenate((C, C_prior, Cw), axis=1) # add in the prior to contribute to the fitting
-
-        ##### first OLS convergence step
-        W = closed_form(C_, X.T).T
-
-        if num_prior_W>0:
-            W[:,-num_prior_W:] = W_prior # add back W_prior
-
-        ##### second OLS convergence step
-        C_ = closed_form(W, X).T
-        C_ /= np.sqrt((C_ ** 2).sum(axis=0))
-
-        if num_prior_W>0:
-            Cw = C_[:,-num_prior_W:] # update Cw
-
-        C = C_[:,:q] # take out the fitted components
-
-        ##### evaluate convergence
-        if q<1: # break if no new component is being fitted
-            break
-        lim = np.abs(np.abs((C * C_prev).sum(axis=0)) - 1).mean()
-        if verbose > 2:
-            print('lim:'+str(lim))
-        if lim < tol:
-            if verbose > 1:
-                print(str(i)+' iterations to converge.')
-            break
-        if i == max_iter-1:
-            if verbose > 0:
-                print(
-                    'Convergence failed. Consider increasing max_iter or decreasing tol.')
-    return C, C_,W
-
-
-def spatiotemporal_prior_fit(X, C_prior, num_W, num_C):
-    num_priors = C_prior.shape[1]
-    # first fit data-driven temporal components
-    W_extra,W_, C = dual_OLS_fit(X.T, q=num_W, c_init=None, C_prior=None, W_prior = C_prior, tol=1e-6, max_iter=200, verbose=1)
-    # second fit data-driven spatial components
-    C_extra,C_, W = dual_OLS_fit(X, q=num_C, c_init=None, C_prior=C_prior, W_prior = W_extra, tol=1e-6, max_iter=200, verbose=1)
-    Cw = C_[:,num_priors+num_C:] # take out the Cw before fitting the priors, so that it's estimation was not biased by any particular prior
-
-    C_fitted_prior = np.zeros([X.shape[1], num_priors])
-    for i in range(num_priors):
-        prior = C_prior[:,i] # the prior that will be fitted
-        C_extra_prior = np.concatenate((C_extra, C_prior[:,:i], C_prior[:,i+1:]), axis=1) # combine previously-fitted extra components with priors not getting fitted
-        C_fit,C_, W_fit = dual_OLS_fit(X, q=1, c_init=None, C_prior=C_extra_prior, W_prior = W_extra, tol=1e-6, max_iter=200, verbose=1)
-
-        C_fitted_prior[:,i] = C_fit[:,0]
-
-        corr = np.corrcoef(C_fitted_prior[:,i].T, prior.T)[0,1]
-        if corr<0: # if the correlation is negative, invert the weights on the fitted component
-            C_fitted_prior[:,i]*=-1
-
-    # estimate a final set for C and W, offering a final linear fit to X = WtC
-    C = np.concatenate((C_fitted_prior, C_extra, Cw), axis=1)
-    W = closed_form(C, X.T).T
-    if num_W>0:
-        W[:,-num_W:] = W_extra # add back W_prior
-    W /= np.sqrt((W ** 2).mean(axis=0)) # the temporal domain is variance-normalized so that the weights are contained in the spatial maps
-    C = closed_form(W, X).T
-
-    S = np.sqrt((C ** 2).mean(axis=0)) # the component variance/scaling is taken from the spatial maps
-    C /= S # the spatial maps are variance normalized; the variance is stored in S
-
-    # Fitted priors are at the first indices
-    C_fitted_prior = C[:,:num_priors]
-    W_fitted_prior = W[:,:num_priors]
-    S_fitted_prior = S[:num_priors]
-
-    # temporal components are at the last indices
-    C_temporal = C[:,num_priors+num_C:]
-    W_temporal = W[:,num_priors+num_C:]
-    S_temporal = S[num_priors+num_C:]
-
-    # spatial components are in the middle
-    C_spatial = C[:,num_priors:num_priors+num_C]
-    W_spatial = W[:,num_priors:num_priors+num_C]
-    S_spatial = S[num_priors:num_priors+num_C]
-
-    corr_list=[]
-    for i in range(num_priors):
-        corr = np.corrcoef(C_fitted_prior[:,i].T, C_prior[:,i].T)[0,1]
-        corr_list.append(corr)
-
-    # we thus output a model of the timeseries of the form X = W.dot((S*C).T)
-    return {'C_fitted_prior':C_fitted_prior, 'C_spatial':C_spatial, 'C_temporal':C_temporal, 
-            'W_fitted_prior':W_fitted_prior, 'W_spatial':W_spatial, 'W_temporal':W_temporal, 
-            'S_fitted_prior':S_fitted_prior, 'S_spatial':S_spatial, 'S_temporal':S_temporal, 
-            'corr_list':corr_list}
-
-'''
-
-def closed_form_3d(X,Y):
-    return np.matmul(np.matmul(np.linalg.inv(np.matmul(X.transpose(0,2,1),X)),X.transpose(0,2,1)),Y)
-
-def lme_stats_3d(X,Y):
-    #add an intercept
-    X=np.concatenate((X,np.ones((X.shape[0],X.shape[1],1))),axis=2)
-    [num_comparisons,num_observations,num_predictors] = X.shape
-    [num_comparisons,num_observations,num_features] = Y.shape
-
-    w=closed_form_3d(X,Y)
-
-    residuals = Y-np.matmul(X, w)
-    MSE = (((residuals)**2).sum(axis=1)/(num_observations-num_predictors))
-
-
-    var_b = np.expand_dims(MSE, axis=1)*np.expand_dims(np.linalg.inv(np.matmul(X.transpose(0,2,1),X)).diagonal(axis1=1,axis2=2), axis=2)
-    sd_b = np.sqrt(var_b) # standard error on the Betas
-    ts_b = w/sd_b # calculate t-values for the Betas
-    p_values =[2*(1-stats.t.cdf(np.abs(ts_b[:,i,:]),(num_observations-num_predictors))) for i in range(ts_b.shape[1])] # calculate a p-value map for each predictor
-
-    return ts_b,p_values,w,residuals
-
-'''
diff --git a/rabies/analysis_pkg/analysis_wf.py b/rabies/analysis_pkg/analysis_wf.py
@@ -16,8 +16,8 @@ def init_analysis_wf(opts, commonspace_cr=False, name="analysis_wf"):
         fields=['bold_file_list', 'commonspace_mask', 'token']), name='group_inputnode')
     outputnode = pe.Node(niu.IdentityInterface(fields=['group_ICA_dir', 'IC_file', 'dual_regression_timecourse_csv',
                                                        'DR_nii_file', 'matrix_data_file', 'matrix_fig', 'corr_map_file', 'seed_timecourse_csv', 'joined_corr_map_file', 'joined_seed_timecourse_csv',
-                                                       'sub_token', 'group_token','NPR_prior_timecourse_csv', 'NPR_extra_timecourse_csv',
-                                                       'NPR_prior_filename', 'NPR_extra_filename', 'NPR_optimize_report']), name='outputnode')
+                                                       'sub_token', 'group_token','CPCA_prior_timecourse_csv', 'CPCA_extra_timecourse_csv',
+                                                       'CPCA_prior_filename', 'CPCA_extra_filename', 'CPCA_optimize_report']), name='outputnode')
 
     # connect the nodes so that they exist even without running analysis
     workflow.connect([
@@ -116,38 +116,29 @@ def init_analysis_wf(opts, commonspace_cr=False, name="analysis_wf"):
                 ]),
             ])
 
-    if (opts.NPR_temporal_comp>-1) or (opts.NPR_spatial_comp>-1) or opts.optimize_NPR['apply']:
-        from .analysis_functions import NeuralPriorRecovery
+    if opts.CPCA['n']>-1:
+        from .analysis_functions import ComplementaryPCA
 
-        NPR_node = pe.Node(NeuralPriorRecovery(
-                            NPR_temporal_comp=opts.NPR_temporal_comp, 
-                            NPR_spatial_comp=opts.NPR_spatial_comp, 
-                            optimize_NPR_dict=opts.optimize_NPR, 
+        CPCA_node = pe.Node(ComplementaryPCA(
+                            CPCA_dict=opts.CPCA, 
                             prior_bold_idx = opts.prior_bold_idx,
                             network_weighting=opts.network_weighting,
                             figure_format=opts.figure_format),
-                            name='NPR_node', mem_gb=1*opts.scale_min_memory)
+                            name='CPCA_node', mem_gb=1*opts.scale_min_memory)
 
         workflow.connect([
-            (subject_inputnode, NPR_node, [
+            (subject_inputnode, CPCA_node, [
                 ("dict_file", "dict_file"),
                 ]),
-            (NPR_node, outputnode, [
-                ("NPR_prior_timecourse_csv", "NPR_prior_timecourse_csv"),
-                ("NPR_extra_timecourse_csv", "NPR_extra_timecourse_csv"),
-                ("NPR_prior_filename", "NPR_prior_filename"),
-                ("NPR_extra_filename", "NPR_extra_filename"),
+            (CPCA_node, outputnode, [
+                ("CPCA_prior_timecourse_csv", "CPCA_prior_timecourse_csv"),
+                ("CPCA_extra_timecourse_csv", "CPCA_extra_timecourse_csv"),
+                ("CPCA_prior_filename", "CPCA_prior_filename"),
+                ("CPCA_extra_filename", "CPCA_extra_filename"),
+                ("CPCA_report", "CPCA_optimize_report"),
                 ]),
             ])
 
-    if opts.optimize_NPR['apply']:
-        workflow.connect([
-            (NPR_node, outputnode, [
-                ("optimize_report", "NPR_optimize_report"),
-                ]),
-            ])
-
-
     if opts.FC_matrix:
         FC_matrix = pe.Node(Function(input_names=['dict_file', 'figure_format', 'roi_type'],
                                      output_names=['data_file', 'figname'],

diff --git a/rabies/analysis_pkg/cpca/__init__.py b/rabies/analysis_pkg/cpca/__init__.py