Remove typo in PC (#308)

edyoshikun · web-flow · commit 29b7247bc2bb · 2025-09-19T13:35:23.000-07:00
* removing the A in 'PCA' for when we save the embeddings.

* renaming pc from pca
diff --git a/applications/contrastive_phenotyping/evaluation/imagenet_pretrained_features.py b/applications/contrastive_phenotyping/evaluation/imagenet_pretrained_features.py
@@ -1,16 +1,17 @@
 """Use pre-trained ImageNet models to extract features from images."""
 
 # %%
+from pathlib import Path
+
+import numpy as np
 import pandas as pd
 import seaborn as sns
 import timm
-import numpy as np
 import torch
 from sklearn.decomposition import PCA
+from sklearn.linear_model import LogisticRegression
 from sklearn.preprocessing import StandardScaler
 from tqdm import tqdm
-from pathlib import Path
-from sklearn.linear_model import LogisticRegression
 
 from viscy.data.triplet import TripletDataModule
 from viscy.transforms import ScaleIntensityRangePercentilesd
@@ -62,7 +63,7 @@
     tracks[f"feature_{i}"] = feature
 # add pca features to dataframe naming each column with pca_i
 for i, feature in enumerate(pca_features.T):
-    tracks[f"pca_{i}"] = feature
+    tracks[f"pc_{i}"] = feature
 
 # # save the dataframe as csv
 # tracks.to_csv("/hpc/projects/comp.micro/infected_cell_imaging/Single_cell_phenotyping/ContrastiveLearning/code/ALFI/imagenet_pretrained_features.csv", index=False)
@@ -83,13 +84,13 @@
 
 # %%
 ax = sns.scatterplot(
-    x=tracks["pca_0"],
-    y=tracks["pca_1"],
+    x=tracks["pc_0"],
+    y=tracks["pc_1"],
     hue=tracks["division"],
     legend="full",
 )
-ax.set_xlabel("PCA1")
-ax.set_ylabel("PCA2")
+ax.set_xlabel("PC1")
+ax.set_ylabel("PC2")
 
 # %% compute the accuracy of the model using a linear classifier
 
@@ -117,8 +118,8 @@
         "id",
         "parent_id",
         "parent_track_id",
-        "pca_0",
-        "pca_1",
+        "pc_0",
+        "pc_1",
     ]
 )
 y_train = data_train_val["division"]
@@ -137,8 +138,8 @@
         "id",
         "parent_id",
         "parent_track_id",
-        "pca_0",
-        "pca_1",
+        "pc_0",
+        "pc_1",
     ]
 )
 y_test = data_test["division"]
diff --git a/viscy/representation/embedding_writer.py b/viscy/representation/embedding_writer.py
@@ -159,7 +159,7 @@ def write_embedding_dataset(
             _logger.debug("Computing PCA")
             PCA_features, _ = compute_pca(features, **pca_kwargs)
             for i in range(PCA_features.shape[1]):
-                ultrack_indices[f"PCA{i + 1}"] = PCA_features[:, i]
+                ultrack_indices[f"PC{i + 1}"] = PCA_features[:, i]
         except Exception as e:
             _logger.warning(f"PCA computation failed: {str(e)}")
 
diff --git a/viscy/representation/evaluation/dimensionality_reduction.py b/viscy/representation/evaluation/dimensionality_reduction.py
@@ -122,7 +122,7 @@ def compute_pca(embedding_dataset, n_components=None, normalize_features=True):
 
     # Add PCA components for features
     for i in range(pc_features.shape[1]):
-        pca_dict[f"PCA{i + 1}"] = pc_features[:, i]
+        pca_dict[f"PC{i + 1}"] = pc_features[:, i]
 
     # Create DataFrame with all components
     pca_df = pd.DataFrame(pca_dict)
diff --git a/viscy/representation/evaluation/visualization.py b/viscy/representation/evaluation/visualization.py
@@ -112,15 +112,15 @@ def _prepare_data(self):
         dim_options = []
 
         # Check for PCA and compute if needed
-        if not any(col.startswith("PCA") for col in self.features_df.columns):
+        if not any(col.startswith("PC") for col in self.features_df.columns):
             # PCA transformation
             scaled_features = StandardScaler().fit_transform(features.values)
             pca = PCA(n_components=self.num_PC_components)
             pca_coords = pca.fit_transform(scaled_features)
 
             # Add PCA coordinates to the features dataframe
             for i in range(self.num_PC_components):
-                self.features_df[f"PCA{i + 1}"] = pca_coords[:, i]
+                self.features_df[f"PC{i + 1}"] = pca_coords[:, i]
 
             # Store explained variance for PCA
             self.pca_explained_variance = [
@@ -130,8 +130,8 @@ def _prepare_data(self):
 
             # Add PCA options
             for i, pc_label in enumerate(self.pca_explained_variance):
-                dim_options.append({"label": pc_label, "value": f"PCA{i + 1}"})
-                existing_dims.append(f"PCA{i + 1}")
+                dim_options.append({"label": pc_label, "value": f"PC{i + 1}"})
+                existing_dims.append(f"PC{i + 1}")
 
         # Check for UMAP coordinates
         umap_dims = [col for col in self.features_df.columns if col.startswith("UMAP")]
@@ -153,8 +153,8 @@ def _prepare_data(self):
         self.dim_options = dim_options
 
         # Set default x and y axes based on available dimensions
-        self.default_x = existing_dims[0] if existing_dims else "PCA1"
-        self.default_y = existing_dims[1] if len(existing_dims) > 1 else "PCA2"
+        self.default_x = existing_dims[0] if existing_dims else "PC1"
+        self.default_y = existing_dims[1] if len(existing_dims) > 1 else "PC2"
 
         # Process each FOV and its track IDs
         all_filtered_features = []