Update train_a_generative_llm.py

david-thrower · web-flow · commit 93039092c04a · 2026-01-01T00:00:18.000-05:00
Replace stage 1-a perplexity with its sparse analogue.
diff --git a/train_a_generative_llm.py b/train_a_generative_llm.py
@@ -21,7 +21,7 @@
 from cerebrosllmutils.llm_utils import (
     prepare_data,
     InterleavedRoPE,
-    Perplexity,
+    SparsePerplexity,
     GatedMergeLayer,
     ChunkedAttentionBlock,
     MambaBlock,
@@ -409,7 +409,7 @@
 meta_trial_number = 42  # irrelevant unless in distributed training
 
 # Custom metric: Perplexity:
-perplexity_metric = Perplexity()
+sparse_perplexity_metric = SparsePerplexity
 
 cerebros_automl = SimpleCerebrosRandomSearch(
     unit_type=DenseUnit,
@@ -447,7 +447,7 @@
     learning_rate=learning_rate,
     loss=tf.keras.losses.CategoricalCrossentropy(from_logits=True),
     metrics=[tf.keras.metrics.SparseCategoricalAccuracy(),
-             perplexity_metric, # Need to fix... 
+             sparse_perplexity_metric, 
              # tf.keras.metrics.Accuracy()
              ],
     epochs=epochs,