Add JNI wrapper for saving training parameters as PTD

georgehong · georgehong · commit 1d81b4b95fd4 · 2025-07-13T01:35:59.000-07:00
Also makes adjustments for serialize.h utility to be visible for JNI.
diff --git a/extension/android/CMakeLists.txt b/extension/android/CMakeLists.txt
@@ -147,7 +147,7 @@ endif()
 
 if(EXECUTORCH_BUILD_EXTENSION_TRAINING)
   target_sources(executorch_jni PRIVATE jni/jni_layer_training.cpp jni/log.cpp)
-  list(APPEND link_libraries extension_training)
+  list(APPEND link_libraries extension_training extension_flat_tensor_serialize)
   target_compile_definitions(executorch_jni PUBLIC EXECUTORCH_BUILD_EXTENSION_TRAINING=1)
 endif()
 
diff --git a/extension/android/executorch_android/src/androidTest/java/org/pytorch/executorch/TrainingModuleE2ETest.kt b/extension/android/executorch_android/src/androidTest/java/org/pytorch/executorch/TrainingModuleE2ETest.kt
@@ -11,17 +11,18 @@ import android.Manifest
 import android.util.Log
 import androidx.test.ext.junit.runners.AndroidJUnit4
 import androidx.test.rule.GrantPermissionRule
+import java.io.ByteArrayInputStream
 import java.io.File
 import java.io.IOException
 import java.net.URISyntaxException
+import kotlin.random.Random
+import kotlin.test.assertContains
 import org.apache.commons.io.FileUtils
 import org.junit.Assert
 import org.junit.Rule
 import org.junit.Test
 import org.junit.runner.RunWith
 import org.pytorch.executorch.TestFileUtils.getTestFilePath
-import kotlin.random.Random
-import kotlin.test.assertContains
 
 /** Unit tests for [TrainingModule]. */
 @RunWith(AndroidJUnit4::class)
@@ -55,27 +56,29 @@ class TrainingModuleE2ETest {
         assertContains(params, LIN2_WEIGHT)
         assertContains(params, LIN2_BIAS)
 
-        val sgd = SGD.create(params, 0.5);
-        val dataset = listOf<Tensor>(
-            Tensor.fromBlob(floatArrayOf(1.0f, 1.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
-            Tensor.fromBlob(floatArrayOf(0.0f, 0.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
-            Tensor.fromBlob(floatArrayOf(1.0f, 0.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
-            Tensor.fromBlob(floatArrayOf(0.0f, 1.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
-        )
+        val sgd = SGD.create(params, 0.5)
+        val dataset =
+            listOf<Tensor>(
+                Tensor.fromBlob(floatArrayOf(1.0f, 1.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
+                Tensor.fromBlob(floatArrayOf(0.0f, 0.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
+                Tensor.fromBlob(floatArrayOf(1.0f, 0.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
+                Tensor.fromBlob(floatArrayOf(0.0f, 1.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
+            )
 
-        val numEpochs = 5000;
+        val numEpochs = 5000
         var finalLoss = Float.MAX_VALUE
 
         for (i in 0 until numEpochs) {
             val inputDex = 2 * Random.nextInt(dataset.size / 2)
             val targetDex = inputDex + 1
             val input = dataset.get(inputDex)
             val target = dataset.get(targetDex)
-            val out = module.executeForwardBackward("forward", EValue.from(input), EValue.from(target))
+            val out =
+                module.executeForwardBackward("forward", EValue.from(input), EValue.from(target))
             val gradients = module.namedGradients("forward")
 
             if (i == 0) {
@@ -96,7 +99,9 @@ class TrainingModuleE2ETest {
                         input.getDataAsFloatArray()[0],
                         input.getDataAsFloatArray()[1],
                         out[1].toTensor().getDataAsLongArray()[0],
-                        target.getDataAsLongArray()[0]));
+                        target.getDataAsLongArray()[0],
+                    ),
+                )
             }
 
             sgd.step(gradients)
@@ -106,6 +111,34 @@ class TrainingModuleE2ETest {
             }
         }
         Assert.assertTrue(finalLoss < 0.1f)
+
+        // Check training performance continuity when exporting and loading from PTD checkpoint.
+        val checkpoint = module.exportWeights("forward")
+        val bytes = ByteArray(checkpoint.remaining())
+        checkpoint.duplicate().get(bytes)
+
+        val ptdCheckpointFilePath = "/xor_checkpoint.ptd"
+        val ptdCheckpointFile = File(getTestFilePath(ptdCheckpointFilePath))
+        val checkpointInputStream = ByteArrayInputStream(bytes)
+        FileUtils.copyInputStreamToFile(checkpointInputStream, ptdCheckpointFile)
+        checkpointInputStream.close()
+
+        val trainedModule =
+            TrainingModule.load(
+                getTestFilePath(pteFilePath),
+                getTestFilePath(ptdCheckpointFilePath),
+            )
+        for (inputDex in 0..(dataset.size - 1) step 2) {
+            val targetDex = inputDex + 1
+            val out =
+                trainedModule.executeForwardBackward(
+                    "forward",
+                    EValue.from(dataset.get(inputDex)),
+                    EValue.from(dataset.get(targetDex)),
+                )
+            val outLoss = out[0].toTensor().dataAsFloatArray[0]
+            Assert.assertTrue(outLoss < 0.1f)
+        }
     }
 
     @Test
@@ -118,7 +151,7 @@ class TrainingModuleE2ETest {
         FileUtils.copyInputStreamToFile(pteInputStream, pteFile)
         pteInputStream.close()
 
-        val module = TrainingModule.load(getTestFilePath(pteFilePath));
+        val module = TrainingModule.load(getTestFilePath(pteFilePath))
         val params = module.namedParameters("forward")
 
         Assert.assertEquals(4, params.size)
@@ -127,27 +160,29 @@ class TrainingModuleE2ETest {
         assertContains(params, LIN2_WEIGHT)
         assertContains(params, LIN2_BIAS)
 
-        val sgd = SGD.create(params, 0.5);
-        val dataset = listOf<Tensor>(
-            Tensor.fromBlob(floatArrayOf(1.0f, 1.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
-            Tensor.fromBlob(floatArrayOf(0.0f, 0.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
-            Tensor.fromBlob(floatArrayOf(1.0f, 0.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
-            Tensor.fromBlob(floatArrayOf(0.0f, 1.0f), longArrayOf(1, 2)),
-            Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
-        )
+        val sgd = SGD.create(params, 0.5)
+        val dataset =
+            listOf<Tensor>(
+                Tensor.fromBlob(floatArrayOf(1.0f, 1.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
+                Tensor.fromBlob(floatArrayOf(0.0f, 0.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(0), longArrayOf(1)),
+                Tensor.fromBlob(floatArrayOf(1.0f, 0.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
+                Tensor.fromBlob(floatArrayOf(0.0f, 1.0f), longArrayOf(1, 2)),
+                Tensor.fromBlob(longArrayOf(1), longArrayOf(1)),
+            )
 
-        val numEpochs = 5000;
+        val numEpochs = 5000
         var finalLoss = Float.MAX_VALUE
 
         for (i in 0 until numEpochs) {
             val inputDex = 2 * Random.nextInt(dataset.size / 2)
             val targetDex = inputDex + 1
             val input = dataset.get(inputDex)
             val target = dataset.get(targetDex)
-            val out = module.executeForwardBackward("forward", EValue.from(input), EValue.from(target))
+            val out =
+                module.executeForwardBackward("forward", EValue.from(input), EValue.from(target))
             val gradients = module.namedGradients("forward")
 
             if (i == 0) {
@@ -168,7 +203,9 @@ class TrainingModuleE2ETest {
                         input.getDataAsFloatArray()[0],
                         input.getDataAsFloatArray()[1],
                         out[1].toTensor().getDataAsLongArray()[0],
-                        target.getDataAsLongArray()[0]));
+                        target.getDataAsLongArray()[0],
+                    ),
+                )
             }
 
             sgd.step(gradients)
@@ -183,25 +220,33 @@ class TrainingModuleE2ETest {
     @Test
     @Throws(IOException::class)
     fun testMissingPteFile() {
-        val exception = Assert.assertThrows(RuntimeException::class.java) {
-            TrainingModule.load(getTestFilePath(MISSING_PTE_NAME))
-        }
-        Assert.assertEquals(exception.message, "Cannot load model path!! " + getTestFilePath(MISSING_PTE_NAME))
+        val exception =
+            Assert.assertThrows(RuntimeException::class.java) {
+                TrainingModule.load(getTestFilePath(MISSING_PTE_NAME))
+            }
+        Assert.assertEquals(
+            exception.message,
+            "Cannot load model path!! " + getTestFilePath(MISSING_PTE_NAME),
+        )
     }
 
     @Test
     @Throws(IOException::class)
     fun testMissingPtdFile() {
-        val exception = Assert.assertThrows(RuntimeException::class.java) {
-            val pteFilePath = "/xor.pte"
-            val pteFile = File(getTestFilePath(pteFilePath))
-            val pteInputStream = javaClass.getResourceAsStream(pteFilePath)
-            FileUtils.copyInputStreamToFile(pteInputStream, pteFile)
-            pteInputStream.close()
-
-            TrainingModule.load(getTestFilePath(pteFilePath), getTestFilePath(MISSING_PTD_NAME))
-        }
-        Assert.assertEquals(exception.message, "Cannot load data path!! " + getTestFilePath(MISSING_PTD_NAME))
+        val exception =
+            Assert.assertThrows(RuntimeException::class.java) {
+                val pteFilePath = "/xor.pte"
+                val pteFile = File(getTestFilePath(pteFilePath))
+                val pteInputStream = javaClass.getResourceAsStream(pteFilePath)
+                FileUtils.copyInputStreamToFile(pteInputStream, pteFile)
+                pteInputStream.close()
+
+                TrainingModule.load(getTestFilePath(pteFilePath), getTestFilePath(MISSING_PTD_NAME))
+            }
+        Assert.assertEquals(
+            exception.message,
+            "Cannot load data path!! " + getTestFilePath(MISSING_PTD_NAME),
+        )
     }
 
     companion object {
diff --git a/extension/android/executorch_android/src/main/java/org/pytorch/executorch/TrainingModule.java b/extension/android/executorch_android/src/main/java/org/pytorch/executorch/TrainingModule.java
@@ -14,6 +14,7 @@
 import com.facebook.soloader.nativeloader.NativeLoader;
 import com.facebook.soloader.nativeloader.SystemDelegate;
 import java.io.File;
+import java.nio.ByteBuffer;
 import java.util.HashMap;
 import java.util.Map;
 import org.pytorch.executorch.annotations.Experimental;
@@ -114,6 +115,22 @@ public Map<String, Tensor> namedGradients(String methodName) {
     return namedGradientsNative(methodName);
   }
 
-  @DoNotStrip
   private native Map<String, Tensor> namedGradientsNative(String methodName);
+
+  /**
+   * Exports the parameters of the specified method as a buffer that can be saved as a PTD file.
+   *
+   * @param methodName name of the ExecuTorch module method to export weights from.
+   * @return buffer that contains the weights of the specified method
+   */
+  public ByteBuffer exportWeights(String methodName) {
+    if (!mHybridData.isValid()) {
+      Log.e("ExecuTorch", "Attempt to use a destroyed module");
+      return ByteBuffer.allocateDirect(0);
+    }
+    return exportWeightsNative(methodName);
+  }
+
+  @DoNotStrip
+  private native ByteBuffer exportWeightsNative(String methodName);
 }
diff --git a/extension/android/jni/BUCK b/extension/android/jni/BUCK
@@ -118,6 +118,7 @@ non_fbcode_target(_kind = fb_android_cxx_library,
         "//xplat/executorch/backends/xnnpack:xnnpack_backend_static",
         "//xplat/executorch/examples/models/llama/runner:runner_static",
         "//xplat/executorch/examples/models/llava/runner:runner_static",
+        "//xplat/executorch/extension/flat_tensor/serialize:serialize_static",
         "//xplat/executorch/extension/module:module_static",
         "//xplat/executorch/extension/runner_util:inputs_static",
         "//xplat/executorch/extension/tensor:tensor_static",
diff --git a/extension/android/jni/jni_layer_training.cpp b/extension/android/jni/jni_layer_training.cpp
@@ -9,6 +9,7 @@
 #include <executorch/extension/android/jni/jni_layer_constants.h>
 #include <executorch/extension/android/jni/log.h>
 #include <executorch/extension/data_loader/file_data_loader.h>
+#include <executorch/extension/flat_tensor/serialize/serialize.h>
 #include <executorch/extension/tensor/tensor.h>
 #include <executorch/extension/training/module/training_module.h>
 #include <executorch/extension/training/optimizer/sgd.h>
@@ -210,6 +211,37 @@ class ExecuTorchTrainingJni
     return gradients;
   }
 
+  facebook::jni::local_ref<facebook::jni::JByteBuffer> exportWeights(
+      facebook::jni::alias_ref<jstring> methodName) {
+    auto method = methodName->toStdString();
+    auto result = module_->named_parameters(method);
+    if (!result.ok()) {
+      facebook::jni::throwNewJavaException(
+          "java/lang/Exception",
+          "Getting named parameters for method %s failed with status 0x%" PRIx32,
+          method.c_str(),
+          static_cast<error_code_t>(result.error()));
+    }
+    std::map<std::string, executorch::aten::Tensor> tensorMap;
+    for (auto& [layer, tensor] : result.get()) {
+      tensorMap.emplace(std::string(layer), tensor);
+    }
+    std::ostringstream oss;
+    auto saveError = executorch::extension::flat_tensor::save_ptd(
+        oss, tensorMap, 16 /* tensor_alignment */);
+
+    if (saveError != executorch::runtime::Error::Ok) {
+      facebook::jni::throwNewJavaException(
+          "java/lang/Exception",
+          "Saving parameters for method %s failed with status 0x%" PRIx32,
+          method.c_str(),
+          static_cast<error_code_t>(saveError));
+    }
+    std::string exportedWeights = oss.str();
+    return facebook::jni::JByteBuffer::wrapBytes(
+        (uint8_t*)exportedWeights.data(), exportedWeights.size());
+  }
+
   static void registerNatives() {
     registerHybrid({
         makeNativeMethod("initHybrid", ExecuTorchTrainingJni::initHybrid),
@@ -220,6 +252,8 @@ class ExecuTorchTrainingJni
             "namedParametersNative", ExecuTorchTrainingJni::namedParameters),
         makeNativeMethod(
             "namedGradientsNative", ExecuTorchTrainingJni::namedGradients),
+        makeNativeMethod(
+            "exportWeightsNative", ExecuTorchTrainingJni::exportWeights),
     });
   }
 };
diff --git a/extension/flat_tensor/serialize/CMakeLists.txt b/extension/flat_tensor/serialize/CMakeLists.txt
@@ -63,3 +63,12 @@ generate_flat_tensor_schema("${scalar_type_schema_srcs}" "scalar_type_schema")
 set(flat_tensor_schema_srcs flat_tensor.fbs)
 generate_flat_tensor_schema("${flat_tensor_schema_srcs}" "flat_tensor_schema")
 add_dependencies(flat_tensor_schema scalar_type_schema)
+
+add_library(extension_flat_tensor_serialize serialize.cpp)
+target_include_directories(
+  extension_flat_tensor_serialize
+  PRIVATE ${_common_include_directories}
+          ${TORCH_INCLUDE_DIRS})
+target_link_libraries(extension_flat_tensor_serialize
+  PRIVATE flat_tensor_schema
+)