Make notation consistent with manuscript

mfasi · mfasi · commit d47a676dfe9f · 2025-03-30T15:21:54.000+01:00
diff --git a/include/gemmi.hpp b/include/gemmi.hpp
@@ -212,9 +212,9 @@ void computeExactIntegerGEMM(const MatrixSplit<splitint_t, fp_t> &A,
                              size_t iBlock, size_t jBlock) {
     for (size_t i = 0; i < A.m; i++) {
         for (size_t j = 0; j < B.n; j++) {
-            for (size_t k = 0; k < A.n; k++) {
-                C[i + j * A.m] += A.memory[i + k * A.m + iBlock * A.m * A.n] *
-                                  B.memory[k + j * B.m + jBlock * B.m * B.n];
+            for (size_t ell = 0; ell < A.n; ell++) {
+                C[i + j * A.m] += A.memory[i + ell * A.m + iBlock * A.m * A.n] *
+                                  B.memory[ell + j * B.m + jBlock * B.m * B.n];
             }
         }
     }
@@ -312,13 +312,13 @@ std::vector<fp_t> computeProductsWithIntegerAccumulation(const MatrixSplit<split
 }
 
 /* Compute matrix vector product C += A * B, where:
- *   + A is m x p
- *   + B is p x n
+ *   + A is m x k
+ *   + B is k x n
  *   + C is m x n
  */
 template <typename fp_t, typename splitint_t, typename accumulator_t>
 std::vector<fp_t> gemmi (const std::vector<fp_t> &A, const std::vector<fp_t> &B,
-                         const size_t m, const size_t p, const size_t n,
+                         const size_t m, const size_t k, const size_t n,
                          const size_t numSplitsA, const size_t numSplitsB,
                          const splittingStrategy splitType = splittingStrategy::roundToNearest,
                          const multiplicationStrategy multType = multiplicationStrategy::reduced,
@@ -330,8 +330,8 @@ std::vector<fp_t> gemmi (const std::vector<fp_t> &A, const std::vector<fp_t> &B,
     const size_t alpha = std::floor((bitsInAccumulator - log2(n)) / 2);
     const size_t bitsPerSlice = std::min(bitsPerInteger, static_cast<size_t>(alpha));
 
-    auto splitA = MatrixSplit<splitint_t, fp_t>(A, m, p, splitType, numSplitsA, bitsPerSlice, normalisationDimension::byRows);
-    auto splitB = MatrixSplit<splitint_t, fp_t>(B, p, n, splitType, numSplitsB, bitsPerSlice, normalisationDimension::byCols);
+    auto splitA = MatrixSplit<splitint_t, fp_t>(A, m, k, splitType, numSplitsA, bitsPerSlice, normalisationDimension::byRows);
+    auto splitB = MatrixSplit<splitint_t, fp_t>(B, k, n, splitType, numSplitsB, bitsPerSlice, normalisationDimension::byCols);
 
     size_t numDiagonals;
     switch (multType) {
@@ -361,6 +361,6 @@ std::vector<fp_t> gemmi (const std::vector<fp_t> &A, const std::vector<fp_t> &B,
 
 template <typename fp_t, typename splitint_t, typename accumulator_t>
 std::vector<fp_t> gemmi (const std::vector<fp_t> &A, const std::vector<fp_t> &B,
-                         const size_t m, const size_t p, const size_t n, const size_t numSplits) {
-    return gemmi <fp_t, splitint_t, accumulator_t> (A, B, m, p, n, numSplits, numSplits);
+                         const size_t m, const size_t k, const size_t n, const size_t numSplits) {
+    return gemmi <fp_t, splitint_t, accumulator_t> (A, B, m, k, n, numSplits, numSplits);
 }
diff --git a/tests/tests.cpp b/tests/tests.cpp
@@ -19,10 +19,10 @@ void runTest() {
                 for (size_t numSplitA : { 1, 2, 10 }) {
                     for (size_t numSplitB : { 1, 2, 10 }) {
                         for (size_t m = 10; m <= 50; m += 10) {
-                            for (size_t p = 10; p <= 50; p += 10) {
+                            for (size_t k = 10; k <= 50; k += 10) {
                                 for (size_t n = 10; n <= 50; n += 10) {
-                                    std::vector<fp_t> A(m * p);
-                                    std::vector<fp_t> B(p * n);
+                                    std::vector<fp_t> A(m * k);
+                                    std::vector<fp_t> B(k * n);
 
                                     // Initalize matrix with random values.
                                     std::default_random_engine generator(std::random_device{}());
@@ -32,8 +32,8 @@ void runTest() {
                                     for (auto & element : B)
                                         element = numSplitB < 10 ? ldexp(1.0, 2 * numSplitB) - 1 : distribution(generator);
 
-                                    auto C = gemmi<fp_t, int8_t, int32_t>(A, B, m, p, n, numSplitA, numSplitB, splitType, multiplicationType, accumulationType);
-                                    auto C_ref = reference_gemm(A, B, m, p, n);
+                                    auto C = gemmi<fp_t, int8_t, int32_t>(A, B, m, k, n, numSplitA, numSplitB, splitType, multiplicationType, accumulationType);
+                                    auto C_ref = reference_gemm(A, B, m, k, n);
 
                                     double relative_error = frobenius_norm<fp_t, double>(C - C_ref) / frobenius_norm<fp_t, double>(C);