fix LFM 2 for 2.6B variant (#409)

adrgrondin · web-flow · commit 8775112da257 · 2025-10-13T13:40:18.000-07:00
diff --git a/Libraries/MLXLLM/Models/LFM2.swift b/Libraries/MLXLLM/Models/LFM2.swift
@@ -29,7 +29,20 @@ public struct LFM2Configuration: Codable, Sendable {
     let blockFFNDimMultiplier: Float
     let blockAutoAdjustFFDim: Bool
     private let _fullAttnIdxs: [Int]?
-    var fullAttnIdxs: [Int] { _fullAttnIdxs ?? Array(0 ..< hiddenLayers) }
+    private let layerTypes: [String]?
+    var fullAttnIdxs: [Int] {
+        if let fullAttnIdxs = _fullAttnIdxs {
+            return fullAttnIdxs
+        }
+
+        if let layerTypes {
+            return layerTypes.enumerated().compactMap { index, layerType in
+                layerType == "full_attention" ? index : nil
+            }
+        }
+
+        return Array(0 ..< hiddenLayers)
+    }
     let ropeTheta: Float
     var headDimensions: Int { hiddenSize / attentionHeads }
 
@@ -50,6 +63,7 @@ public struct LFM2Configuration: Codable, Sendable {
         case blockFFNDimMultiplier = "block_ffn_dim_multiplier"
         case blockAutoAdjustFFDim = "block_auto_adjust_ff_dim"
         case _fullAttnIdxs = "full_attn_idxs"
+        case layerTypes = "layer_types"
         case ropeTheta = "rope_theta"
     }
 
@@ -77,6 +91,7 @@ public struct LFM2Configuration: Codable, Sendable {
         self.blockAutoAdjustFFDim =
             try container.decodeIfPresent(Bool.self, forKey: .blockAutoAdjustFFDim) ?? true
         self._fullAttnIdxs = try container.decodeIfPresent([Int].self, forKey: ._fullAttnIdxs)
+        self.layerTypes = try container.decodeIfPresent([String].self, forKey: .layerTypes)
         self.ropeTheta = try container.decodeIfPresent(Float.self, forKey: .ropeTheta) ?? 1000000.0
     }
 }