SciML
diff --git a/‎Project.toml‎
Lines changed: 2 additions & 0 deletions b/‎Project.toml‎
Lines changed: 2 additions & 0 deletions
diff --git a/‎docs/src/examples/bruss.md‎
Lines changed: 11 additions & 7 deletions b/‎docs/src/examples/bruss.md‎
Lines changed: 11 additions & 7 deletions
diff --git a/‎docs/src/tutorials/lower_level_api.md‎
Lines changed: 8 additions & 4 deletions b/‎docs/src/tutorials/lower_level_api.md‎
Lines changed: 8 additions & 4 deletions
diff --git a/‎src/DiffEqGPU.jl‎
Lines changed: 4 additions & 0 deletions b/‎src/DiffEqGPU.jl‎
Lines changed: 4 additions & 0 deletions
diff --git a/‎src/dae_adapt.jl‎
Lines changed: 14 additions & 0 deletions b/‎src/dae_adapt.jl‎
Lines changed: 14 additions & 0 deletions
diff --git a/‎src/ensemblegpuarray/kernels.jl‎
Lines changed: 3 additions & 0 deletions b/‎src/ensemblegpuarray/kernels.jl‎
Lines changed: 3 additions & 0 deletions
diff --git a/‎src/ensemblegpukernel/integrators/integrator_utils.jl‎
Lines changed: 16 additions & 6 deletions b/‎src/ensemblegpukernel/integrators/integrator_utils.jl‎
Lines changed: 16 additions & 6 deletions
diff --git a/‎src/ensemblegpukernel/kernels.jl‎
Lines changed: 23 additions & 7 deletions b/‎src/ensemblegpukernel/kernels.jl‎
Lines changed: 23 additions & 7 deletions
diff --git a/‎src/ensemblegpukernel/linalg/linsolve.jl‎
Lines changed: 2 additions & 1 deletion b/‎src/ensemblegpukernel/linalg/linsolve.jl‎
Lines changed: 2 additions & 1 deletion
diff --git a/‎src/ensemblegpukernel/lowerlevel_solve.jl‎
Lines changed: 1 addition & 1 deletion b/‎src/ensemblegpukernel/lowerlevel_solve.jl‎
Lines changed: 1 addition & 1 deletion
@@ -20,6 +20,7 @@ RecursiveArrayTools = "731186ca-8d62-57ce-b412-fbd966d074cd"
 SciMLBase = "0bca4576-84f4-4d90-8ffe-ffa030f20462"
 Setfield = "efcf1570-3423-57d1-acb7-fd33fddbac46"
 SimpleDiffEq = "05bca326-078c-5bf0-a5bf-ce7c7982d7fd"
+SimpleNonlinearSolve = "727e6d20-b764-4bd8-a329-72de5adea6c7"
 StaticArrays = "90137ffa-7385-5640-81b9-e52037218182"
 TOML = "fa267f1f-6049-4f14-aa54-33bafae1ed76"
 ZygoteRules = "700de1a5-db45-46bc-99cf-38207098b444"
@@ -53,6 +54,7 @@ RecursiveArrayTools = "2, 3"
 SciMLBase = "2.92"
 Setfield = "1"
 SimpleDiffEq = "1"
+SimpleNonlinearSolve = "2"
 StaticArrays = "1"
 TOML = "1"
 ZygoteRules = "0.2"
 
@@ -19,10 +19,12 @@ kernel_u! = let N = N, xyd = xyd_brusselator, dx = step(xyd_brusselator)
         im1 = limit(i - 1, N)
         jp1 = limit(j + 1, N)
         jm1 = limit(j - 1, N)
-        du[II[i, j, 1]] = α * (u[II[im1, j, 1]] + u[II[ip1, j, 1]] + u[II[i, jp1, 1]] +
-                           u[II[i, jm1, 1]] - 4u[II[i, j, 1]]) +
-                          B + u[II[i, j, 1]]^2 * u[II[i, j, 2]] - (A + 1) * u[II[i, j, 1]] +
-                          brusselator_f(x, y, t)
+        du[II[i,
+            j,
+            1]] = α * (u[II[im1, j, 1]] + u[II[ip1, j, 1]] + u[II[i, jp1, 1]] +
+                   u[II[i, jm1, 1]] - 4u[II[i, j, 1]]) +
+                  B + u[II[i, j, 1]]^2 * u[II[i, j, 2]] - (A + 1) * u[II[i, j, 1]] +
+                  brusselator_f(x, y, t)
     end
 end
 kernel_v! = let N = N, xyd = xyd_brusselator, dx = step(xyd_brusselator)
@@ -32,9 +34,11 @@ kernel_v! = let N = N, xyd = xyd_brusselator, dx = step(xyd_brusselator)
         im1 = limit(i - 1, N)
         jp1 = limit(j + 1, N)
         jm1 = limit(j - 1, N)
-        du[II[i, j, 2]] = α * (u[II[im1, j, 2]] + u[II[ip1, j, 2]] + u[II[i, jp1, 2]] +
-                           u[II[i, jm1, 2]] - 4u[II[i, j, 2]]) +
-                          A * u[II[i, j, 1]] - u[II[i, j, 1]]^2 * u[II[i, j, 2]]
+        du[II[i,
+            j,
+            2]] = α * (u[II[im1, j, 2]] + u[II[ip1, j, 2]] + u[II[i, jp1, 2]] +
+                   u[II[i, jm1, 2]] - 4u[II[i, j, 2]]) +
+                  A * u[II[i, j, 1]] - u[II[i, j, 1]]^2 * u[II[i, j, 2]]
     end
 end
 brusselator_2d = let N = N, xyd = xyd_brusselator, dx = step(xyd_brusselator)
 
@@ -39,18 +39,22 @@ probs = cu(probs)
 ## Finally use the lower API for faster solves! (Fixed time-stepping)
 
 # Run once for compilation
-@time CUDA.@sync ts, us = DiffEqGPU.vectorized_solve(probs, prob, GPUTsit5();
+@time CUDA.@sync ts,
+us = DiffEqGPU.vectorized_solve(probs, prob, GPUTsit5();
     save_everystep = false, dt = 0.1f0)
 
-@time CUDA.@sync ts, us = DiffEqGPU.vectorized_solve(probs, prob, GPUTsit5();
+@time CUDA.@sync ts,
+us = DiffEqGPU.vectorized_solve(probs, prob, GPUTsit5();
     save_everystep = false, dt = 0.1f0)
 
 ## Adaptive time-stepping
 # Run once for compilation
-@time CUDA.@sync ts, us = DiffEqGPU.vectorized_asolve(probs, prob, GPUTsit5();
+@time CUDA.@sync ts,
+us = DiffEqGPU.vectorized_asolve(probs, prob, GPUTsit5();
     save_everystep = false, dt = 0.1f0)
 
-@time CUDA.@sync ts, us = DiffEqGPU.vectorized_asolve(probs, prob, GPUTsit5();
+@time CUDA.@sync ts,
+us = DiffEqGPU.vectorized_asolve(probs, prob, GPUTsit5();
     save_everystep = false, dt = 0.1f0)
 ```
 
 
@@ -14,6 +14,8 @@ using RecursiveArrayTools
 import ZygoteRules
 import Base.Threads
 using LinearSolve
+using SimpleNonlinearSolve
+import SimpleNonlinearSolve: SimpleTrustRegion
 #For gpu_tsit5
 using Adapt, SimpleDiffEq, StaticArrays
 using Parameters, MuladdMacro
@@ -51,6 +53,7 @@ include("ensemblegpukernel/integrators/stiff/interpolants.jl")
 include("ensemblegpukernel/integrators/nonstiff/interpolants.jl")
 include("ensemblegpukernel/nlsolve/type.jl")
 include("ensemblegpukernel/nlsolve/utils.jl")
+include("ensemblegpukernel/nlsolve/initialization.jl")
 include("ensemblegpukernel/kernels.jl")
 
 include("ensemblegpukernel/perform_step/gpu_tsit5_perform_step.jl")
@@ -71,6 +74,7 @@ include("ensemblegpukernel/tableaus/kvaerno_tableaus.jl")
 include("utils.jl")
 include("algorithms.jl")
 include("solve.jl")
+include("dae_adapt.jl")
 
 export EnsembleCPUArray, EnsembleGPUArray, EnsembleGPUKernel, LinSolveGPUSplitFactorize
 
 
@@ -0,0 +1,14 @@
+# Override SciMLBase adapt functions to allow DAEs for GPU kernels
+import SciMLBase: adapt_structure
+import Adapt
+
+# Allow DAE adaptation for GPU kernels
+function adapt_structure(to, f::SciMLBase.ODEFunction{iip}) where {iip}
+    # For GPU kernels, we now support DAEs with mass matrices and initialization
+    SciMLBase.ODEFunction{iip, SciMLBase.FullSpecialize}(
+        f.f,
+        jac = f.jac,
+        mass_matrix = f.mass_matrix,
+        initialization_data = f.initialization_data
+    )
+end
@@ -75,6 +75,7 @@ end
 
     @views @inbounds f(J[section, section], u[:, i + 1], p, t)
     @inbounds for j in section, k in section
+
         J[k, j] = J[k, j] * (tspan[2] - tspan[1])
     end
 end
@@ -94,6 +95,7 @@ end
     @views @inbounds x = f(u[:, i + 1], p, t)
 
     @inbounds for j in section, k in section
+
         J[k, j] = x[k, j] * (tspan[2] - tspan[1])
     end
 end
@@ -117,6 +119,7 @@ end
         @views @inbounds x = f(u[:, i + 1], p[i + 1], t)
     end
     @inbounds for j in section, k in section
+
         J[k, j] = x[k, j]
     end
 end
 
@@ -108,7 +108,8 @@ end
         saved_in_cb::Bool, callback::GPUDiscreteCallback,
         args...) where {AlgType <: GPUODEAlgorithm, IIP,
         S, T}
-    bool, saved_in_cb2 = apply_discrete_callback!(integrator, ts, us,
+    bool,
+    saved_in_cb2 = apply_discrete_callback!(integrator, ts, us,
         apply_discrete_callback!(integrator, ts,
             us, callback)...,
         args...)
@@ -243,14 +244,19 @@ end
     if !(continuous_callbacks isa Tuple{})
         event_occurred = false
 
-        time, upcrossing, event_occurred, event_idx, idx, counter = DiffEqBase.find_first_continuous_callback(
+        time, upcrossing,
+        event_occurred,
+        event_idx,
+        idx,
+        counter = DiffEqBase.find_first_continuous_callback(
             integrator,
             continuous_callbacks...)
 
         if event_occurred
             integrator.event_last_time = idx
             integrator.vector_event_last_time = event_idx
-            continuous_modified, saved_in_cb = apply_callback!(integrator,
+            continuous_modified,
+            saved_in_cb = apply_callback!(integrator,
                 continuous_callbacks[1],
                 time, upcrossing,
                 event_idx, ts, us)
@@ -260,7 +266,8 @@ end
         end
     end
     if !(discrete_callbacks isa Tuple{})
-        discrete_modified, saved_in_cb = apply_discrete_callback!(integrator, ts, us,
+        discrete_modified,
+        saved_in_cb = apply_discrete_callback!(integrator, ts, us,
             discrete_callbacks...)
         return discrete_modified, saved_in_cb
     end
@@ -278,7 +285,10 @@ end
         callback::DiffEqGPU.GPUContinuousCallback,
         counter) where {AlgType <: GPUODEAlgorithm,
         IIP, S, T}
-    event_occurred, interp_index, prev_sign, prev_sign_index, event_idx = DiffEqBase.determine_event_occurrence(
+    event_occurred, interp_index,
+    prev_sign,
+    prev_sign_index,
+    event_idx = DiffEqBase.determine_event_occurrence(
         integrator,
         callback,
         counter)
@@ -360,7 +370,7 @@ end
 end
 
 # interp_points = 0 or equivalently nothing
-@inline function DiffEqBase.determine_event_occurrence(
+@inline function DiffEqBase.determine_event_occurance(
         integrator::DiffEqBase.AbstractODEIntegrator{
             AlgType,
             IIP,
 
@@ -15,10 +15,18 @@
 
     saveat = _saveat === nothing ? saveat : _saveat
 
-    integ = init(alg, prob.f, false, prob.u0, prob.tspan[1], dt, prob.p, tstops,
-        callback, save_everystep, saveat)
+    # Check if initialization is needed for DAEs
+    u0, p_init,
+    init_success = if SciMLBase.has_initialization_data(prob.f)
+        # Perform initialization using SimpleNonlinearSolve compatible algorithm
+        gpu_initialization_solve(prob, SimpleTrustRegion(), 1e-6, 1e-6)
+    else
+        prob.u0, prob.p, true
+    end
 
-    u0 = prob.u0
+    # Use initialized values
+    integ = init(alg, prob.f, false, u0, prob.tspan[1], dt, p_init, tstops,
+        callback, save_everystep, saveat)
     tspan = prob.tspan
 
     integ.cur_t = 0
@@ -68,16 +76,24 @@ end
 
     saveat = _saveat === nothing ? saveat : _saveat
 
-    u0 = prob.u0
+    # Check if initialization is needed for DAEs
+    u0, p_init,
+    init_success = if SciMLBase.has_initialization_data(prob.f)
+        # Perform initialization using SimpleNonlinearSolve compatible algorithm
+        gpu_initialization_solve(prob, SimpleTrustRegion(), abstol, reltol)
+    else
+        prob.u0, prob.p, true
+    end
+
     tspan = prob.tspan
     f = prob.f
-    p = prob.p
+    p = p_init
 
     t = tspan[1]
     tf = prob.tspan[2]
 
-    integ = init(alg, prob.f, false, prob.u0, prob.tspan[1], prob.tspan[2], dt,
-        prob.p,
+    integ = init(alg, prob.f, false, u0, prob.tspan[1], prob.tspan[2], dt,
+        p,
         abstol, reltol, DiffEqBase.ODE_DEFAULT_NORM, tstops, callback,
         saveat)
 
 
@@ -53,7 +53,8 @@ for Sa in [(2, 2), (3, 3)]  # not needed for Sa = (1, 1);
                 # This if block can be removed when https://github.com/JuliaArrays/StaticArrays.jl/pull/749 is merged.
                 c = similar(b, T)
                 for col in 1:Sb[2]
-                    @inbounds c[:, col] = _linear_solve(Size($Sa),
+                    @inbounds c[
+                        :, col] = _linear_solve(Size($Sa),
                         Size($Sa[1]),
                         a,
                         b[:, col])
 
@@ -1,6 +1,6 @@
 """
 ```julia
-vectorized_solve(probs, prob::Union{ODEProblem, SDEProblem}alg;
+vectorized_solve(probs, prob::Union{ODEProblem, SDEProblem}, alg;
     dt, saveat = nothing,
     save_everystep = true,
     debug = false, callback = CallbackSet(nothing), tstops = nothing)