fix addsteps

oscarddssmith · oscarddssmith · commit 1938d52475ad · 2024-08-14T15:46:55.000-04:00
diff --git a/lib/OrdinaryDiffEqRosenbrock/src/rosenbrock_perform_step.jl b/lib/OrdinaryDiffEqRosenbrock/src/rosenbrock_perform_step.jl
@@ -68,7 +68,7 @@ end
     @.. veck₁ = vecu * neginvdtγ
     integrator.stats.nsolve += 1
 
-    @.. broadcast=false u=uprev + dto2 * k₁
+    @.. u=uprev + dto2 * k₁
     stage_limiter!(u, integrator, p, t + dto2)
     f(f₁, u, p, t + dto2)
     integrator.stats.nf += 1
@@ -79,17 +79,16 @@ end
         mul!(_vec(tmp), mass_matrix, _vec(k₁))
     end
 
-    @.. broadcast=false linsolve_tmp=f₁ - tmp
+    @.. linsolve_tmp = f₁ - tmp
 
     linres = dolinsolve(integrator, linres.cache; b = _vec(linsolve_tmp))
     vecu = _vec(linres.u)
-    veck2 = _vec(k₂)
+    veck₂ = _vec(k₂)
 
-    @.. veck2 = vecu * neginvdtγ
+    @.. veck₂ = vecu * neginvdtγ + veck₁
     integrator.stats.nsolve += 1
 
-    @.. broadcast=false k₂+=k₁
-    @.. broadcast=false u=uprev + dt * k₂
+    @.. u = uprev + dt * k₂
     stage_limiter!(u, integrator, p, t + dt)
     step_limiter!(u, integrator, p, t + dt)
 
@@ -196,13 +195,12 @@ end
 
     linres = dolinsolve(integrator, linres.cache; b = _vec(linsolve_tmp))
     vecu = _vec(linres.u)
-    veck2 = _vec(k₂)
+    veck₂ = _vec(k₂)
 
-    @.. veck2 = vecu * neginvdtγ
+    @.. veck₂ = vecu * neginvdtγ + veck₁
     integrator.stats.nsolve += 1
 
-    @.. broadcast=false k₂+=k₁
-    @.. broadcast=false tmp=uprev + dt * k₂
+    @.. tmp = uprev + dt * k₂
     stage_limiter!(u, integrator, p, t + dt)
     f(fsallast, tmp, p, t + dt)
     integrator.stats.nf += 1
diff --git a/lib/OrdinaryDiffEqRosenbrock/src/stiff_addsteps.jl b/lib/OrdinaryDiffEqRosenbrock/src/stiff_addsteps.jl
@@ -6,6 +6,7 @@ function _ode_addsteps!(k, t, uprev, u, dt, f, p,
     if length(k) < 2 || always_calc_begin
         @unpack tf, uf, d = cache
         dtγ = dt * d
+        neginvdtγ = -inv(dtγ)
         dto2 = dt / 2
         tf.u = uprev
         if cache.autodiff isa AutoForwardDiff
@@ -17,16 +18,25 @@ function _ode_addsteps!(k, t, uprev, u, dt, f, p,
         mass_matrix = f.mass_matrix
         if uprev isa Number
             J = ForwardDiff.derivative(uf, uprev)
-            W = 1 - dtγ * J
+            W = neginvdtγ .+ J
         else
             J = ForwardDiff.jacobian(uf, uprev)
-            W = mass_matrix - dtγ * J
+            if mass_matrix isa UniformScaling
+                W = neginvdtγ*mass_matrix + J
+            else
+                W = @.. neginvdtγ*mass_matrix .+ J
+            end
         end
         f₀ = f(uprev, p, t)
-        k₁ = W \ (@.. f₀ + dtγ * dT)
+        k₁ = _reshape(W \ _vec((f₀ + dtγ * dT)), axes(uprev)) * neginvdtγ
         tmp = @.. uprev + dto2 * k₁
         f₁ = f(tmp, p, t + dto2)
-        k₂ = (W \ (f₁ - k₁)) + k₁
+        if mass_matrix === I
+            k₂ = _reshape(W \ _vec(f₁ - k₁), axes(uprev))
+        else
+            k₂ = _reshape(W \ _vec(f₁ - mass_matrix * k₁), axes(uprev))
+        end
+        k₂ = @.. k₂ * neginvdtγ + k₁
         copyat_or_push!(k, 1, k₁)
         copyat_or_push!(k, 2, k₂)
     end
@@ -46,6 +56,7 @@ function _ode_addsteps!(k, t, uprev, u, dt, f, p,
         sizeu = size(u)
         mass_matrix = f.mass_matrix
         dtγ = dt * d
+        neginvdtγ = -inv(dtγ)
         dto2 = dt / 2
 
         @.. linsolve_tmp=@muladd fsalfirst + dtγ * dT
@@ -61,10 +72,9 @@ function _ode_addsteps!(k, t, uprev, u, dt, f, p,
 
         vecu = _vec(linres.u)
         veck₁ = _vec(k₁)
+        @.. veck₁ = vecu * neginvdtγ
 
-        @.. broadcast=false veck₁=-vecu
-
-        @.. broadcast=false tmp=uprev + dto2 * k₁
+        @.. tmp=uprev + dto2 * k₁
         f(f₁, tmp, p, t + dto2)
 
         if mass_matrix === I
@@ -73,16 +83,14 @@ function _ode_addsteps!(k, t, uprev, u, dt, f, p,
             mul!(_vec(tmp), mass_matrix, _vec(k₁))
         end
 
-        @.. broadcast=false linsolve_tmp=f₁ - tmp
+        @.. linsolve_tmp = f₁ - tmp
 
         linres = dolinsolve(cache, linres.cache; b = _vec(linsolve_tmp),
             reltol = cache.reltol)
         vecu = _vec(linres.u)
-        veck2 = _vec(k₂)
-
-        @.. broadcast=false veck2=-vecu
+        veck₂ = _vec(k₂)
 
-        @.. broadcast=false k₂+=k₁
+        @.. veck₂ = vecu * neginvdtγ + veck₁
 
         copyat_or_push!(k, 1, k₁)
         copyat_or_push!(k, 2, k₂)