Taylor shift test, faster wildcard matching

adamant-pwn · adamant-pwn · commit ca0ad5486608 · 2024-05-26T13:37:36.000+02:00
diff --git a/cp-algo/math/fft.hpp b/cp-algo/math/fft.hpp
@@ -6,6 +6,7 @@
 #include <complex>
 #include <cassert>
 #include <vector>
+#include <bit>
 namespace cp_algo::math::fft {
     using ftype = double;
     using point = std::complex<ftype>;
@@ -70,48 +71,89 @@ namespace cp_algo::math::fft {
         }
     }
     
-    template<modint_type base>
+    template<typename base>
     struct dft {
+        std::vector<point> A;
+        
+        dft(std::vector<base> const& a, size_t n): A(n) {
+            for(size_t i = 0; i < std::min(n, a.size()); i++) {
+                A[i] = a[i];
+            }
+            if(n) {
+                fft(A, n);
+            }
+        }
+    
+        auto operator *= (dft const& B) {
+            assert(A.size() == B.A.size());
+            size_t n = A.size();
+            if(!n) {
+                return std::vector<base>();
+            }
+            for(size_t i = 0; i < n; i++) {
+                A[i] *= B[i];
+            }
+            fft(A, n);
+            reverse(begin(A) + 1, end(A));
+            std::vector<base> res(n);
+            for(size_t i = 0; i < n; i++) {
+                res[i] = A[i];
+                res[i] /= n;
+            }
+            return res;
+        }
+
+        auto operator * (dft const& B) const {
+            return dft(*this) *= B;
+        }
+        
+        point& operator [](int i) {return A[i];}
+        point operator [](int i) const {return A[i];}
+    };
+
+    template<modint_type base>
+    struct dft<base> {
         static constexpr int split = 1 << 15;
         std::vector<point> A;
         
         dft(std::vector<base> const& a, size_t n): A(n) {
             for(size_t i = 0; i < std::min(n, a.size()); i++) {
-                A[i] = point(
-                    a[i].rem() % split,
-                    a[i].rem() / split
-                );
+                A[i] = point(a[i].rem() % split, a[i].rem() / split);
             }
             if(n) {
                 fft(A, n);
             }
         }
     
-        auto operator * (dft const& B) {
+        auto operator *= (dft const& B) {
             assert(A.size() == B.A.size());
             size_t n = A.size();
             if(!n) {
                 return std::vector<base>();
             }
-            std::vector<point> C(n), D(n);
+            std::vector<point> C(n);
             for(size_t i = 0; i < n; i++) {
                 C[i] = A[i] * (B[i] + conj(B[(n - i) % n]));
-                D[i] = A[i] * (B[i] - conj(B[(n - i) % n]));
+                A[i] = A[i] * (B[i] - conj(B[(n - i) % n]));
             }
             fft(C, n);
-            fft(D, n);
+            fft(A, n);
             reverse(begin(C) + 1, end(C));
-            reverse(begin(D) + 1, end(D));
+            reverse(begin(A) + 1, end(A));
             int t = 2 * n;
             std::vector<base> res(n);
             for(size_t i = 0; i < n; i++) {
                 base A0 = llround(C[i].real() / t);
-                base A1 = llround(C[i].imag() / t + D[i].imag() / t);
-                base A2 = llround(D[i].real() / t);
+                base A1 = llround(C[i].imag() / t + A[i].imag() / t);
+                base A2 = llround(A[i].real() / t);
                 res[i] = A0 + A1 * split - A2 * split * split;
             }
             return res;
         }
+
+        auto operator * (dft const& B) const {
+            return dft(*this) *= B;
+        }
         
         point& operator [](int i) {return A[i];}
         point operator [](int i) const {return A[i];}
@@ -121,14 +163,10 @@ namespace cp_algo::math::fft {
         if(!as || !bs) {
             return 0;
         }
-        size_t n = as + bs - 1;
-        while(__builtin_popcount(n) != 1) {
-            n++;
-        }
-        return n;
+        return std::bit_ceil(as + bs - 1);
     }
     
-    template<modint_type base>
+    template<typename base>
     void mul(std::vector<base> &a, std::vector<base> const& b) {
         if(std::min(a.size(), b.size()) < magic) {
             mul_slow(a, b);
@@ -137,30 +175,19 @@ namespace cp_algo::math::fft {
         auto n = com_size(a.size(), b.size());
         auto A = dft<base>(a, n);
         if(a == b) {
-            a = A * A;
+            a = A *= A;
         } else {
-            a = A * dft<base>(b, n);
+            a = A *= dft<base>(b, n);
         }
     }
     template<typename base>
-    void mul(std::vector<base> &a, std::vector<base> const& b) {
-        if(std::min(a.size(), b.size()) < magic) {
-            mul_slow(a, b);
-            return;
-        }
-        auto n = com_size(a.size(), b.size());
-        a.resize(n);
-        auto B(b);
-        B.resize(n);
-        fft(a, n);
-        fft(B, n);
-        for(size_t i = 0; i < n; i++) {
-            a[i] *= B[i];
-        }
-        fft(a, n);
-        reverse(begin(a) + 1, end(a));
-        for(size_t i = 0; i < n; i++) {
-            a[i] /= n;
+    void circular_mul(std::vector<base> &a, std::vector<base> const& b) {
+        auto n = std::bit_ceil(a.size());
+        auto A = dft<base>(a, n);
+        if(a == b) {
+            a = A *= A;
+        } else {
+            a = A *= dft<base>(b, n);
         }
     }
 }
diff --git a/cp-algo/math/poly.hpp b/cp-algo/math/poly.hpp
@@ -503,6 +503,13 @@ namespace cp_algo::math {
             return a * b.reverse();
         }
 
+        // [x^k] (a semicorr b) = sum_i a{i+k} * b{i}
+        static poly_t inner_semicorr(poly_t const& a, poly_t const& b) {
+            auto ta = a.a;
+            fft::circular_mul(ta, b.reverse().a);
+            return poly_t(ta).div_xk(b.deg());
+        }
+
         // [x^k] (a semicorr b) = sum_i a{i+k} * b{i}
         static poly_t semicorr(poly_t const& a, poly_t const& b) {
             return corr(a, b).div_xk(b.deg());
diff --git a/verify/poly/taylor.test.cpp b/verify/poly/taylor.test.cpp
@@ -0,0 +1,31 @@
+// @brief Polynomial Taylor Shift
+#define PROBLEM "https://judge.yosupo.jp/problem/polynomial_taylor_shift"
+#pragma GCC optimize("Ofast,unroll-loops")
+#pragma GCC target("avx2,tune=native")
+#include "cp-algo/math/poly.hpp"
+#include <bits/stdc++.h>
+
+using namespace std;
+using namespace cp_algo::math;
+
+const int mod = 998244353;
+using base = modint<mod>;
+using polyn = poly_t<base>;
+
+void solve() {
+    int n, c;
+    cin >> n >> c;
+    vector<base> a(n);
+    copy_n(istream_iterator<base>(cin), n, begin(a));
+    polyn(a).shift(c).print(n);
+}
+signed main() {
+    //freopen("input.txt", "r", stdin);
+    ios::sync_with_stdio(0);
+    cin.tie(0);
+    int t = 1;
+    //cin >> t;
+    while(t--) {
+        solve();
+    }
+}
diff --git a/verify/poly/wildcard.test.cpp b/verify/poly/wildcard.test.cpp
@@ -30,7 +30,7 @@ string matches(string const& A, string const& B, char wild = '*') {
         }
         P[i] = coeffs;
     }
-    auto dist0 = polyn::semicorr(P[0], P[1]);
+    auto dist0 = polyn::inner_semicorr(P[0], P[1]);
     string ans(size(ST[0]) - size(ST[1]) + 1, '0');
     for(size_t j = 0; j <= size(ans); j++) {
         ans[j] = '0' + (

Original file line number	Diff line number	Diff line change
`@@ -30,7 +30,7 @@ string matches(string const& A, string const& B, char wild = '*') {`
`30`	`30`	`}`
`31`	`31`	`P[i] = coeffs;`
`32`	`32`	`}`
`33`		`- auto dist0 = polyn::semicorr(P[0], P[1]);`
	`33`	`+ auto dist0 = polyn::inner_semicorr(P[0], P[1]);`
`34`	`34`	`string ans(size(ST[0]) - size(ST[1]) + 1, '0');`
`35`	`35`	`for(size_t j = 0; j <= size(ans); j++) {`
`36`	`36`	`ans[j] = '0' + (`