多项式卷积与莫比乌斯 / 沃尔什变换

“唯有一日的远观山峦，你可以赞叹其巍岩绝壁；而终会到来的绝日山巅，你将能领略世间万物。”

再论卷积

存在一个序列表示为，如果存在一个多项式，是该序列中的元素一一映射入该多项式的系数中，则该多项式称为该序列的生成函数。如上，则多项式则为序列的生成函数。

卷积即为生成函数的乘积在对应序列的变换上的的抽象。

对于序列（多项式）其卷积序列（多项式）满足：

$\begin{align} (f\otimes g)_k&=\nonumber \sum_{i+j=k}{f_i\times g_j}=\sum_{i=0}^{k}f_i\cdot g_{k-i} \\ F(x)\ast G(x)&=\nonumber \sum_{i+j=k,k=0}^{n+m}f_i\times g_j\times x^{k} \end{align}$

注意：序列与序列卷积得到的结果就是一个序列，多项式与多项式卷积得到的就是多项式。

我们已经学习了等能够快速计算卷积的快速变换，而其中，计算的是循环卷积，也就是形如：

的卷积，其中为序列长度。

卷积的基本性质

本文仅对较为困难的性质进行证明，默认读者已经熟练掌握了至少初中数学的所有知识。

卷积具有交换律，即。
卷积具有结合律，即
卷积具有分配律，即

证明：设，则有： $\begin{align} [(f\oplus g)\otimes]_k&=\nonumber \sum_{i=0}^{k}(f\oplus g)_ih_{k-i} \\&=\nonumber \sum_{i=0}^{k}(af_i+bg_i)h_{k-i} \\&=\nonumber \sum_{i=0}^{k}af_ih_{k-i}+bg_ih_{k-i} \\&=\nonumber a\sum_{i=0}^{n}f_ih_{k-i}+b\sum_{i=0}^{n}g_ih_{k-i} \\&=\nonumber a(f\otimes h)_k+b(g\otimes h)_k \\&=\nonumber [(f\otimes h)\oplus(g\otimes h)]_k \end{align}$

这些都是卷积的基本性质，很好证明，当然也很好理解，但这也同样不是我们今天研究的重点。

广义卷积

正如矩乘是形式，而广义矩乘是，甚至其它各种变式，那对于卷积的，也存在一种变式呢。

答案是显然的，我们定义一种位运算卷积表示为，其中，表现为：，当然，我们也可以把换成之类的，也可以把换成等，组合方式很多，广义卷积的定义也就很多。

当然，大部分的这些广义卷积也满足交换律，结合律，分配律等基本性质。位运算卷积也在其中。

针对位运算卷积的快速变换

考虑以下这个问题：

题目简介

给定两个长度为的序列，设序列满足：

$\nonumber c_k=\sum_{i\otimes j=k} a_i\times b_j$

求当时，序列的值，对取模。

数据范围：

这里需要求解的是广义卷积，用是无法解决的。所以我们考虑用另外的方法来求解。

我们考虑在集合意义下作一个前缀和，类似于子集求和的类，记录，也就是在二进制集合下的所有子集。那我们考虑结合需要求的式子：

$\begin{align} C_k&=\nonumber \sum_{x\subseteq k}c_x \\&=\nonumber \sum_{x\subseteq k}\sum_{i\otimes j=x}a_i\times b_j \\&=\nonumber \sum_{i\otimes j\subseteq k}a_i\times b_j \\&=\nonumber \left(\sum_{i\subseteq k}a_i \right)\times\left(\sum_{j\subseteq k}b_j \right) \\&=\nonumber A_k\times B_k \end{align}$

所以，我们可以在的时间进行的运算，这个思想就类似于多项式卷积中将系数表示法转换为点表示法进行运算。

快速沃尔什变换（FWT）

我们已经可以用线性时间得到，但对于每一个，我们却需要枚举子集来解决，这样的时间复杂度会巨量超标，所以，现在的问题在于如何快速求解。

或卷积

考虑一种分治求解的思路，我们将这个函数表示为：

$C_k=\sum_{i\mid j=k}A_iB_j\longrightarrow FWT(C)=FWT(A)\ast FWT(B)$

将分为前后两端，表示为，但事实上，对于二进制位的最高位，，这是我们保证被二分的前提，那这样的话的子集就是其本身，但是上应该当是包含了部分，也就是的部分，所以，真正的应当表示为：

逆变换同理：

时间复杂度可以优化到。

与卷积

同理于或卷积，我们同样利用分治来解决，得到的式子为：

$\begin{align} FWT_{and}(A)&=\nonumber \Big( FWT_{and}(A_0)+FWT_{and}(A_1),FWT_{and}(A_1) \Big) \\ IFWT_{and}(A)&=\nonumber \Big( IFWT_{and}(A_0)-IFWT_{and}(A_1),IFWT_{and}(A_1) \Big) \end{align}$

异或卷积

这是最常用的变换形式，但是和有所不同，我们引入以下一个引理：

设表示在二进制位下的奇偶性，我们可以得到以下性质：

$\nonumber d(i\operatorname{and}j)\wedge d(j\operatorname{and}k)=d((i\operatorname{and}j)\operatorname{and}k)$

简单来讲，就是一个变式的结合律。

因此有

此时依然满足。

得到结论为：

$\begin{align} FWT(A)&=\nonumber \Big(FWT(A_1)-FWT(A_0),FWT(A_1)+FWT(A_0)\Big) \\ IFWT(A)&=\nonumber \left(\frac{IFWT(A_1)-IFWT(A_0)}{2},\frac{IFWT(A_1)+IFWT(A_0)}{2}\right) \end{align}$

然后我们就用解决了这个问题了。

完整实现

参考写法

void Or(int a[],int inv)
{
	for(int mid=1;mid<Tot;mid<<=1)
		for(int i=0;i<Tot;i+=mid*2)
			for(int j=0;j<mid;++j)
				a[i+j+mid]=((a[i+j+mid]+inv*a[i+j])%P+P)%P;
}
void And(int a[],int inv)
{
	for(int mid=1;mid<Tot;mid<<=1)
		for(int i=0;i<Tot;i+=mid*2)
			for(int j=0;j<mid;++j)
				a[i+j]=((a[i+j]+inv*a[i+j+mid])%P+P)%P;
}
void Xor(int a[],int inv)
{
	for(int mid=1;mid<Tot;mid<<=1)
		for(int i=0;i<Tot;i+=mid*2)
			for(int j=0;j<mid;++j)
			{
				int x=a[i+j],y=a[i+j+mid];
				a[i+j]=(x+y)%P,a[i+j+mid]=((x-y)%P+P)%P;
				if(inv==-1)
				{
					a[i+j]=1ll*a[i+j]*Inv%P;
					a[i+j+mid]=1ll*a[i+j+mid]*Inv%P;
				}
			}
}

快速莫比乌斯变换（FMT）

仅能解决与卷积和或卷积，常数较高，但实现相比更为简洁。

在的求解中，我们曾经考虑过一个子集求和的问题，这与我们今天要探究的序列卷积有些许类似，也许可以从这方面入手。

下图表示了的是每一个所对应的和：

图片来自：https://yhx-12243.github.io/OI-transit/records/vijos%20%234.html

我们按照的思想，设立：

$\begin{align} FWT_{\operatorname{or}}(F)_i&=\nonumber \sum_{j\subseteq i} f_j \\ FWT_{\operatorname{and}}(F)_i&=\nonumber \sum_{i\subseteq j} f_j \end{align}$

可以发现，与或的区别也就是子集与逆子集的区别。

而对于其逆变换，也称为快速莫比乌斯反演（），似乎与莫比乌斯反演没有什么太大的关系。

考虑的式子：

$\nonumber f(S)=\sum_{T\subseteq S}g(T)$

如果对其进行逆变换的话，涉及到一个容斥，即枚举子集的反集，会涉及到的问题，得到：

$\nonumber g(S)=\sum_{T\subseteq S}(-1)^{|S|-|T|}f(T)$

但代码实现比较简单，下面是和的整合版本。

参考代码

namespace Mobius_Transform
{
	void Or(int a[],int inv)
	{
		for(int i=0;i<N;++i)	
			for(int s=0;s<Tot;++s)
				if(s>>i&1) a[s]=((a[s]+1ll*inv*a[s^(1<<i)])%P+P)%P;
	}
	void And(int a[],int inv)
	{
		for(int i=0;i<N;++i)
			for(int s=Tot-1;~s;--s)
				if((~s)>>i&1) a[s]=((a[s]+1ll*inv*a[s^(1<<i)])%P+P)%P;
	}
};

容易发现，其本质就是高维前缀和。

二者比较

根据主定理分析，的时间复杂度都是，但二者的真正实现存在差异，以洛谷模板题为例（异或都用的是实现）：

时空比较	快速沃尔什变换（）	快速莫比乌斯变换（）
时间
空间
优化下

可见，各有各优，各有各劣。

快速子集变换（FST）

快速子集变换（）是的一个变种，用于求解状态不重复子集交卷积问题。可以用实现。

题目简介

题目名称：子集卷积
题目来源：

评测链接：https://www.luogu.com.cn/problem/P6097

有个长度为的序列，求出一个序列满足：

$C_k=\sum_{i\operatorname{and}j=0,i\operatorname{or}j=k}A_iB_j$

对取模。

数据范围：

实现

我们化简式子，用子集形式写成：

$C_S=\sum_{T\subseteq S}A_SB_{S-T}$

这是一个变式的位运算卷积，所以我们还是可以用高维前缀和（）的思路来想，对于原来的，我们用来代替原来的，记录为集合中有个元素的情况，那显然，是一一对应了的。

令表示二进制下的有多少个，可以知道。所以我们对所有的都做一次。

所以我们将其化简得到：

$C_{i,S}=\sum_{j=0}^{i}A_{j,S}\ast B_{i-j,S}$

那对于我们需要求的序列，答案就是。

AC Code

// ----- Eternally question-----
// Problem: P6097 【模板】子集卷积
// Contest: Luogu
// URL: https://www.luogu.com.cn/problem/P6097
// Memory Limit: 512 MB
// Time Limit: 3000 ms
// Written by: Eternity
// Time: 2023-01-14 16:06:56
// ----- Endless solution-------

//该代码对FWT和FMT都进行了实现。

#include<bits/stdc++.h>
#define re register
typedef long long ll;
template<class T>
inline void read(T &x)
{
	x=0;
	char ch=getchar(),t=0;
	while(ch<'0'||ch>'9') t|=ch=='-',ch=getchar();
	while(ch>='0'&&ch<='9') x=(x<<3)+(x<<1)+(ch^48),ch=getchar();
	if(t) x=-x;
}
template<class T,class ...T1>
inline void read(T &x,T1 &...x1){ read(x),read(x1...); }
template<class T>
inline void write(T x)
{
	if(x<0) putchar('-'),x=-x;
	if(x>9) write(x/10);
	putchar(x%10+'0');
}
template<>
inline void write(bool x){ putchar(x?'1':'0'); }
template<>
inline void write(char c){ putchar(c); }
template<>
inline void write(char *s){ while(*s!='\0') putchar(*s++); }
template<>
inline void write(const char *s){ while(*s!='\0') putchar(*s++); }
template<class T,class ...T1>
inline void write(T x,T1 ...x1){ write(x),write(x1...); }
template<class T>
inline bool checkMax(T &x,T y){ return x<y?x=y,1:0; }
template<class T>
inline bool checkMin(T &x,T y){ return x>y?x=y,1:0; }
const int MAXN=4e6+10,MAXS=21;
const int P=1e9+9;
int N,Tot;
int a[MAXS][MAXN],b[MAXS][MAXN];
int Bit[MAXN];
int ans[MAXS][MAXN];
inline void FWT(int a[],int inv)
{
	for(int mid=1;mid<Tot;mid<<=1)
		for(int i=0;i<Tot;i+=mid*2)
			for(int j=0;j<mid;++j)
				a[i+j+mid]=((a[i+j+mid]+1ll*inv*a[i+j]%P)%P+P)%P;
}
inline void FMT(int a[],int inv)
{
	for(int i=0;i<N;++i)
		for(int s=0;s<Tot;++s)
			if(s>>i&1) a[s]=((a[s]+1ll*inv*a[s^(1<<i)])%P+P)%P;
}
int main()
{
	// freopen(".in","r",stdin);
	// freopen(".out","w",stdout);
	read(N);Tot=1<<N;
	for(int i=0;i<Tot;++i) Bit[i]=Bit[i>>1]+(i&1);
	for(int i=0;i<Tot;++i) read(a[Bit[i]][i]);
	for(int i=0;i<Tot;++i) read(b[Bit[i]][i]);
	// for(int i=0;i<=N;++i) FWT(a[i],1),FWT(b[i],1);
	// for(int i=0;i<=N;++i) FMT(a[i],1),FMT(b[i],1);
	for(int i=0;i<=N;++i)
	{
		for(int j=0;j<=i;++j)
			for(int k=0;k<Tot;++k)
				ans[i][k]=(ans[i][k]+1ll*a[j][k]*b[i-j][k]%P)%P;
		// FWT(ans[i],-1);
		// FMT(ans[i],-1);
	}
	for(int i=0;i<Tot;++i) write(ans[Bit[i]][i],' ');
	return 0;
}
/*

*/

FMT 和 FWT 的实现比较

时空比较	快速沃尔什变换（）	快速莫比乌斯变换（）
时间
空间
代码长度

~~可见，FWT有绝对优势。~~