容斥原理 入门 入门例题 假设班里有 10 个学生喜欢数学, 15 个学生喜欢语文, 21 个学生喜欢编程,班里至少喜欢一门学科的有多少个学生呢?
是 10+15+21=46 个吗?不是的,因为有些学生可能同时喜欢数学和语文,或者语文和编程,甚至还有可能三者都喜欢。
为了叙述方便,我们把喜欢语文、数学、编程的学生集合分别用 A,B,C 表示,则学生总数等于 |A\cup B\cup C| 。刚才已经讲过,如果把这三个集合的元素个数 |A|,|B|,|C| 直接加起来,会有一些元素重复统计了,因此需要扣掉 |A\cap B|,|B\cap C|,|C\cap A| ,但这样一来,又有一小部分多扣了,需要加回来,即 |A\cap B\cap C| 。即
|A\cup B\cup C|=|A|+|B|+|C|-|A\cap B|-|B\cap C|-|C\cap A|+|A\cap B\cap C|
把上述问题推广到一般情况,就是我们熟知的容斥原理。
容斥原理 设 U 中元素有 n 种不同的属性,而第 i 种属性称为 P_i ,拥有属性 P_i 的元素构成集合 S_i ,那么
\begin{split} \left|\bigcup_{i=1}^{n}S_i\right|=&\sum_{i}|S_i|-\sum_{i<j}|S_i\cap S_j|+\sum_{i<j<k}|S_i\cap S_j\cap S_k|-\cdots\\ &+(-1)^{m-1}\sum_{a_i<a_{i+1} }\left|\bigcap_{i=1}^{m}S_{a_i}\right|+\cdots+(-1)^{n-1}|S_1\cap\cdots\cap S_n| \end{split} 即
\left|\bigcup_{i=1}^{n}S_i\right|=\sum_{m=1}^n(-1)^{m-1}\sum_{a_i<a_{i+1} }\left|\bigcap_{i=1}^mS_{a_i}\right| 证明 对于每个元素使用二项式定理计算其出现的次数。对于元素 x,假设它出现在 T_1,T_2,\cdots,T_m 的集合中,那么它的出现次数为
\begin{split} Cnt=&|\{T_i\}|-|\{T_i\cap T_j|i<j\}|+\cdots+(-1)^{k-1}\left|\left\{\bigcap_{i=1}^{k}T_{a_i}|a_i<a_{i+1}\right\}\right|\\ &+\cdots+(-1)^{m-1}|\{T_1\cap\cdots\cap T_m\}|\\ =&C_m^1-C_m^2+\cdots+(-1)^{m-1}C_m^m\\ =&C_m^0-\sum_{i=0}^m(-1)^iC_m^i\\ =&1-(1-1)^m=1 \end{split} 于是每个元素出现的次数为 1,那么合并起来就是并集。证毕。
补集 对于全集 U 下的 集合的并 可以使用容斥原理计算,而集合的交则用全集减去 补集的并集 求得:
\left|\bigcap_{i=1}^{n}S_i\right|=|U|-\left|\bigcup_{i=1}^n\overline{S_i}\right| 右边使用容斥即可。
可能接触过容斥的读者都清楚上述内容,而更关心的是容斥的应用
那么接下来我们给出 3 个层次不同的例题来为大家展示容斥原理的应用。
不定方程非负整数解计数 不定方程非负整数解计数 给出不定方程 \sum_{i=1}^nx_i=m 和 n 个限制条件 x_i\leq b_i ,其中 m,b_i\leq \mathbb{N} . 求方程的非负整数解的个数。
没有限制时 如果没有 x_i<b_i 的限制,那么不定方程 \sum_{i=1}^nx_i=m 的非负整数解的数目为 C_{m+n-1}^{n-1} .
略证:插板法。
相当于你有 m 个球要分给 n 个盒子,允许某个盒子是空的。这个问题不能直接用组合数解决。
于是我们再加入 n-1 个球,于是问题就变成了在一个长度为 m+n-1 的球序列中选择 n-1 个球,然后这个 n-1 个球把这个序列隔成了 n 份,恰好可以一一对应放到 n 个盒子中。那么在 m+n-1 个球中选择 n-1 个球的方案数就是 C_{m+n-1}^{n-1} 。
容斥模型 接着我们尝试抽象出容斥原理的模型:
全集 U:不定方程 \sum_{i=1}^nx_i=m 的非负整数解 元素:变量 x_i . 属性: x_i 的属性即 x_i 满足的条件,即 x_i\leq b_i 的条件 目标:所有变量满足对应属性时集合的大小,即 |\bigcap_{i=1}^nS_i| .
这个东西可以用 \left|\bigcap_{i=1}^{n}S_i\right|=|U|-\left|\bigcup_{i=1}^n\overline{S_i}\right| 求解。 |U| 可以用组合数计算,后半部分自然使用容斥原理展开。
那么问题变成,对于一些 \overline{S_{a_i}} 的交集求大小。考虑 \overline{S_{a_i} } 的含义,表示 x_{a_i}\geq b_{a_i}+1 的解的数目。而交集表示同时满足这些条件。因此这个交集对应的不定方程中,有些变量有 下界限制 ,而有些则没有限制。
能否消除这些下界限制呢?既然要求的是非负整数解,而有些变量的下界又大于 0 ,那么我们直接 把这个下界减掉 ,就可以使得这些变量的下界变成 0 ,即没有下界啦。因此对于
\left|\bigcap_{a_i<a_{i+1} }^{1\leq i\leq k}S_{a_i}\right| 的不定方程形式为
\sum_{i=1}^nx_i=m-\sum_{i=1}^k(b_{a_i}+1) 于是这个也可以组合数计算啦。这个长度为 k 的 a 数组相当于在枚举子集。
HAOI2008 硬币购物 HAOI2008 硬币购物 4 种面值的硬币,第 i 种的面值是 C_i 。 n 次询问,每次询问给出每种硬币的数量 D_i 和一个价格 S ,问付款方式。
n\leq 10^3,S\leq 10^5 .
如果用背包做的话复杂度是 O(4nS) ,无法承受。这道题最明显的特点就是硬币一共只有四种。抽象模型,其实就是让我们求方程 \sum_{i=1}^4C_ix_i=S,x_i\leq D_i 的非负整数解的个数。
采用同样的容斥方式, x_i 的属性为 x_i\leq D_i . 套用容斥原理的公式,最后我们要求解
\sum_{i=1}^4C_ix_i=S-\sum_{i=1}^kC_{a_i}(D_{a_i}+1) 也就是无限背包问题。这个问题可以预处理,算上询问,总复杂度 O(4S+2^4n) 。
代码实现 1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29#include <bits/stdc++.h>
using namespace std ;
const long long S = 1e5 + 5 ;
long long c [ 5 ], d [ 5 ], n , s ;
long long f [ S ];
int main () {
scanf ( "%lld%lld%lld%lld%lld" , & c [ 1 ], & c [ 2 ], & c [ 3 ], & c [ 4 ], & n );
f [ 0 ] = 1 ;
for ( long long j = 1 ; j <= 4 ; j ++ )
for ( long long i = 1 ; i < S ; i ++ )
if ( i >= c [ j ]) f [ i ] += f [ i - c [ j ]]; // f[i]:价格为i时的硬币组成方法数
for ( long long k = 1 ; k <= n ; k ++ ) {
scanf ( "%lld%lld%lld%lld%lld" , & d [ 1 ], & d [ 2 ], & d [ 3 ], & d [ 4 ], & s );
long long ans = 0 ;
for ( long long i = 1 ; i < 16 ;
i ++ ) { //容斥,因为物品一共有4种,所以从1到2^4-1=15循环
long long m = s , bit = 0 ;
for ( long long j = 1 ; j <= 4 ; j ++ ) {
if (( i >> ( j - 1 )) % 2 == 1 ) {
m -= ( d [ j ] + 1 ) * c [ j ];
bit ++ ;
}
}
if ( m >= 0 ) ans += ( bit % 2 * 2 - 1 ) * f [ m ];
}
printf ( "%lld \n " , f [ s ] - ans );
}
return 0 ;
}
错位排列计数 错位排列计数 对于 1\sim n 的排列 P 如果满足 P_i\neq i ,则称 P 是 n 的错位排列。求 n 的错位排列数。
全集 U 即为 1\sim n 的排列, |U|=n! ;属性就是 P_i\neq i . 套用补集的公式,问题变成求 \left|\bigcup_{i=1}^n\overline{S_i}\right| .
我们知道 \overline{S_i} 的含义是满足 P_i=i 的排列的数量。用容斥原理把问题式子展开,我们需要对若干个特定的集合的交集求大小,即
\left|\bigcap_{i=1}^{k}S_{a_i}\right| 其中我们省略了 a_i<a_{i+1} 的条件以方便表示。上述 k 个集合的交集表示有 k 个变量满足 P_{a_i}=a_i 的排列数,而剩下 n-k 个数的位置任意,因此排列数
\left|\bigcap_{i=1}^{k}S_{a_i}\right|=(n-k)! 那么选择 k 个元素的方案数为 C_n^k ,因此有
\begin{split} \left|\bigcup_{i=1}^n\overline{S_i}\right| &=\sum_{k=1}^n(-1)^{k-1}\sum_{a_{1,\cdots,k} }\left|\bigcap_{i=1}^{k}S_{a_i}\right|\\ &=\sum_{k=1}^n(-1)^{k-1}C_n^k(n-k)!\\ &=\sum_{k=1}^n(-1)^{k-1}\frac{n!}{k!}\\ &=n!\sum_{k=1}^n\frac{(-1)^{k-1} }{k!} \end{split} 因此 n 的错位排列数为
D_n=n!-n!\sum_{k=1}^n\frac{(-1)^{k-1} }{k!}=n!\sum_{k=0}^n\frac{(-1)^k}{k!} 完全图子图染色问题 前面的三道题都是容斥原理的正向运用,这道题则需要用到容斥原理逆向分析。
完全图子图染色问题 A 和 B 喜欢对图(不一定连通)进行染色,而他们的规则是,相邻的结点必须染同一种颜色。今天 A 和 B 玩游戏,对于 n 阶 完全图 G=(V,E) 。他们定义一个估价函数 F(S) ,其中 S 是边集, S\subseteq E . F(S) 的值是对图 G'=(V,S) 用 m 种颜色染色的总方案数。他们的另一个规则是,如果 |S| 是奇数,那么 A 的得分增加 F(S) ,否则 B 的得分增加 F(S) . 问 A 和 B 的得分差值。
数学形式 一看这道题的算法趋向并不明显,因此对于棘手的题目首先抽象出数学形式。得分差即为奇偶对称差,可以用 -1 的幂次来作为系数。我们求的是
Ans=\sum_{S\subseteq E}(-1)^{|S|-1}F(S) 容斥模型 相邻结点染同一种颜色,我们把它当作属性。在这里我们先不遵守染色的规则,假定我们用 m 种颜色直接对图染色。对于图 G'=(V,S) ,我们把它当作 元素 。属性 x_i=x_j 的含义是结点 i,j 染同色(注意,并未要求 i,j 之间有连边)。
而属性 x_i=x_j 对应的 集合 定义为 Q_{i,j} ,其含义是所有满足该属性的图 G' 的染色方案,集合的大小就是满足该属性的染色方案数,集合内的元素相当于所有满足该属性的图 G' 的染色图。
回到题目,“相邻的结点必须染同一种颜色”,可以理解为若干个 Q 集合的交集。因此可以写出
F(S)=\left|\bigcap_{(i,j)\in S}Q_{i,j}\right| 上述式子右边的含义就是说对于 S 内的每一条边 (i,j) 都满足 x_i=x_j 的染色方案数,也就是 F(S) .
是不是很有容斥的味道了?由于容斥原理本身没有二元组的形式,因此我们把 所有 的边 (i,j) 映射到 T=\frac{n(n+1)}{2} 个整数上,假设将 (i,j) 映射为 k,1\leq k\leq T ,同时 Q_{i,j} 映射为 Q_k . 那么属性 x_i=x_j 则定义为 P_k .
同时 S 可以表示为若干个 k 组成的集合,即 S\iff K=\{k_1,k_2,\cdots,k_m\} .(也就是说我们在边集与数集间建立了等价关系)。
而 E 对应集合 M=\left\{1,2,\cdots,\frac{n(n+1)}{2}\right\} . 于是乎
F(S)\iff F(\{ {k_i}\})=\left|\bigcap_{k_i}Q_{k_i}\right| 逆向分析 那么要求的式子展开
\begin{split} Ans &= \sum_{K\subseteq M}(-1)^{|K|-1}\left|\bigcap_{k_i\in K}Q_{k_i}\right|\\ &= \sum_{i}|Q_i|-\sum_{i<j}|Q_i\cap Q_j|+\sum_{i<j<k}|Q_i\cap Q_j\cap Q_k|-\cdots+(-1)^{T-1}\left|\bigcap_{i=1}^TQ_i\right| \end{split} 于是就出现了容斥原理的展开形式,因此对这个式子逆向推导
Ans=\left|\bigcup_{i=1}^TQ_i\right| 再考虑等式右边的含义,只要满足 1\sim T 任一条件即可,也就是存在两个点同色(不一定相邻)的染色方案数!而我们知道染色方案的全集是 U ,显然 |U|=m^n . 而转化为补集,就是求两两异色的染色方案数,即 A_m^n=\frac{m!}{n!} . 因此
解决这道题,我们首先抽象出题目数学形式,然后从题目中信息量最大的条件, F(S) 函数的定义入手,将其转化为集合的交并补。然后将式子转化为容斥原理的形式,并 逆向推导 出最终的结果。这道题体现的正是容斥原理的逆用。
数论中的容斥 使用容斥原理能够巧妙地求解一些数论问题。
容斥原理求最大公约数为 k 的数对个数 考虑下面的问题:
求最大公约数为 k 的数对个数 设 1 \le x, y \le N , f(k) 表示最大公约数为 k 的有序数对 (x, y) 的个数,求 f(1) 到 f(N) 的值。
这道题固然可以用欧拉函数或莫比乌斯反演的方法来做,但是都不如用容斥原理来的简单。
由容斥原理可以得知,先找到所有以 k 为 公约数 的数对,再从中剔除所有以 k 的倍数为 公约数 的数对,余下的数对就是以 k 为 最大公约数 的数对。即 f(k)= 以 k 为 公约数 的数对个数 - 以 k 的倍数为 公约数 的数对个数。
进一步可发现,以 k 的倍数为 公约数 的数对个数等于所有以 k 的倍数为 最大公约数 的数对个数之和。于是,可以写出如下表达式:
f(k)= \lfloor (N/k) \rfloor ^2 - \sum_{i=2}^{i*k \le N} f(i*k) 由于当 k>N/2 时,我们可以直接算出 f(k)= \lfloor (N/k) \rfloor ^2 ,因此我们可以倒过来,从 f(N) 算到 f(1) 就可以了。于是,我们使用容斥原理完成了本题。
for ( long long k = N ; k >= 1 ; k -- ) {
f [ k ] = ( N / k ) * ( N / k );
for ( long long i = k + k ; i <= N ; i += k ) f [ k ] -= f [ i ];
}
上述方法的时间复杂度为 O( \sum_{i=1}^{N} N/i)=O(N \sum_{i=1}^{N} 1/i)=O(N \log N) 。
附赠三倍经验供大家练手。
容斥原理推导欧拉函数 考虑下面的问题:
欧拉函数公式 求欧拉函数 \varphi(n) 。其中 \varphi(n)=|\{1\leq x\leq n|\gcd(x,n)=1\}| 。
直接计算是 O(n\log n) 的,用线性筛是 O(n) 的,杜教筛是 O(n^{\frac{2}{3}}) 的(话说一道数论入门题用容斥做为什么还要扯到杜教筛上),接下来考虑用容斥推出欧拉函数的公式
判断两个数是否互质,首先分解质因数
n=\prod_{i=1}^k{p_i}^{c_i} 那么就要求对于任意 p_i , x 都不是 p_i 的倍数,即 p_i\nmid x . 把它当作属性,对应的集合为 S_i ,因此有
\varphi(n)=\left|\bigcap_{i=1}^kS_i\right|=|U|-\left|\bigcup_{i=1}^k\overline{S_i}\right| 全集大小 |U|=n ,而 \overline{S_i} 表示的是 p_i\mid x 构成的集合,显然 |\overline{S_i}|=\frac{n}{p_i} ,并由此推出
\left|\bigcap_{a_i<a_{i+1}}S_{a_i}\right|=\frac{n}{\prod p_{a_i}} 因此可得
\begin{split} \varphi(n)=&n-\sum_{i}\frac{n}{p_i}+\sum_{i<j}\frac{n}{p_ip_j}-\cdots+(-1)^k\frac{n}{p_1p_2\cdots p_n}\\ =&n\left(1-\frac{1}{p_1}\right)\left(1-\frac{1}{p_2}\right)\cdots\left(1-\frac{1}{p_k}\right)\\ =&n\prod_{i=1}^k\left(1-\frac{1}{p_i}\right) \end{split} 这就是欧拉函数的数学表示啦
容斥原理一般化 容斥原理常用于集合的计数问题,而对于两个集合的函数 f(S),g(S) ,若
f(S)=\sum_{T\subseteq S}g(T) 那么就有
g(S)=\sum_{T\subseteq S}(-1)^{|S|-|T|}f(T) 证明 接下来我们简单证明一下。我们从等式的右边开始推:
\begin{split} &\sum_{T\subseteq S}(-1)^{|S|-|T|}f(T)\\ =&\sum_{T\subseteq S}(-1)^{|S|-|T|}\sum_{Q\subseteq T}g(Q)\\ =&\sum_{Q}g(Q)\sum_{Q\subseteq T\subseteq S}(-1)^{|S|-|T|}\\ \end{split} 我们发现后半部分的求和与 Q 无关,因此把后半部分的 Q 剔除:
=\sum_{Q}g(Q)\sum_{T\subseteq (S\setminus Q)}(-1)^{|S\setminus Q|-|T|}\\ 记关于集合 P 的函数 F(P)=\sum_{T\subseteq P}(-1)^{|P|-|T|} ,并化简这个函数:
\begin{split} F(P)=&\sum_{T\subseteq P}(-1)^{|P|-|T|}\\ =&\sum_{i=0}^{|P|}C_{|P|}^i(-1)^{|P|-i}=\sum_{i=0}^{|P|}C_{|P|}^i1^i(-1)^{|P|-i}\\ =&(1-1)^{|P|}=0^{|P|} \end{split} 因此原来的式子的值是
\sum_{Q}g(Q)\sum_{T\subseteq (S\setminus Q)}(-1)^{|S\setminus Q|-|T|}=\sum_{Q}g(Q)F(S\setminus Q)=\sum_{Q}g(Q)\cdot 0^{|S\setminus Q|} 分析发现,仅当 |S\setminus Q|=0 时有 0^0=1 ,这时 Q=S ,对答案的贡献就是 g(S) ,其他时侯 0^{|S\setminus Q|}=0 ,则对答案无贡献。于是得到
\sum_{Q}g(Q)\cdot 0^{|S\setminus Q|}=g(S) 综上所述,得证。
推论 该形式还有这样一个推论。在全集 U 下,对于函数 f(S),g(S) ,如果
f(S)=\sum_{S\subseteq T}g(T) 那么
g(S)=\sum_{S\subseteq T}(-1)^{|T|-|S|}f(T) 这个推论其实就是补集形式,证法类似。
DAG 计数 DAG 计数 对 n 个点带标号的有向无环图进行计数,对 10^9+7 取模。 n\leq 5\times 10^3 。
直接 DP 考虑 DP,定义 f[i,j] 表示 i 个点的 DAG,有 j 点个入度为 0 的图的个数。假设去掉这 j 个点后,有 k 个点入度为 0 ,那么在去掉前这 k 个点至少与这 j 个点中的某几个有连边,即 2^j-1 种情况;而这 j 个点除了与 k 个点连边,还可以与剩下的点任意连边,有 2^{i-j-k} 种情况。因此方程如下:
f[i,j]=\binom{i}{j}\sum_{k=1}^{i-j}(2^j-1)^k2^{i-j-k}f[i-j,k] 计算上式的复杂度是 O(n^3) 的。
放宽限制 上述 DP 的定义是恰好 j 个点入度为 0 , 太过于严格,可以放宽为至少 j 个点入度为 0 。直接定义 f[i] 表示 i 个点的 DAG 个数。可以直接容斥。考虑选出的 j 个点,这 j 个点可以和剩下的 i-j 个点有任意的连边,即 \left(2^{i-j}\right)^j=2^{(i-j)j} 种情况:
f[i]=\sum_{j=1}^i(-1)^{j-1}\binom{i}{j}2^{(i-j)j}f[i-j] 计算上式的复杂度是 O(n^2) 的。
Min-max 容斥 对于满足全序关系并且其中元素满足可加减性的序列 \{x_i\} ,设其长度为 n ,并设 S=\{1,2,3,\cdots,n\} ,则有:
\max_{i\in S}{x_i}=\sum_{T\subseteq S}{(-1)^{|T|-1}\min_{j\in T}{x_j}} \min_{i\in S}{x_i}=\sum_{T\subseteq S}{(-1)^{|T|-1}\max_{j\in T}{x_j}} 全序关系 对于集合 X ,若 X 满足全序关系,则下列陈述对于任意 a,b,c\in X 都成立:
反对称性:若 a\le b 且 b\le a ,则 a=b ; 传递性:若 a\le b 且 b\le c ,则 a\le c ; 完全性: a\le b 或者 b\le a 。 证明: 考虑做一个到一般容斥原理的映射。对于 x\in S ,假设 x 是第 k 大的元素。那么我们定义一个映射 f:x\mapsto \{1,2,\cdots,k\} 。显然这是一个双射。
那么容易发现,对于 x,y\in S , f(\min(x,y))=f(x)\cap f(y) , f(\max(x,y))=f(x)\cup f(y) 。因此我们得到:
\begin{aligned} \left|f\left(\max_{i\in S}{x_i}\right)\right| &= \left| \bigcup_{i\in S} f(x_i) \right|\\ &= \sum_{T\subseteq S}(-1)^{|T|-1} \left|\bigcap_{j\in T}f(x_j)\right|\\ &= \sum_{T\subseteq S}(-1)^{|T|-1} \left|f\left(\min_{j\in T}{x_j}\right)\right|\\ \end{aligned} 然后再把 \left|f\left(\max_{i\in S}{x_i}\right)\right| 映射回 \max_{i\in S}{x_i} ,而 \min 是类似的。
证毕
但是你可能觉得这个式子非常蠢,最大值明明可以直接求。之所以 min-max 容斥这么重要,是因为它在期望上也是成立的,即:
E\left(\max_{i\in S}{x_i}\right)=\sum_{T\subseteq S}{(-1)^{|T|-1}E\left(\min_{j\in T}{x_j} \right)} E\left(\min_{i\in S}{x_i}\right)=\sum_{T\subseteq S}{(-1)^{|T|-1}E\left(\max_{j\in T}{x_j} \right)} 证明: 我们考虑计算期望的一种方法:
E\left(\max_{i\in S}{x_i}\right)=\sum_{y}{P(y=x)\max_{j\in S}{y_j}} 其中 y 是一个长度为 n 的序列。
我们对后面的 \max 使用之前的式子:
\begin{aligned}E\left(\max_{i\in S}{x_i}\right)&=\sum_{y}{P(y=x)\max_{j\in S}{y_j}}\\ &=\sum_{y}{P(y=x)\sum_{T\subseteq S}{(-1)^{|T|-1}\min_{j\in T}{y_j}}} \end{aligned} 调换求和顺序:
\begin{aligned}E\left(\max_{i\in S}{x_i}\right) &=\sum_{y}{P(y=x)\sum_{T\subseteq S}{(-1)^{|T|-1}\min_{j\in T}{y_j}}}\\ &=\sum_{T\subseteq S}{(-1)^{|T|-1}\sum_y{P(y=x)\min_{j\in T}{y_j}}}\\ &=\sum_{T\subseteq S}{(-1)^{|T|-1}E\left(\min_{j\in T}{y_j}\right)} \end{aligned} \min 是类似的。
证毕
还有更强的:
\underset{i\in S}{\operatorname{kthmax}{x_i}}=\sum_{T\subseteq S}{(-1)^{|T|-k}\dbinom {|T|-1}{k-1}\min_{j\in T}{x_j}} \underset{i\in S}{\operatorname{kthmin}{x_i}}=\sum_{T\subseteq S}{(-1)^{|T|-k}\dbinom {|T|-1}{k-1}\max_{j\in T}{x_j}} E\left(\underset{i\in S}{\operatorname{kthmax}{x_i}}\right)=\sum_{T\subseteq S}{(-1)^{|T|-k}\dbinom {|T|-1}{k-1}E\left(\min_{j\in T}{x_j}\right)} E\left(\underset{i\in S}{\operatorname{kthmin}{x_i}}\right)=\sum_{T\subseteq S}{(-1)^{|T|-k}\dbinom {|T|-1}{k-1}E\left(\max_{j\in T}{x_j}\right)} 规定若 n< m ,则 \dbinom nm=0 。
证明: 不妨设 \forall 1\le i<n,x_i\le x_{i+1} 。则有:
\begin{aligned} \sum_{T\subseteq S}{(-1)^{|T|-k}\dbinom {|T|-1}{k-1}\min_{j\in T}{x_j}} &=\sum_{i\in S}{x_i\sum_{T\subseteq S}{(-1)^{|T|-k}\dbinom {|T|-1}{k-1}\left[x_i=\min_{j\in T}{x_j} \right]}}\\ &=\sum_{i\in S}{x_i\sum_{j=k}^n{\dbinom {n-i}{j-1}\dbinom {j-1}{k-1}(-1)^{j-k}}} \end{aligned} 又因为有组合恒等式: \dbinom ab\dbinom bc=\dbinom ac\dbinom {a-c}{b-c} ,所以有:
\begin{aligned} \sum_{T\subseteq S}{(-1)^{|T|-k}\dbinom {|T|-1}{k-1}\min_{j\in T}{x_j}} &=\sum_{i\in S}{x_i\sum_{j=k}^n{\dbinom {n-i}{j-1}\dbinom {j-1}{k-1}(-1)^{j-k}}}\\ &=\sum_{i\in S}{x_i\sum_{j=k}^n{\dbinom {n-i}{k-1}\dbinom {n-i-k+1}{j-k}(-1)^{j-k}}}\\ &=\sum_{i\in S}{\dbinom {n-i}{k-1}x_i\sum_{j=k}^n{\dbinom {n-i-k+1}{j-k}(-1)^{j-k}}}\\ &=\sum_{i\in S}{\dbinom {n-i}{k-1}x_i\sum_{j=0}^{n-i-k+1}{\dbinom {n-i-k+1}j(-1)^{j}}} \end{aligned} 当 i=n-k+1 时:
\dbinom {n-i}{k-1}\sum_{j=0}^{n-i-k+1}{\dbinom {n-i-k+1}j(-1)^{j}}=1 否则:
\dbinom {n-i}{k-1}\sum_{j=0}^{n-i-k+1}{\dbinom {n-i-k+1}j(-1)^{j}}=0 所以:
\sum_{i\in S}{\dbinom {n-i}{k-1}x_i\sum_{j=0}^{n-i-k+1}{\dbinom {n-i-k+1}j(-1)^{j}}}=\underset{i\in S}{\operatorname{kthmax}}{x_i} 剩下三个是类似的。
证毕
根据 min-max 容斥,我们还可以得到下面的式子:
\underset{i\in S}{\operatorname{lcm}}{x_i}=\prod_{T\subseteq S}{\left(\gcd_{j\in T}{x_j} \right)^{(-1)^{|T|-1}}} 因为 \operatorname{lcm},\gcd,a^{1},a^{-1} 分别相当于 \max,\min,+,- ,就是说相当于对于指数做了一个 min-max 容斥,自然就是对的了
PKUWC2018 随机游走 PKUWC2018 随机游走 给定一棵 n 个点的树,你从 x 出发,每次等概率随机选择一条与所在点相邻的边走过去。
有 Q 次询问。每次询问给出一个集合 S ,求如果从 x 出发一直随机游走,直到点集 S 中的点都至少经过一次的话,期望游走几步。
特别地,点 x (即起点)视为一开始就被经过了一次。
对 998244353 取模。
1\le n\le 18,1\le Q\le 5000,1\le |S|\le n 。
期望游走的步数也就是游走的时间。那么设随机变量 x_i 表示第一次走到结点 i 的时间。那么我们要求的就是
E\left(\max_{i\in S}x_i\right) 使用 min-max 容斥可以得到
E\left(\max_{i\in S}x_i\right) =E\left(\sum_{T\subseteq S}(-1)^{|T|-1}\min_{i\in T}x_i\right) =\sum_{T\subseteq S}(-1)^{|T|-1}E\left(\min_{i\in T}x_i\right) 对于一个集合 T\in[n] ,考虑求出 F(T)=E(\min_{i\in T}x_i) 。
考虑 E(\min_{i\in T}x_i) 的含义,是第一次走到 T 中某一个点的期望时间。不妨设 f(i) 表示从结点 i 出发,第一次走到 T 中某个结点的期望时间。
对于 i\in T ,有 f(i)=0 。 对于 i\notin T ,有 f(i)=1+\frac{1}{\text{deg}(i)}\sum_{(i,j)\in E}f(j) 。 如果直接高斯消元,复杂度 O(n^3) 。那么我们对每个 T 都计算 F(T) 的总复杂度就是 O(2^nn^3) ,不能接受。我们使用树上消元的技巧。
不妨设根结点是 1 ,结点 u 的父亲是 p_u 。对于叶子结点 i , f(i) 只会和 i 的父亲有关(也可能 f(i)=0 ,那样更好)。因此我们可以把 f(i) 表示成 f(i)=A_i+B_if(p_i) 的形式,其中 A_i,B_i 可以快速计算。
对于非叶结点 i ,考虑它的儿子序列 j_1,\cdots,j_k 。由于 f(j_e)=A_{j_e}+B_{j_e}f(i) 。因此可以得到
f(i)=1+\frac{1}{\deg(i)}\sum_{e=1}^k\left(A_{j_e}+B_{j_e}f(i)\right)+\frac{f(p_i)}{\deg(i)} 那么变换一下可以得到
f(i)=\frac{\deg(i)+\sum_{e=1}^kA_{j_e}}{\deg(i)-\sum_{e=1}^kB_{j_e}}+ \frac{f(p_i)}{\deg(i)-\sum_{e=1}^kB_{j_e}} 于是我们把 f(i) 也写成了 A_i+B_if(p_i) 的形式。这样可以一直倒推到根结点。而根结点没有父亲。也就是说
f(1)=\frac{\deg(1)+\sum_{e=1}^kA_{j_e}}{\deg(1)-\sum_{e=1}^kB_{j_e}} 解一下这个方程我们就得到了 f(1) ,再从上往下推一次就得到了每个点的 f(i) 。那么 F(T)=f(x) 。时间复杂度 O(n) 。
这样,我们可以对于每一个 T 计算出 F(T) ,时间复杂度 O(2^nn) 。
回到容斥的部分,我们知道 E(\max_{i\in S}x_i)=\sum_{T\subseteq S}(-1)^{|T|-1}F(T) 。
不妨设 F'(T)=(-1)^{|T|-1}F(T) ,那么进一步得到 E(\max_{i\in S}x_i)=\sum_{T\subseteq S}F'(T) 。因此可以使用 FMT(也叫子集前缀和,或者 FWT 或变换)在 O(2^nn) 的时间内对每个 S 计算出 E(\max_{i\in S}x_i) ,这样就可以 O(1) 回答询问了。
参考文献 王迪《容斥原理》,2013 年信息学奥林匹克中国国家队候选队员论文集
Cyhlnj《有标号的 DAG 计数系列问题》
Wikipedia - 全序关系
build 本页面最近更新: ,更新历史 edit 发现错误?想一起完善? 在 GitHub 上编辑此页! people 本页面贡献者:OI-wiki copyright 本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用