|
| 1 | +--- |
| 2 | +title: U统计量计算新算法 |
| 3 | +date: 2025-09 |
| 4 | +author: 陈星宇 |
| 5 | +categories: |
| 6 | + - 统计计算 |
| 7 | + - 统计软件 |
| 8 | +tags: |
| 9 | + - U统计量 |
| 10 | + - 统计计算 |
| 11 | + - Einsum |
| 12 | + - 图论 |
| 13 | + - 树宽 |
| 14 | +--- |
| 15 | + |
| 16 | +# U统计量计算新算法 |
| 17 | + |
| 18 | +## U统计量的定义 |
| 19 | +在统计理论中,$U$统计量一直是研究者的“心头好”。它最大的优势在于:能够轻松构造**无偏估计**,名字里的 $U$ 其实就是 “unbiased” 的缩写。 |
| 20 | + |
| 21 | +不过,虽然原理简单,$U$统计量的计算却常常令人头疼。先来看$m$阶$U$统计量的一般形式: |
| 22 | + |
| 23 | +$$ |
| 24 | + \mathbb{U}_{m}(h) = \frac{1}{n(n-1)(n-2)\cdots(n-m-1)}\sum_{1 \le i_1 \neq i_2 \neq \cdots \neq i_m \le n} h(X_{i_1}, X_{i_2}, \cdots, X_{i_m}),\qquad\qquad (1) |
| 25 | +$$ |
| 26 | + |
| 27 | +其中,$X_1, X_2, \cdots, X_n \in \Omega \subseteq \mathbb{R}^{p}$ 是 $n$ 个独立同分布的样本;$h : \Omega^m \to \mathbb{R}$ 称为核函数;指标条件 $i_1 \neq i_2 \neq \cdots \neq i_m$ 表示取的$m$个样本互不相同因此互相独立。 |
| 28 | + |
| 29 | +$U$统计量之所以重要,在于它天然满足无偏性: |
| 30 | + |
| 31 | +$$ |
| 32 | + \mathbb{E} [ \mathbb{U}_{m} (h)] = \mathbb{E} [h(X_{1}, X_{2}, \cdots, X_{m}) ], |
| 33 | +$$ |
| 34 | + |
| 35 | +其中 $X_{1}, X_{2}, \cdots, X_{m}$ 是相互独立同分布的随机变量。换句话说,$U$统计量就是把所有可能的互不相等的$m$元样本组都带入核函数 $h$ 计算,再取平均值,从而得到一个对目标参数的无偏估计。 |
| 36 | + |
| 37 | +$U$统计量常常和它的“双胞胎”-$V$统计量一起提及,$m$阶$V$统计量的定义为: |
| 38 | +$$ |
| 39 | + \mathbb{V}_{m}(h) = \frac{1}{n^m}\sum_{1 \le i_1, i_2,\cdots, i_m \le n} h(X_{i_1}, X_{i_2}, \cdots, X_{i_m}).\qquad\qquad (2) |
| 40 | +$$ |
| 41 | + |
| 42 | +注意$U$和$V$的区别就在于计算中指标是否存在限制,$V$统计量的计算中对指标$(i_1, i_2,\cdots, i_m)$没有任何限制,因此总共有$n^m$个值。 |
| 43 | + |
| 44 | +很容易可以看出来,$V$统计量可以表示成一组$U$统计量的线性组合(就是加加减减乘乘),反过来$U$统计量也可以表示成一组$V$统计量的线性组合(例子在稍后展示)。所以只要有一方可以高效计算,另一方就可以通过线性组合得到,我们算法就是这样子做! |
| 45 | + |
| 46 | +--- |
| 47 | + |
| 48 | +### 一个例子:方差估计 |
| 49 | +最常见的例子就是方差的无偏估计。假设维度$p =1$, $X_1, X_2$ 是独立同分布(和$X$同分布)的随机变量,那么: |
| 50 | + |
| 51 | +$$ |
| 52 | +\begin{aligned} |
| 53 | + \mathsf{var}(X) &= \frac{1}{2}\mathbb{E}[ (X_1 - X_2)^2] \\[6pt] |
| 54 | + &= \frac{1}{2}(\mathbb{E}[ X_1^2] + \mathbb{E}[ X_2^2] - 2\mathbb{E}[X_1] \mathbb{E}[X_2] ) \\[6pt] |
| 55 | + &= \mathbb{E}[ X^2] - (\mathbb{E}[X])^2 \\[6pt] |
| 56 | + &= \mathbb{E}[ (X -\mathbb{E}[X])^2]. |
| 57 | +\end{aligned} |
| 58 | +$$ |
| 59 | + |
| 60 | +因此,基于$U$统计量的方差估计量就是: |
| 61 | + |
| 62 | +$$ |
| 63 | +\begin{aligned} |
| 64 | + \widehat{\mathsf{var}}(X) &= \frac{1}{2n(n-1)} \sum_{1 \le i_1 \neq i_2 \le n} (X_{i_1} - X_{i_2})^2 \\[6pt] |
| 65 | + & = \frac{1}{n-1} \sum_{1 \le i \le n} (X_{i} - \bar{X})^2, |
| 66 | + \end{aligned} |
| 67 | +$$ |
| 68 | + |
| 69 | +其中 $\bar{X} = \frac{1}{n}\sum_{i=1}^n X_i$ 是样本均值。换句话说,我们熟悉的方差无偏估计公式,其实就是一个二阶 $U$ 统计量。 |
| 70 | + |
| 71 | +--- |
| 72 | + |
| 73 | +## 计算难题 |
| 74 | +回到公式 (1)。如果直接用 for 循环枚举$m$阶组合来计算,那么复杂度是 $O(n^m)$(假设$h$的计算复杂度与$n$无关)。 作为对比,矩阵乘法或矩阵求逆的复杂度是 $O(n^3)$,因此,一旦阶数 $m > 3$,$U$统计量的计算往往会变得难以承受。 |
| 75 | + |
| 76 | +而偏偏,我们关注的统计量就是高阶$U$统计量。James M. Robins 等人在 2008 年提出的 **高阶影响函数(Higher Order Influence Function, HOIF)**,在各种假设下均能达到最优估计速率。HOIF 是一个高阶 $U$统计量,最优阶数大约是 $m \sim \sqrt{\log(n)}$。这意味着,HOIF 的实际应用必须直面高阶 $U$ 统计量的计算挑战。 |
| 77 | + |
| 78 | +m ($m \ge 2$) 阶HOIF的计算可以化简为核函数为$\{ h^{HOIF}_{j} \}_{j=2}^{m}$的$U$统计量的线性组合,核函数$h^{HOIF}_{j}$可以简化为以下形式: |
| 79 | + |
| 80 | +$$ |
| 81 | + h^{HOIF}_{j}(X_1,X_2,\cdots,X_j) = X_1^{\top}X_2 \cdot X_2^{\top}X_3 \cdots X_{j-1}^{\top}X_{j}, \qquad (3) |
| 82 | +$$ |
| 83 | + |
| 84 | +由于这个递推规律,我们可以直接关心$h^{HOIF}_{m}$对应的$U$统计量的计算。我们设计了一套新算法。结果令人惊喜:在 $m=3,4,5,6,7$ 时,计算复杂度居然都只是 **$O(n^3)$**(更一般的规律在阅读完本文后你就会明白) ,$n=10000, m=7$时,$\mathbb{U}_{7} [h^{HOIF}_{7}]$在一张RTX4090上只需要跑$12$秒。 |
| 85 | + |
| 86 | +更进一步,我们发现这套方法并不局限于 HOIF对应的这一类$U$统计量,而是可以推广到**任意 $U$ 统计量**。借助图论工具,我们能够准确刻画出该算法的“最乐观”复杂度上界。 |
| 87 | +更妙的是,实际实现完全可以依赖Numpy和PyTorch 提供的 **Einsum 函数**,天然支持 GPU 和 CPU 并行,从而在工程上也十分高效。 |
| 88 | + |
| 89 | +--- |
| 90 | +## 新算法 |
| 91 | + |
| 92 | +接下来我们介绍新算法的实现。核心工具是 Python 库中提供的强大函数 [numpy.einsum](https://numpy.org/doc/stable/reference/generated/numpy.einsum.html) 和 [torch.einsum](https://pytorch.org/docs/stable/generated/torch.einsum.html)。 |
| 93 | +这两个函数的底层实现都经过高度优化,尤其是 `torch.einsum`,可以方便地利用 **CPU 与 GPU 并行**,在工程上极具优势。 |
| 94 | + |
| 95 | +--- |
| 96 | + |
| 97 | +### Einsum |
| 98 | + |
| 99 | +那么,Einsum 究竟做了什么? |
| 100 | +简单来说,Einsum 是一种针对张量的高效操作方式:输入若干张量,指定索引规则,对部分或全部指标执行无约束求和,最终输出一个新的张量或常数。 |
| 101 | + |
| 102 | +下表给出几个常见例子: |
| 103 | + |
| 104 | +| Einsum 调用格式 | 对应结果 | |
| 105 | +|:---------------------------------|:---------------------------------------------| |
| 106 | +| `np.einsum('ij,jk->ik', A, B)` | $D_{ik} = \sum_j A_{ij} B_{jk}$ | |
| 107 | +| `np.einsum('ijk->i', X)` | $D_i = \sum_{j,k} X_{ijk}$ | |
| 108 | +| `np.einsum('ij,jk,kl-> ', A,B,C)`| $D = \sum_{i,j,k,l} A_{ij} B_{jk} C_{kl}$ | |
| 109 | +| `np.einsum('ijk,jjk,kkl-> ', A,B,C)`| $D = \sum_{i,j,k,l} A_{ijk} B_{jjk} C_{kkl}$| |
| 110 | + |
| 111 | +在表达式 `'ij,j->j'` 中,`->` 左边指定输入张量的指标分布,右边表示最终保留的指标。如果某个指标只出现在左边而没出现在右边,它就会被求和“消去”。 |
| 112 | +这个记号起源于 **Einstein 求和约定**(1916 年提出),矩阵与高阶张量的绝大多数运算都能通过 Einsum 表达,而在处理三阶及以上张量时,它往往是最简洁、最高效的工具。 |
| 113 | + |
| 114 | +--- |
| 115 | + |
| 116 | +读到这里,你可能已经注意到 Einsum 和 $V$ 统计量的天然联系。事实上,所有的 $V$ 统计量都可以直接用 Einsum 表示: |
| 117 | +只要核函数 $h$ 能够写成乘法分解形式,$V$ 统计量的计算就可以转化为一个张量求和问题;如果 $h$ 不能分解,那就相当于一个整体张量,复杂度无法进一步降低。 |
| 118 | + |
| 119 | +一个典型的例子是高阶影响函数(HOIF)中的核函数: |
| 120 | + |
| 121 | +$$ |
| 122 | +\begin{aligned} |
| 123 | + h^{HOIF}_{m}(X_1,X_2,\cdots,X_m) |
| 124 | + &= X_1^{\top}X_2 \cdot X_2^{\top}X_3 \cdots X_{m-1}^{\top}X_{m} \\ |
| 125 | + &= f(X_1,X_2) \cdot f(X_2,X_3) \cdots f(X_{m-1},X_{m}), |
| 126 | +\end{aligned} |
| 127 | +$$ |
| 128 | + |
| 129 | +其中 $f(X,Y) = X^{\top}Y$ 是一个标量函数。 |
| 130 | +对数据 $X_1,X_2,\cdots,X_n$,我们可以构造一个 $n \times n$ 矩阵 $T$: |
| 131 | + |
| 132 | +$$ |
| 133 | + T_{ij} = f(X_i,X_j) = X_i^{\top}X_j. |
| 134 | +$$ |
| 135 | + |
| 136 | +于是,$h^{HOIF}_{m}$ 对应的 $V$ 统计量就可以写成: |
| 137 | + |
| 138 | +$$ |
| 139 | +\begin{aligned} |
| 140 | +\mathbb{V}_{m}[ h^{HOIF}_{m}] |
| 141 | +&= \frac{1}{n^m} \sum_{1\le i_1,i_2,\cdots,i_m \le n} |
| 142 | + T_{i_1,i_2}\cdot T_{i_2,i_3} \cdots T_{i_{m-1},i_{m}} \\[6pt] |
| 143 | +&= \frac{1}{n^m} \,\mathsf{Einsum}\big( ``i_1i_2,i_2i_3,\cdots,i_{m-1}i_m -> ", T,T,\cdots,T \big). |
| 144 | +\end{aligned} |
| 145 | +$$ |
| 146 | + |
| 147 | +换句话说,Einsum 提供了一种自然而高效的方式来计算 $V$ 统计量。而由于 $U$ 统计量和 $V$ 统计量之间存在可以互相转化的关系(只要能高效算一个,就能高效算另一个),这就为我们建立 $U$ 统计量的高效算法奠定了基础。接下来要做的,就是找到合适的公式,把 $U$ 拆解成 $V$。 |
| 148 | + |
| 149 | +### $U$ 拆 $V$ |
| 150 | + |
| 151 | +我们先来找规律。先看二阶的情况: |
| 152 | + |
| 153 | +$$ |
| 154 | +\begin{aligned} |
| 155 | + n(n-1)\cdot \mathbb{U}_{2}[h] & = \sum_{1 \le i_1 \neq i_2 \le n} h(X_{i_1},X_{i_2}) \\[6pt] |
| 156 | + & = \Big(\sum_{1 \le i_1, i_2 \le n} - \sum_{1 \le i_1=i_2 \le n} \Big) h(X_{i_1},X_{i_2}) \\[6pt] |
| 157 | + & = n^2 \mathbb{V}_{2}[h] - n \mathbb{V}_{1,1=2}[h]. |
| 158 | +\end{aligned} |
| 159 | +$$ |
| 160 | + |
| 161 | +这里我们暂且用 $\mathbb{V}_{1,1=2}[h]$ 表示求和 |
| 162 | +$$ |
| 163 | +\frac{1}{n}\sum_{1 \le i_1=i_2 \le n} h(X_{i_1},X_{i_2}), |
| 164 | +$$ |
| 165 | +它退化成了一个一阶 $V$ 统计量。 |
| 166 | + |
| 167 | +接下来看三阶的情况。为了简化符号,我们暂时省略掉指标范围 $1\sim n$ 以及归一化因子(如 $n(n-1)(n-2),n^3$ 等): |
| 168 | + |
| 169 | +$$ |
| 170 | +\begin{aligned} |
| 171 | + \mathbb{U}_{3}[h] & = \sum_{i_1 \neq i_2 \neq i_3} h(X_{i_1},X_{i_2},X_{i_3}) \\[6pt] |
| 172 | + & = \Big(\sum_{i_1,i_2,i_3} - \sum_{(i_1=i_2)\ne i_3 } - \sum_{(i_1=i_3)\ne i_2 } - \sum_{(i_2=i_3)\ne i_1 } - \sum_{i_1=i_2=i_3}\Big) h(X_{i_1},X_{i_2},X_{i_3}) \\[6pt] |
| 173 | + & = \mathbb{V}_{3}[h] - \mathbb{U}_{2,1=2}[h] - \mathbb{U}_{2,1=3}[h] - \mathbb{U}_{2,2=3}[h] - \mathbb{U}_{1,1=2=3}[h]. \qquad (5) |
| 174 | +\end{aligned} |
| 175 | +$$ |
| 176 | + |
| 177 | +在这里,$(i_1=i_2)\ne i_3$ 表示 $i_1=i_2=i$ 且 $i\neq i_3$。也就是说只剩下两个指标 $(i,i_3)$,对应一个二阶 $U$ 统计量,记作 $\mathbb{U}_{2,1=2}$(忽略归一化因子 $\tfrac{1}{n(n-1)}$)。其他几个符号同理。注意一阶 $U$ 统计量和一阶 $V$ 统计量是一样的。 |
| 178 | + |
| 179 | +因此,$\mathbb{U}_3$ 被拆成了 $\mathbb{V}_3$ 和更低阶的 $U$ 统计量。而低阶 $U$ 我们已经能写成 $V$ 的组合,所以顺着这个递推关系,就能得到一个一般的“$U$ 拆 $V$”算法。继续推下去: |
| 180 | + |
| 181 | +$$ |
| 182 | +\begin{aligned} |
| 183 | + \mathbb{U}_{3}[h] |
| 184 | + &= \mathbb{V}_{3}[h] - \mathbb{U}_{2,1=2}[h] - \mathbb{U}_{2,1=3}[h] - \mathbb{U}_{2,2=3}[h] - \mathbb{U}_{1,1=2=3}[h] \\[6pt] |
| 185 | + &= \mathbb{V}_{3}[h] - \big(\mathbb{V}_{2,1=2} - \mathbb{V}_{1,1=2=3}\big)[h] - \big(\mathbb{V}_{2,1=3} - \mathbb{V}_{1,1=2=3}\big)[h] \\[6pt] |
| 186 | + &\quad - \big(\mathbb{V}_{2,2=3} - \mathbb{V}_{1,1=2=3}\big)[h] - \mathbb{V}_{1,1=2=3}[h] \\[6pt] |
| 187 | + &= \mathbb{V}_{3}[h] - \mathbb{V}_{2,1=2}[h] - \mathbb{V}_{2,1=3}[h] - \mathbb{V}_{2,2=3}[h] + 2\mathbb{V}_{1,1=2=3}[h]. |
| 188 | +\end{aligned} |
| 189 | +$$ |
| 190 | + |
| 191 | +--- |
| 192 | + |
| 193 | +#### 更优雅的数学描述 |
| 194 | + |
| 195 | +但是,我们再仔细看看,能不能有个更优雅的数学刻画呢? 仔细观察公式 $(5)$,它其实表明:**一个 $V$ 统计量可以拆成若干 $U$ 统计量的和**,并且系数都是 $1$: |
| 196 | + |
| 197 | +$$ |
| 198 | + \mathbb{V}_{3}[h]= \mathbb{U}_{3}[h] + \mathbb{U}_{2,1=2}[h] + \mathbb{U}_{2,1=3}[h] + \mathbb{U}_{2,2=3}[h] + \mathbb{U}_{1,1=2=3}[h]. |
| 199 | +$$ |
| 200 | + |
| 201 | +这里的不同符号,其实对应于 $\{1,2,3\}$ 的不同 **划分**。一个有限集合的划分,就是它的所有分组方式。$\{1,2,3\}$ 的划分有: |
| 202 | + |
| 203 | +$$ |
| 204 | +\{\{1\},\{2\},\{3\}\}, \quad |
| 205 | +\{\{1,2\},\{3\}\}, \quad |
| 206 | +\{\{1,3\},\{2\}\}, \quad |
| 207 | +\{\{2,3\},\{1\}\}, \quad |
| 208 | +\{\{1,2,3\}\}. |
| 209 | +$$ |
| 210 | + |
| 211 | +例如,划分 $\{\{1,2\},\{3\}\}$ 表示把 $1,2$ 放在一组,$3$ 单独一组;对应的约束就是 $i_1=i_2$作为一个新指标,而 $i_3$ 是另一个独立指标。 |
| 212 | + |
| 213 | +于是我们可以引入一个记号:对每个划分 $\pi$,定义相应的受限 $U$ 统计量和 $V$ 统计量(忽略平均因子): |
| 214 | + |
| 215 | +$$ |
| 216 | +\begin{aligned} |
| 217 | + \pi = \{\{1\},\{2\},\{3\}\},\quad & \mathbb{V}[\pi](h) = \sum_{i_1,i_2,i_3} h, \quad\ \ \ \mathbb{U}[\pi](h) = \sum_{i_1\neq i_2 \neq i_3} h, \\[6pt] |
| 218 | + \pi = \{\{1,2\},\{3\}\},\quad & \mathbb{V}[\pi](h) = \sum_{i_1=i_2,i_3} h, \quad \mathbb{U}[\pi](h) = \sum_{(i_1=i_2)\neq i_3} h, \\[6pt] |
| 219 | + \pi = \{\{1,3\},\{2\}\},\quad & \mathbb{V}[\pi](h) = \sum_{i_1=i_3,i_2} h, \quad \mathbb{U}[\pi](h) = \sum_{(i_1=i_3)\neq i_2} h, \\[6pt] |
| 220 | + \pi = \{\{2,3\},\{1\}\},\quad & \mathbb{V}[\pi](h) = \sum_{i_2=i_3,i_1} h, \quad \mathbb{U}[\pi](h) = \sum_{(i_2=i_3)\neq i_1} h, \\[6pt] |
| 221 | + \pi = \{\{1,2,3\}\},\quad & \mathbb{V}[\pi](h) = \sum_{i_1=i_2=i_3} h, \quad \mathbb{U}[\pi](h) = \sum_{i_1=i_2=i_3} h. |
| 222 | +\end{aligned} |
| 223 | +$$ |
| 224 | + |
| 225 | +--- |
| 226 | + |
| 227 | +#### 一般公式 |
| 228 | + |
| 229 | +上面的定义可以完美推广出去,有了这个数学的形式化,就能写出一个漂亮的恒等式。对任意 $m$ 阶: |
| 230 | + |
| 231 | +$$ |
| 232 | +\mathbb{V}_{m}[h] = \mathbb{V}[\pi_{m}](h) = \sum_{\pi \in \Pi_m} \mathbb{U}[\pi](h), |
| 233 | +$$ |
| 234 | + |
| 235 | +其中: |
| 236 | +- $\Pi_m$ 是集合 $\{1,2,\dots,m\}$ 的所有划分, |
| 237 | +- $\pi_m = \{\{1\},\{2\},\dots,\{m\}\}$ 是每个指标单独成组。 |
| 238 | + |
| 239 | +$\Pi_{m}$上有一个天然的偏序(就是一个比大小的关系),谁分的更精细,谁就更大,什么是精细的意思呢?你应该可以自己猜出来了,比如说 |
| 240 | +$$ |
| 241 | +\pi_2 = \{ \{ 1\},\{ 2 \} \} > \{ \{ 1, 2\} \},\\ |
| 242 | +\pi_3 = \{ \{ 1\},\{ 2 \}, \{3\} \} > \{ \{ 1, 2\}, \{3\} \} > \{ \{1,2,3\} \}. |
| 243 | +$$ |
| 244 | +所以精细的意思是,本来某个组里还可以再分,他却没有分,如果你把这一组又继续细分了,你就更精细,你就更大。但是并不是所有的分组方式都可以比较,比如: |
| 245 | +$$ |
| 246 | +\{ \{ 1, 2\}, \{3\} \},\{ \{ 1, 3\}, \{2\} \},\{ \{ 2, 3\}, \{1\} \} 均无法互相比较 |
| 247 | +$$ |
| 248 | +但是我们注意到$\pi_{m} = \{ \{ 1\},\{ 2 \},\cdots,\{m\}\} $是可以和任何划分比较的,它比任何划分都更大,他是最精细的划分,于是,我们的公式可以写成: |
| 249 | + |
| 250 | +$$ |
| 251 | +\mathbb{V}_{m}[h] = \sum_{\pi \le \pi_m} \mathbb{U}[\pi](h). |
| 252 | +$$ |
| 253 | + |
| 254 | +并且很容易可以证明不只是$\pi_m$, 对任意的划分$\pi$, 都有这个关系: |
| 255 | + |
| 256 | +$$ |
| 257 | +\mathbb{V}[\pi](h) = \sum_{\rho \le \pi} \mathbb{U}[\rho](h), \forall \pi \in \Pi_m. \qquad (6) |
| 258 | +$$ |
| 259 | + |
| 260 | +--- |
| 261 | + |
| 262 | +#### 莫比乌斯反演得到最终公式 |
| 263 | + |
| 264 | +到了这一步之后,组合的数学家已经为我们准备好了一切--[莫比乌斯反演公式(Möbius inversion formula)](https://en.wikipedia.org/wiki/M%C3%B6bius_inversion_formula#On_posets): |
| 265 | + |
| 266 | +在有限偏序集(这里就是 $\Pi_m$)上,莫比乌斯函数 $\mu$ 可以递归定义: |
| 267 | + |
| 268 | +$$ |
| 269 | +\mu(\pi,\pi) = 1, \quad |
| 270 | +\mu(\pi,\rho) = - \sum_{\pi \le \sigma < \rho } \mu(\pi, \sigma), \quad \pi\neq\rho. |
| 271 | +$$ |
| 272 | + |
| 273 | +$\Pi_m$上的这个莫比乌斯函数$\mu$早就有公式了,我们不必再计算。如果一对函数 $f,g$ 满足 |
| 274 | + |
| 275 | +$$ |
| 276 | +g(\pi) = \sum_{\rho \le \pi} f(\rho), \quad \forall \pi \in \Pi_m, |
| 277 | +$$ |
| 278 | + |
| 279 | +那么必有 |
| 280 | + |
| 281 | +$$ |
| 282 | +f(\pi) = \sum_{\rho \le \pi} g(\rho)\,\mu(\rho,\pi), \quad \forall \pi \in \Pi_m. |
| 283 | +$$ |
| 284 | + |
| 285 | +套用到我们的情形(令 $g(\pi) = \mathbb{V}[\pi](h), f(\pi) = \mathbb{U}[\pi](h)$),得到: |
| 286 | + |
| 287 | +$$ |
| 288 | +\mathbb{U}[\pi](h) = \sum_{\rho \le \pi} \mathbb{V}[\rho](h)\,\mu(\rho,\pi), \quad \forall \pi \in \Pi_m. \qquad (7) |
| 289 | +$$ |
| 290 | + |
| 291 | +我们最终关心的是 $\pi=\pi_m$ 的情况: |
| 292 | + |
| 293 | +$$ |
| 294 | +\mathbb{U}_m[h] = \mathbb{U}[\pi_m](h) = \sum_{\pi \le \pi_m} \mathbb{V}[\pi](h) \mu(\pi,\pi_m) = \sum_{\pi \in \Pi_{m}} \mu_{\pi} \mathbb{V}[\pi](h). |
| 295 | +$$ |
| 296 | + |
| 297 | +其中若 $\pi=\{\pi_1,\pi_2,\dots,\pi_K\}$,每个 $\pi_i$ 含有 $n_i$ 个指标,则 |
| 298 | + |
| 299 | +$$ |
| 300 | +\mu(\pi,\pi_m) = \mu_{\pi} = (-1)^{m-K}\,(n_1-1)!\,(n_2-1)!\cdots(n_K-1)!. |
| 301 | +$$ |
| 302 | + |
| 303 | +比如回到$m=3$的例子,注意$n! = n(n-1)(n-2)\cdots 1,0! =1,(-1)^{0}=1$. |
| 304 | +$$ |
| 305 | +\begin{aligned} |
| 306 | + \pi = \{\{1\},\{2\},\{3\}\}, \quad & \mu_{\pi} = (-1)^{3-3} (1 -1)! (1 -1)! (1 -1)! = + 1\\ |
| 307 | + \pi = \{\{1,2\},\{3\}\}, \quad &\mu_{\pi} = (-1)^{3-2} (2 -1)! (1 -1)! = - 1\\ |
| 308 | + \pi = \{\{1,3\},\{2\}\},\quad &\mu_{\pi} = (-1)^{3-2} (2 -1)! (1 -1)! = - 1\\ |
| 309 | + \pi = \{\{2,3\},\{1\}\}, \quad &\mu_{\pi} = (-1)^{3-2} (2 -1)! (1 -1)! = - 1\\ |
| 310 | + \pi = \{\{1,2,3\}\}, \quad & \mu_{\pi} = (-1)^{3-1} (3 -1)! = + 2\\ |
| 311 | +\end{aligned} |
| 312 | +$$ |
0 commit comments