斯坦纳树

斯坦纳树问题是组合优化问题,与最小生成树相似,是最短网络的一种。最小生成树是在给定的点集和边中寻求最短网络使所有点连通。而最小斯坦纳树允许在给定点外增加额外的点,使生成的最短网络开销最小。

问题引入

19 世纪初叶,柏林大学几何方面的著名学者斯坦纳,研究了一个非常简单却很有启示性的问题:将三个村庄用总长为极小的道路连接起来。从数学上说,就是在平面内给定三个点 A B C 找出平面内第四个点 P ,使得和数 a+b+c 为最短,这里 a b c 分别表示从 P A B C 的距离。

问题的答案是:如果三角形 \textit{ABC} 的每个内角都小于 120^{\circ} ,那么 P 就是使边 \textit{AB} \textit{BC} \textit{AC} 对该点所张的角都是 120^{\circ} 的点。如果三角形 \textit{ABC} 的有一个角,例如 C 角,大于或等于 120^{\circ} ,那么点 P 与顶点 C 重合。

问题推广

  1. 在斯坦纳问题中,给定了三个固定点 A,B,C 。很自然地可以把这个问题推广到给定 n 个点 A_1,A_2,\dots,A_n 的情形;我们要求出平面内的点 P ,使距离和 a_1+a_2+\dots+a_n 为极小,其中 a_i 是距离 PA_i

  2. 考虑到点的其他相关因素,加入了权重的表示。 n 个点的其他相关因素可以换算成一个权重表示,求出平面内的点 P ,使距离与权重的乘积的总和 a_1\cdot w_1+a_2\cdot w_2+\dots+a_n\cdot w_n 为极小,其中 w_i 是每个点的权重。

  3. 库朗(R.Courant)和罗宾斯(H.Robbins)提出第一个定义的推广是肤浅的。为了求得斯坦纳问题真正有价值的推广,必须放弃寻找一个单独的点 P ,而代之以具有最短总长的"道路网"。数学上表述成:给定 n 个点 A_1,A_2,\cdots,A_n ,试求连接此 n 个点,总长最短的直线段连接系统,并且任意两点都可由系统中的直线段组成的折线连接起来。他们将此新问题称为 斯坦纳树问题。在给定 n 个点的情形,最多将有 n-2 个复接点(斯坦纳点)。过每一斯坦纳点,至多有三条边通过。若为三条边,则它们两两交成 120^{\circ} 角;若为两条边,则此斯坦纳点必为某一已给定的点,且此两条边交成的角必大于或等于 120^{\circ}

连接三个以上的点的最短网络

steiner-tree1

在第一种情形,解是由五条线段组成的,其中有两个斯坦纳点(红色 s_1,s_2 ),在那里有三条线段相交且相互间的交角为 120^{\circ} 。第二种情形的解含有三个斯坦纳点。第三种情形,一个或几个斯坦纳点可能退化,或被一个或几个给定的点所代替。

我们将斯坦纳树的问题模型以图论形式呈现。

steiner-tree2

对于形式一,如果令关键点为 \{1,2,3,4\} ,可以发现若直接将这四个关键点相连的最小边权和是 12,显然这不是最优的。如果考虑使用 5 号节点那么最小边权和就会是 9,得到一个更优的答案。

对于形式二,如果令关键点为 \{1,2,3,4\} ,可以发现这四个关键点中的一些点甚至没有直接相连的边,必须考虑使用复接点(斯坦纳点)。这时将 5 号与 6 号都考虑进去可以得到最小边权和 11。

并且我们可以发现在两张图中 1 号和 4 号的斯坦纳点是退化的,被 1 号或 4 号代替了。

例题

首先以一道模板题来带大家熟悉最小斯坦纳树问题。见 【模板】最小斯坦纳树

题意已经很明确了,给定连通图 G 中的 n 个点与 k 个关键点,连接 k 个关键点,使得生成树的所有边的权值和最小。

结合上面的知识我们可以知道直接连接这 k 个关键点生成的权值和不一定是最小的,或者这 k 个关键点不会直接(相邻)连接。所以应当使用剩下的 n-k 个点。

我们使用状态压缩动态规划来求解。用 f(i,S) 表示以 i 为根的一棵树,包含集合 S 中所有点的最小边权值和。

考虑状态转移:

  • 首先对连通的子集进行转移, f(i,S)\leftarrow \min(f(i,S),f(i,T)+f(i,S-T))

  • 在当前的子集连通状态下进行边的松弛操作, f(i,S)\leftarrow \min(f(i,S),f(j,S)+w(j,i)) 。在下面的代码中用一个 tree[tot] 来记录两个相连节点 i,j 的相关信息。

参考实现
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
  #include <bits/stdc++.h>

  using namespace std;

  const int maxn = 510;
  const int INF = 0x3f3f3f3f;
  typedef pair<int, int> P;
  int n, m, k;

  struct edge {
    int to, next, w;
  } e[maxn << 1];

  int head[maxn << 1], tree[maxn << 1], tot;
  int dp[maxn][5000], vis[maxn];
  int key[maxn];
  priority_queue<P, vector<P>, greater<P> > q;

  void add(int u, int v, int w) {
    e[++tot] = edge{v, head[u], w};
    head[u] = tot;
  }

  void dijkstra(int s) {  // 求解最短路
    memset(vis, 0, sizeof(vis));
    while (!q.empty()) {
      P item = q.top();
      q.pop();
      if (vis[item.second]) continue;
      vis[item.second] = 1;
      for (int i = head[item.second]; i; i = e[i].next) {
        if (dp[tree[i]][s] > dp[item.second][s] + e[i].w) {
          dp[tree[i]][s] = dp[item.second][s] + e[i].w;
          q.push(P(dp[tree[i]][s], tree[i]));
        }
      }
    }
  }

  int main() {
    memset(dp, INF, sizeof(dp));
    scanf("%d %d %d", &n, &m, &k);
    int u, v, w;
    for (int i = 1; i <= m; i++) {
      scanf("%d %d %d", &u, &v, &w);
      add(u, v, w);
      tree[tot] = v;
      add(v, u, w);
      tree[tot] = u;
    }
    for (int i = 1; i <= k; i++) {
      scanf("%d", &key[i]);
      dp[key[i]][1 << (i - 1)] = 0;
    }
    for (int s = 1; s < (1 << k); s++) {
      for (int i = 1; i <= n; i++) {
        for (int subs = s & (s - 1); subs;
             subs = s & (subs - 1))  // 状压 dp 可以看下题解里写的比较详细
          dp[i][s] = min(dp[i][s], dp[i][subs] + dp[i][s ^ subs]);
        if (dp[i][s] != INF) q.push(P(dp[i][s], i));
      }
      dijkstra(s);
    }
    printf("%d\n", dp[key[1]][(1 << k) - 1]);
    return 0;
  }

另外一道经典例题 [WC2008]游览计划

这道题是求点权和最小的斯坦纳树,用 f(i,S) 表示以 i 为根的一棵树,包含集合 S 中所有点的最小点权值和。 a_i 表示点权。

考虑状态转移:

  • f(i,S)\leftarrow \min(f(i,S),f(i,T)+f(i,S-T)-a_i) 。由于此处合并时同一个点 a_i ,会被加两次,所以减去。

  • f(i,S)\leftarrow \min(f(i,S),f(j,S)+w(j,i))

可以发现状态转移与上面的模板题是类似的,麻烦的是对答案的输出,在 DP 的过程中还要记录路径。

pre[i][s] 记录转移到 i 为根,连通状态集合为 s 时的点与集合的信息。在 DP 结束后从 pre[root][S] 出发,寻找与集合里的点相连的那些点并逐步分解集合 S ,用 ans 数组来记录被使用的那些点,当集合分解完毕时搜索也就结束了。

参考实现
 1
 2
 3
 4
 5
 6
 7
 8
 9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
  #include <bits/stdc++.h>

  using namespace std;

  #define mp make_pair
  typedef pair<int, int> P;
  typedef pair<P, int> PP;
  const int INF = 0x3f3f3f3f;
  const int dx[] = {0, 0, -1, 1};
  const int dy[] = {1, -1, 0, 0};
  int n, m, K, root;
  int f[101][1111], a[101], ans[11][11];
  bool inq[101];
  PP pre[101][1111];
  queue<P> q;

  bool legal(P u) {
    if (u.first >= 0 && u.second >= 0 && u.first < n && u.second < m) {
      return true;
    }
    return false;
  }

  int num(P u) { return u.first * m + u.second; }

  void spfa(int s) {
    memset(inq, 0, sizeof(inq));
    while (!q.empty()) {
      P u = q.front();
      q.pop();
      inq[num(u)] = 0;
      for (int d = 0; d < 4; d++) {
        P v = mp(u.first + dx[d], u.second + dy[d]);
        int du = num(u), dv = num(v);
        if (legal(v) && f[dv][s] > f[du][s] + a[dv]) {
          f[dv][s] = f[du][s] + a[dv];
          if (!inq[dv]) {
            inq[dv] = 1;
            q.push(v);
          }
          pre[dv][s] = mp(u, s);
        }
      }
    }
  }

  void dfs(P u, int s) {
    if (!pre[num(u)][s].second) return;
    ans[u.first][u.second] = 1;
    int nu = num(u);
    if (pre[nu][s].first == u)
      dfs(u, s ^ pre[nu][s].second);  //通过 dfs 来找到答案
    dfs(pre[nu][s].first, pre[nu][s].second);
  }

  int main() {
    memset(f, INF, sizeof(f));
    scanf("%d %d", &n, &m);
    int tot = 0;
    for (int i = 0; i < n; i++) {
      for (int j = 0; j < m; j++) {
        scanf("%d", &a[tot]);
        if (!a[tot]) {
          f[tot][1 << (K++)] = 0;
          root = tot;
        }
        tot++;
      }
    }
    for (int s = 1; s < (1 << K); s++) {
      for (int i = 0; i < n * m; i++) {
        for (int subs = s & (s - 1); subs; subs = s & (subs - 1)) {
          if (f[i][s] > f[i][subs] + f[i][s ^ subs] - a[i]) {
            f[i][s] = f[i][subs] + f[i][s ^ subs] - a[i];  // 状态转移
            pre[i][s] = mp(mp(i / m, i % m), subs);
          }
        }
        if (f[i][s] < INF) q.push(mp(i / m, i % m));
      }
      spfa(s);
    }
    printf("%d\n", f[root][(1 << K) - 1]);
    dfs(mp(root / m, root % m), (1 << K) - 1);
    for (int i = 0, tot = 0; i < n; i++) {
      for (int j = 0; j < m; j++) {
        if (!a[tot++])
          putchar('x');
        else
          putchar(ans[i][j] ? 'o' : '_');
      }
      if (i != n - 1) printf("\n");
    }
    return 0;
  }

习题

【模板】最小斯坦纳树

[WC2008]游览计划

[JLOI2015]管道连接

[APIO2013]机器人


评论