[ROI 2023] 峰值 (Day 1)

\(\mathbf{Part. -1}\)

翻译自 ROI 2023 D1T3。

如果对于所有 \(1 \le j < i\)，都有 \(a_j < a_i\)，则称 \(a_i\) 为峰值。

如果对于所有 \(1 \le j < i\)，都有 \(a_j > a_i\)，则称 \(a_i\) 为反峰值。

给定大小为 \(n\) 的排列 \(p_1,p_2,\dots,p_n\)。需要将其分为两个非空子序列 \(q\) 和 \(r\)。每个元素 \(p\) 必须恰好被分到一个子序列中。你需要最大化 \(q\) 中的峰值数量和 \(r\) 中的反峰值数量之和。

\(1 \leq n \leq 2 \times 10^5\)。

\(\mathbf{Part. 1}\)

我们按顺序考虑每一个 \(a_i\)。由于我们要把序列划分成两个子序列，分别是递增和递减，所以我们定义 \(mx\) 表示当前考虑到第 \(i\) 个数的递增序列中最后一个值，\(mn\) 表示当前考虑到第 \(i\) 个数的递减序列中最后一个值。显然，我们可以通过储存这两个值来进行 DP。设 \(f_{i, mx, mn}\) 表示当前考虑到第 \(i\) 个数的 \(mx\) 和 \(mn\) 值，则转移是朴素的。

我们想要更快的算法，于是我们考虑研究 DP 转移的过程（也是按顺序对 \(a_i\) 分配的过程）。对于每一个数 \(a_i\)，当前的 \(mx,mn\) 我们已经知道了：

对于 \(mx < mn\) 来说：
- 如果 \(mx < mn < a_i\)，则我们将 \(a_i\) 加到 \(mx\) 数列里会更新，加到 \(mn\) 数列里没影响。
- 如果 \(a_i < mx < mn\)，则我们将 \(a_i\) 加到 \(mx\) 数列里没影响，加到 \(mn\) 数列里会更新。
- 如果 \(mx < a_i < mn\)，则加到任何一个数列都会更新。\(^{{\color{red}(1)}}\)
对于 \(mn < mx\) 来说：
- 如果 \(mn < mx < a_i\)，则我们将 \(a_i\) 加到 \(mx\) 数列里会更新，加到 \(mn\) 数列里没影响。
- 如果 \(a_i < mn < mx\)，则我们将 \(a_i\) 加到 \(mx\) 数列里没影响，加到 \(mn\) 数列里会更新。
- 如果 \(mn < a_i < mx\)，则加到任何一个数列都没有影响。

对于两种情况，显然只有 \(a_i\) 在中间的时候情况不同。似乎如果更新少一点更简单，所以我们考虑 \(mn < mx\)。

\(\mathbf{Part. 2}\)

我们考虑 \(mn < mx\)。对于这种情况，我们发现，对于每个数，如果它可以但是不用在 \(mx\) 或者 \(mn\) 数列中的话，它可以选择不影响答案。因此，对于所有后面 \(> mx\) 的数，我可以选择一些来构成最长上升子序列，其他的划分到 \(mn\) 去，不对答案造成影响。\(< mn\) 的数同理\(^{\color{red}(2)}\)。容易发现，这其实是 \(\mathbf{LIS}\) 和 \(\mathbf{LCS}\) 问题，而这个问题我们可以用 \(\mathbf{BIT}\) 轻松计算出每个 \(a_i\) 开头的 \(\mathbf{LIS,LCS}\) 值。

但是对于 \(mx < mn\)，由于 \(\color{red}(1)\) 的存在，并不是每个数都能选择不影响序列。如果我们直接考虑研究 \(mx < mn\) 的转移过程，那是没有任何性质的\(^{\color{red}(3)}\)。但是，如果我们观察答案整体的结构，我们发现 \(mx > mn\) 和 \(mn > mx\) 分别是这个序列中的前缀和后缀部分，所以不难想到枚举分界点。

（为了方便区分，我们后文将 \(mx < mn\) 的部分称为前面的部分，\(mx < mx\) 的部分称为后面的部分）

我们考虑枚举分界点 \(x\)。如果我们要求后面的部分，它的答案，那么由 \(\color{red}(2)\)，我们需要知道 \(mn\) 和 \(mx\) 的值来划分后面的数分别可以分到哪一个数列。因此，我们考虑枚举在分界点 \(x\) 选择完之后，\(mn,mx\) 的值的。（此时，\(mn < mx\)）

接着，我们考虑前面的部分怎么求。首先，由 \(\color{red}(3)\)，前面的操作过程没什么救，但是我们知道前面 \(mx < mn\) 啊！由于所有 \(mx\) 序列的所有数都 \(\leq mx\)，\(mn\) 序列的所有数都 \(\geq mn\)，而 \(mx <mn\)，所以 \(mx\) 序列的所有值都小于 \(mn\) 序列的所有值！因此，我们再考虑枚举分界点 \(x\) 还没选择前，\(mn,mx\) 的值。这样，我们可以预处理出前面所有 \(\leq mx\) 的数的前缀最大值个数，和所有 \(\geq mn\) 的前缀最小值的个数。

当然，实际上你在枚举 \(mn,mx\) 的时候，有可能存在 \(a_i\)，使得 \(mx < a_i < mn\)。这种情况显然不合法！因此，我们枚举的 \(mx\) 和 \(mn\) 需要保证不存在 \(a_i\) 使得 \(mx < a_i < mn\)\(^{\color{red}{(4)}}\)。

但这样复杂度直接起飞，非常不好。考虑我们都枚举了什么东西。

分界点 \(x\)
分界点选择之前 \(mx,mn\) 值
分界点选择之后 \(mx,mn\) 值

我们发现，分界点选择之前的 \(mx,mn\) 和之后的 \(mx,mn\) 肯定有很多重复啊！假设 \(x\) 选择之前是 \(mx,mn\)，那 \(x\) 选择，肯定要么更新 \(mx\)，要么更新 \(mn\)，然后都是变成 \(a_x\)，所以实际上我们只需要枚举 \(mx,mn\)，然后分类讨论一下即可。

我们明明已经找到了这么多性质，时间复杂度还是 \(\mathcal{O}(n^3)\)。怎么回事呢？但其实不然。由 \(\color{red}(4)\)，我们知道 \(mx,mn\) 肯定是前面的 \(a_i\) 的值，而我们不能存在 \(a_i\) 在 \(mx,mn\) 之间，所以实际上 \(mx\) 是 \(mn\) 的后继。因此，你只需要枚举 \(mx,x\) 两个值即可，复杂度为 \(\mathcal{O}(n^2)\)。

我们考虑这个算法的细节。首先，枚举 \(x,mx\)，则 \(mn\) 是很容易通过维护 \(\mathbf{set}\) 算出来的。然后，我们发现对于一个 \(mx\)，肯定在前面出现过，而且这个 \(mx\) 后面的数是没用的，所以我们可以对于每个 \(a_i \leq mx\)，预处理出所有 \(\leq mx\) 的数的前缀最大值个数，\(mn\) 同理。对于后面的部分，我们可以通过 \(\mathbf{BIT}\)，求出以每个 \(a_i\) 为开头的 \(\mathbf{LIS,LCS}\)。然后，由于我们要求以 \(x\) 为开头的最长子序列，和以 \(i > x,a_i < mn\) 或者 \(i > x, a_i > mx\) 开头的最长子序列，因此我们按顺序扫一下 \(mx\) 就可以快速求出。

\(\mathbf{Part. 3}\)

我们考虑优化这个算法。

我们大概的思路是：枚举一个值，另一个值数据结构维护，所以我们可以枚举 \(x\)。结果我们发现，枚举 \(x\) 完全不可做！！！？？？这怎么办？

这时候最重要的一点：抛弃前面的所有思想，我们考虑枚举什么更优秀！但此处的抛弃并不是真正的抛弃，因为你已经发现了很多性质，赛场上你是不会忘掉的。

我们考虑枚举 \(x\) 为什么不优秀。枚举 \(x\)，给我们提供了 \(mx < mn < a_x\) 或 \(a_x < mx < mn\) 的信息，让我们知道从 \(i\) 开始进入后面的部分，但是我们不知道 \(mx,mn\)；不知道 \(mn\) 后面应该找什么数（这里就很离谱了：我们不知道 \(mn\)，还要对于 \(x > i,a_x < mn\) 来二位数点！），但是知道 \(mx\) 后面一定是 \(i\)。如果枚举 \(mx\) 的话，如果 \(mn\) 在 \(mx\) 的右边，那我们不能知道 \(mn\) 是什么。

我们对于 \(mx,mn\) 维护的信息是不平衡的，但是我们又要通过 \(mx\) 求出来 \(mn\)。于是，我们应该要枚举一个点，这个点左边涵盖了 \(mn,mx\)，右边是我们要找的转折点 \(x\)。如果 \(mx\) 在 \(mn\) 左边，这个 \(x\) 可以是 \(mx\)，否则可以是 \(mn\)......对！我们可以枚举 \(mn\) 和 \(mx\) 最靠右的那个点！

假设我们枚举了 \(x\)，其中 \(mn,mx\) 都在 \(x\) 左边，且其中有一个是 \(a_x\)。由 \(\color{red}(4)\)，这两个值在 \(x\) 左边的值域上肯定是相邻的，所以我们可以通过 \(mx\) 求出来另一个 \(mn\)。那么，我们分类讨论 \(x\) 是 \(mx\) 还是 \(mn\)，对于每种情况，我们还要考虑是 \(mn\) 还是 \(mx\) 的更新造成了 \(mn,mx\) 的大小关系变化。因此，我们枚举 \(x\)，然后分类讨论四种情况。不妨设 \(a_x\) 是 \(mx\)，我们算出来了 \(mn\)，\(mx\) 跳完后超过了 \(mn\)，则跳的下标 \(p\) 要满足 \(p > x, a_p > mn\)，然后求 \(\mathbf{LIS}(p)\) 的最大值，这是经典的二位数点。

\(\mathbf{Part. +\infin}\)

这份代码是 @Albert_Wei 写的，本人还没写，写了 update。

cpp 复制代码

int n, p[N], res[N][2], l[N], r[N];

struct BIT {
    int tr[N];
    void init() { F(i, 1, n + 1) tr[i] = 0; }
    void modify(int x, int y) { for (; x <= n + 1; x += (x & -x)) tr[x] += y; }
    int query(int x) { int ans = 0; for (; x; x -= (x & -x)) ans += tr[x]; return ans; }
} S;
struct BIT2 {
    int tr[N];
    void init() { F(i, 1, n) tr[i] = 0; }
    void modify(int x, int y) { for (; x <= n; x += (x & -x)) Fmax(tr[x], y); }
    int query(int x) { int ans = 0; for (; x; x -= (x & -x)) Fmax(ans, tr[x]); return ans; }
} U, V;

void solve() {
    n = read();
    F(i, 1, n) p[i] = read();
    S.init();
    set<int> st;
    st.insert(0), st.insert(n + 1);
    F(i, 1, n) {
        l[i] = *(-- st.lower_bound(p[i])), r[i] = *st.upper_bound(p[i]);
        S.modify(l[i] + 1, 1), S.modify(r[i] + 1, -1);
        res[i][0] = S.query(p[i] + 1), res[i][1] = S.query(p[i]), st.insert(p[i]);
    }
    int ans = 0;
    U.init(), V.init();
    G(i, n, 1) {
        if (r[i] != n + 1) Fmax(ans, res[i][0] + U.query(n - r[i]) + V.query(r[i]));
        Fmax(ans, res[i][0] + U.query(n - p[i]) + V.query(p[i]));
        Fmax(ans, res[i][1] + U.query(n - p[i]) + V.query(p[i]));
        if (l[i]) Fmax(ans, res[i][1] + U.query(n - l[i]) + V.query(l[i]));
        U.modify(n - p[i] + 1, U.query(n - p[i]) + 1);
        V.modify(p[i], V.query(p[i]) + 1);
    }
    F(i, 0, n) Fmax(ans, U.query(n - i) + V.query(i));
    cout << ans << '\n';
}