目录
题目-SPOJ 3267 D-query

问题分析
要求区间内有多少个不同数字 , 可以这样考虑, 对于当前数字 t t t, 我们希望知道 t t t上一次出现的位置在哪 , 假设是pre[t]
那么定义如下函数 f ( i ) f(i) f(i)表示 w i w_i wi上一次出现的位置 + 1 + 1 +1, 如果这个数字在区间 [ l , r ] [l, r] [l,r]内第一次出现, f ( i ) = 1 f(i) = 1 f(i)=1, 反之, 如果当前数字在区间中不是第一次出现 , 假设出现位置是 x ≥ l x \ge l x≥l, 那么 f ( i ) > l f(i) > l f(i)>l
有了这个性质, 在查询的时候需要统计 f ( i ) ≤ l f(i) \le l f(i)≤l的数字个数, 可以使用持久化线段树 解决, 只需要将线段树版本 移动到 r r r, 在线段树节点中统计 f ( i ) f(i) f(i)的个数, 结果就是
∑ s r − s l − 1 \sum s_{r} - s_{l - 1} ∑sr−sl−1
算法步骤
- 初始化两个数组,
pre[i]和last[i], 代表数值 x x x上次出现的位置,last[i] = pre[w[i]] + 1 - 线段树中记录的节点信息是
last[i]如果落入该区间, 将该位置 + 1 +1 +1 - 实现持久化线段树的新增和查询
代码实现
cpp
#include <bits/stdc++.h>
using namespace std;
typedef long long LL;
const int N = 3e4 + 10, M = 1e6 + 10;
int n, w[N], m;
struct Node {
int ls, rs;
int s;
} tr[N * 4 + N * 17];
int pre[M], last[M];
int root[N], idx;
int build(int l, int r) {
int u = ++idx;
tr[u] = {0, 0, 0};
if (l == r) return u;
int mid = l + r >> 1;
tr[u].ls = build(l, mid);
tr[u].rs = build(mid + 1, r);
return u;
}
int insert(int p, int l, int r, int x) {
int u = ++idx;
// 复制旧节点到新的节点
tr[u] = tr[p];
tr[u].s = tr[p].s + 1;
if (l == r) return u;
int mid = l + r >> 1;
if (x <= mid) tr[u].ls = insert(tr[p].ls, l, mid, x);
else tr[u].rs = insert(tr[p].rs, mid + 1, r, x);
return u;
}
LL query(int p, int q, int l, int r, int ql, int qr) {
if (l >= ql && r <= qr) {
return tr[q].s - tr[p].s;
}
LL ans = 0;
int mid = l + r >> 1;
if (ql <= mid) ans += query(tr[p].ls, tr[q].ls, l, mid, ql, qr);
if (qr > mid) ans += query(tr[p].rs, tr[q].rs, mid + 1, r, ql, qr);
return ans;
}
int main() {
ios::sync_with_stdio(false);
cin.tie(0);
cin >> n;
root[0] = build(1, n);
for (int i = 1; i <= n; ++i) {
cin >> w[i];
last[i] = pre[w[i]] + 1;
pre[w[i]] = i;
root[i] = insert(root[i - 1], 1, n, last[i]);
}
cin >> m;
while (m--) {
int l, r;
cin >> l >> r;
LL ans = query(root[l - 1], root[r], 1, n, 1, l);
cout << ans << '\n';
}
return 0;
}