题目
简要题意:
给定参数 n n n, k k k, m m m,你需要求出有多少个大小为 k k k 的序列 a a a 满足如下三个条件:
- 任意两个元素其权值不同。
- 对于任意 i i i 满足 1 ≤ i ≤ k 1 \leq i \leq k 1≤i≤k 有 1 ≤ a i ≤ n 1 \leq a_i \leq n 1≤ai≤n。
- 对于任意 i i i 满足 2 ≤ i ≤ k 2 \leq i \leq k 2≤i≤k 有 a i ≤ a i − 1 + m a_i \leq a_{i - 1} + m ai≤ai−1+m。
答案对 1 0 9 + 7 10^9 + 7 109+7 取模。
数据规模:
1 ≤ n ≤ 1 0 9 1 \leq n \leq 10^9 1≤n≤109, 1 ≤ k ≤ min ( n , 12 ) 1 \leq k \leq \min(n, 12) 1≤k≤min(n,12), 1 ≤ m ≤ 4 1 \leq m \leq 4 1≤m≤4。
分析
注意到 n n n 很大,但是 k , m k, m k,m 都比较小。考虑以 n n n 作为阶段 d p dp dp。
有一个垃圾的想法:设 d p i , m s k dp_{i, msk} dpi,msk 表示考虑了前 i i i 个数,其中 m s k msk msk 是 1 1 1 的位置上已经选出了数字的方案数。
那么转移就是对于当前数,考虑把哪一个位置填上这个数,或者不用这个数。
设枚举的位置为 p p p,发现将当前数填到 p p p 后序列仍然合法的限制只有 a p ≤ a p − 1 + m a_{p} \leq a_{p - 1} + m ap≤ap−1+m。如果 p − 1 p - 1 p−1 此时还没有填数,那么就没有限制。如果已经填了该怎么办?
那么我们需要记录所有已经填过的位置上的数字与当前数字的差 。如果这个差大于 m m m,直接标记 − 1 -1 −1 代表不能再往这个位置后面填数了。这样复杂度为 O ( n × m k ) O(n \times m^k) O(n×mk)。显然加速阶段也过不了。
考虑从小到大枚举数 x x x 并讨论它是否要插入到序列中。
那么我们会发现 x x x 能插入的位置只有 [ x − 1 , x − m ] [x - 1, x -m] [x−1,x−m] 的后面或者第一个位置。只需要用一个 m m m 位的二进制数字记录 [ x − 1 , x − m ] [x - 1, x - m] [x−1,x−m] 哪些已经在序列中就可以求出转移系数。并且每一种插法最后一定唯一对应一种合法序列,而最终的一个合法序列一定唯一对应一种插法。这是一个双射因此方案数不重不漏。
那么 d p dp dp 状态变成了 d p i , j , m s k dp_{i, j, msk} dpi,j,msk 表示已经考虑了 [ 1 , i ] [1, i] [1,i],当前序列中有 j j j 个数字。 [ i − m + 1 , i ] [i - m + 1, i] [i−m+1,i] 在序列中的出现情况是 m s k msk msk 的方案数。
转移动为:
- d p i , j , m s k × ( c n t m s k + 1 ) → d p i + 1 , j + 1 , ( m s k > > 1 ) ∣ ( 1 < < ( m − 1 ) ) dp_{i, j, msk} \times (cnt_{msk} + 1) \to dp_{i + 1, j + 1, (msk >>1) | (1 << (m - 1))} dpi,j,msk×(cntmsk+1)→dpi+1,j+1,(msk>>1)∣(1<<(m−1))
- d p i , j , m k s → d p i + 1 , j , m s k > > 1 dp_{i, j, mks} \to dp_{i + 1, j, msk >> 1} dpi,j,mks→dpi+1,j,msk>>1
第一个代表选 i + 1 i + 1 i+1,第二个代表不选。
发现转移和 i i i 无关,而 ( j , m s k ) (j, msk) (j,msk) 的总状态数为 ( k + 1 ) × 2 m ≤ 208 (k + 1) \times 2^m \leq 208 (k+1)×2m≤208。因此矩阵加速即可。
时间复杂度 O ( log 2 n × ( ( k + 1 ) × 2 m ) 3 ) O(\log_2n \times ((k + 1) \times 2^m)^3) O(log2n×((k+1)×2m)3)。
CODE:
cpp
#include<bits/stdc++.h>
using namespace std;
const int N = 210;
typedef long long LL;
const LL mod = 1e9 + 7;
struct matrix {
LL mt[N][N];
friend matrix operator * (matrix a, matrix b) {
matrix c; memset(c.mt, 0, sizeof c.mt);
for(int i = 0; i < N; i ++ )
for(int j = 0; j < N; j ++ )
for(int k = 0; k < N; k ++ )
c.mt[i][j] = (c.mt[i][j] + a.mt[i][k] * b.mt[k][j] % mod) % mod;
return c;
}
};
matrix Mat; // 转移矩阵
int n, k, m;
int cnt[1 << 4];
int idx[15][1 << 4], rk;
matrix Pow(matrix x, int y) {
matrix res; matrix k = x;
for(int i = 0; i < N; i ++ )
for(int j = 0; j < N; j ++ )
res.mt[i][j] = (i == j);
while(y) {
if(y & 1) res = res * k;
y >>= 1;
k = k * k;
}
return res;
}
int main() {
cin >> n >> k >> m;
for(int i = 0; i < (1 << 4); i ++ ) cnt[i] = cnt[i >> 1] + (i & 1);
for(int i = 0; i <= k; i ++ )
for(int j = 0; j < (1 << m); j ++ )
idx[i][j] = ++ rk;
for(int i = 0; i <= k; i ++ ) {
for(int j = 0; j < (1 << m); j ++ ) {
if(i < k) {
int p = idx[i][j];
int q = idx[i + 1][(j >> 1) | (1 << (m - 1))];
Mat.mt[p][q] = 1LL * (cnt[j] + 1);
}
int p = idx[i][j];
int q = idx[i][j >> 1];
Mat.mt[p][q] = 1;
}
}
matrix f; f.mt[0][idx[0][0]] = 1;
f = f * Pow(Mat, n);
LL res = 0;
for(int j = 0; j < (1 << m); j ++ ) res = (res + f.mt[0][idx[k][j]]) % mod;
printf("%lld\n", res);
return 0;
}