Pendulum

喜欢将平衡比作钟摆的这个形容

links

https://www.loot-drop.io/

https://github.com/ssoccean/PPT_Pilot

reinforcemennt learning需要考虑的核心问题之一

掌握好explore和exploit的接受平衡非常重要

idea-实践 循环

核心就两件事

用工程进度文件而不是上下文压缩长时工作更好

规划、执行、评估分开更好能解决模型自信问题

lc1220

class Solution {

public:

vector<long long> state;

// a e i o u

// 0 1 2 3 4

// 01 10 12 20 21 23 24 32 34 40

long long mod = 1e9 + 7;

vector<long long> run(vector<long long>& s) {

vector<long long> s_(5);

s_[0] = (s[1] + s[2] + s[4]) % mod;

s_[1] = (s[0] + s[2]) % mod;

s_[2] = (s[1] + s[3]) % mod;

s_[3] = s[2] % mod;

s_[4] = (s[2] + s[3]) % mod;

return s_;

}

int countVowelPermutation(int n) {

state = vector<long long>(5, 1);

for (int i = 1; i < n; i++) {

++state = run(state);++

}

long long sum = 0;

for (int i = 0; i < 5; i++) {

++sum += state[i];++

sum %= mod;

}

return sum;

}

};

lc1269

归来任是第一反应写最朴素的dp 释怀的笑了

const int MO = 1e9 + 7;

class Solution {

public:

int numWays(int steps, int arrLen) {

vector<vector<long long>> f(steps + 1, vector<long long>(steps + 1));

long long maxLen = min(steps - 1, arrLen - 1);

f[0][0] = 1;

for (int i = 1; i <= steps; ++i) {

for (int j = 0; j <= maxLen; ++j) {

f[i][j] = f[i - 1][j];

if (j - 1 >= 0)

f[i][j] = (f[i][j] + f[i - 1][j - 1]) % MO;

if (j + 1 <= maxLen)

f[i][j] = (f[i][j] + f[i - 1][j + 1]) % MO;

}

}

return f[steps][0] % MO;

}

};

相关推荐
RK_Dangerous1 天前
AI大模型应用(四)——相关技术(下)
人工智能
zhangfeng11331 天前
人工智能日报.今日 AI 动态速递(2026-05-09)
人工智能
user29876982706541 天前
四、AI Agent 设计模式:上下文管理
人工智能
user29876982706541 天前
三、AI Agent 设计模式:工具编排
人工智能
Elastic 中国社区官方博客1 天前
Elasticsearch:为 AI Agent builder 创建 skill plugin
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
肖有米XTKF86461 天前
肖有米团队开发:青蓝送水系统模式制度商业解析
人工智能·团队开发·csdn开发云
Data_Journal1 天前
2026年十大数据集网站
大数据·开发语言·数据库·人工智能·python
helloworddm1 天前
Vulkan GPU图像处理之直方图均衡化:Kompute框架实战与性能分析
图像处理·人工智能
xingyuzhisuan1 天前
适合微调Llama 3 70B模型的最低GPU配置推荐
运维·人工智能·算法·llama·gpu算力
珠海西格电力1 天前
如何实现零碳园区管理系统“云-边-端”架构的协同
大数据·数据库·人工智能·架构·能源