Pendulum

喜欢将平衡比作钟摆的这个形容

links

https://www.loot-drop.io/

https://github.com/ssoccean/PPT_Pilot

reinforcemennt learning需要考虑的核心问题之一

掌握好explore和exploit的接受平衡非常重要

idea-实践 循环

核心就两件事

用工程进度文件而不是上下文压缩长时工作更好

规划、执行、评估分开更好能解决模型自信问题

lc1220

class Solution {

public:

vector<long long> state;

// a e i o u

// 0 1 2 3 4

// 01 10 12 20 21 23 24 32 34 40

long long mod = 1e9 + 7;

vector<long long> run(vector<long long>& s) {

vector<long long> s_(5);

s_0 = (s1 + s2 + s4) % mod;

s_1 = (s0 + s2) % mod;

s_2 = (s1 + s3) % mod;

s_3 = s2 % mod;

s_4 = (s2 + s3) % mod;

return s_;

}

int countVowelPermutation(int n) {

state = vector<long long>(5, 1);

for (int i = 1; i < n; i++) {

++state = run(state);++

}

long long sum = 0;

for (int i = 0; i < 5; i++) {

++sum += statei;++

sum %= mod;

}

return sum;

}

};

lc1269

归来任是第一反应写最朴素的dp 释怀的笑了

const int MO = 1e9 + 7;

class Solution {

public:

int numWays(int steps, int arrLen) {

vector<vector<long long>> f(steps + 1, vector<long long>(steps + 1));

long long maxLen = min(steps - 1, arrLen - 1);

f00 = 1;

for (int i = 1; i <= steps; ++i) {

for (int j = 0; j <= maxLen; ++j) {

fij = fi - 1j;

if (j - 1 >= 0)

fij = (fij + fi - 1j - 1) % MO;

if (j + 1 <= maxLen)

fij = (fij + fi - 1j + 1) % MO;

}

}

return fsteps0 % MO;

}

};

相关推荐
AI搅拌机1 分钟前
提示词大师全新升级——无论Ollama、远程API还是本地模型,都能反推、扩写你的提示词!
人工智能
是有头发的程序猿3 分钟前
AI Agent电商自动化实战:淘宝商品详情API无人化采集与分析教程
运维·人工智能·自动化
EAIReport11 分钟前
边缘计算EdgeAI:从云端下沉到终端的智能革命
人工智能·边缘计算
在繁华处12 分钟前
Java从零到熟练(十二):Java与AI工具整合
java·人工智能·python
csdn小瓯13 分钟前
告别 Value Model:深度解析 GRPO 与 PPO 的核心差异
人工智能
库拉大叔13 分钟前
GPT-5.5办公落地全解析:四大场景实测+避坑指南+多模型策略
人工智能·gpt
2601_9599862421 分钟前
M4Markets:把信息透明度做到位——路径分析与提示整理
大数据·人工智能
YueJoy.AI21 分钟前
敏捷需求优先级矩阵驱动迭代规划
人工智能·ai·语言模型
豆豆22 分钟前
当GEO遇见CMS:企业网站管理系统如何适配AI大模型?
人工智能·cms·ai大模型·seo优化·geo优化·企业建站·企业网站管理系统
程序猿乐锅27 分钟前
吴恩达Prompt提示词课有感
人工智能·prompt