Pendulum

喜欢将平衡比作钟摆的这个形容

links

https://www.loot-drop.io/

https://github.com/ssoccean/PPT_Pilot

reinforcemennt learning需要考虑的核心问题之一

掌握好explore和exploit的接受平衡非常重要

idea-实践 循环

核心就两件事

用工程进度文件而不是上下文压缩长时工作更好

规划、执行、评估分开更好能解决模型自信问题

lc1220

class Solution {

public:

vector<long long> state;

// a e i o u

// 0 1 2 3 4

// 01 10 12 20 21 23 24 32 34 40

long long mod = 1e9 + 7;

vector<long long> run(vector<long long>& s) {

vector<long long> s_(5);

s_0 = (s1 + s2 + s4) % mod;

s_1 = (s0 + s2) % mod;

s_2 = (s1 + s3) % mod;

s_3 = s2 % mod;

s_4 = (s2 + s3) % mod;

return s_;

}

int countVowelPermutation(int n) {

state = vector<long long>(5, 1);

for (int i = 1; i < n; i++) {

++state = run(state);++

}

long long sum = 0;

for (int i = 0; i < 5; i++) {

++sum += statei;++

sum %= mod;

}

return sum;

}

};

lc1269

归来任是第一反应写最朴素的dp 释怀的笑了

const int MO = 1e9 + 7;

class Solution {

public:

int numWays(int steps, int arrLen) {

vector<vector<long long>> f(steps + 1, vector<long long>(steps + 1));

long long maxLen = min(steps - 1, arrLen - 1);

f00 = 1;

for (int i = 1; i <= steps; ++i) {

for (int j = 0; j <= maxLen; ++j) {

fij = fi - 1j;

if (j - 1 >= 0)

fij = (fij + fi - 1j - 1) % MO;

if (j + 1 <= maxLen)

fij = (fij + fi - 1j + 1) % MO;

}

}

return fsteps0 % MO;

}

};

相关推荐
To_OC25 分钟前
数据集划分不是随便切:手把手切分大众点评情感数据集
人工智能·llm·agent
冬奇Lab1 小时前
每日一个开源项目(第142篇):android/skills - Google 官方 Android 开发 AI Skill 库
人工智能·开源·资讯
冬奇Lab1 小时前
Skill 系列(06):Skill 工程化与治理——路由准确率 38%、压缩节省 76%
人工智能·开源·agent
IT_陈寒3 小时前
Vue这个坑我跳了两次,原来问题出在这
前端·人工智能·后端
新新技术迷4 小时前
Node给AI接口做SSE代理与鉴权
人工智能
redreamSo4 小时前
大模型是不是到顶了?瓶颈到底在哪
人工智能·openai
Oo9204 小时前
Tool Use 背后的技术逻辑
人工智能
姗姗来迟了4 小时前
Vue3封装AI流式对话组件踩坑实录
人工智能
码上天下5 小时前
用Pinia管理AI多会话状态
人工智能