第九周第三天

强化学习是一种机器学习方法,通过与环境的交互来学习最佳策略。在强化学习框架中,代理观察环境的状态并采取相应的行动以获得奖励或惩罚。代理的目标是通过不断的探索和学习找到一种策略,使长期累积回报最大化。与监督学习不同,强化学习通常不依赖于大量的标记数据,而是通过反复试验来提高决策能力。强化学习在许多复杂的任务中取得了成功,如机器人控制、自动驾驶和游戏人工智能。在著名的围棋程序AlphaGo中,强化学习与深度神经网络相结合,使计算机能够达到甚至超过顶级人类棋手的水平。然而,在实际应用中,强化学习仍然面临着样本效率低、训练成本高等挑战。

49

#include<bits/stdc++.h>

using namespace std;

void insertSort(int arr\[\],int n){

for(int i=1;i<n;i++){

int key=arri;

int j=i-1;

while(j>=0&&key<arrj){

arrj+1=arrj;

j--;

}

arrj+1=key;

}

}

int main(){

int m,c;//m代表木板数,c代表牛棚数

scanf("%d %d",&m,&c);

vector<int> a(c);

for(int i=0;i<c;i++){

scanf(" %d",&ai);

}

insertSort(a.data(),c);

vector<int> arr(c-1);

for(int i=0;i<c-1;i++){

arri=ai+1-ai-1;

}

insertSort(arr.data(),c-1);

int total=c;

for(int i=0;i<c-m;i++){

total+=arri;

}

printf("%d",total);

return 0;

}

50

#include <iostream>

#include <set>

using namespace std;

int main() {

int n;

// 循环读取多组测试数据

while (cin >> n) {

set<long long> s; // 使用set自动去重和排序,long long防止溢出

long long num;

for (int i = 0; i < n; i++) {

cin >> num;

s.insert(num); // 插入进去,set会自动去重排序

}

// 遍历set输出结果

bool first = true; // 控制空格输出

for (auto it = s.begin(); it != s.end(); it++) {

if (!first) cout << " "; // 不是第一个数,先打印空格

cout << *it;

first = false;

}

cout << endl; // 每组结果换行

}

return 0;

}

51

#include<bits/stdc++.h>

int main(){

int left101,right101;

while(scanf("%d %d",&left1,&right1)!=EOF){

int count=1;

while(leftcount!=1){

leftcount + 1=leftcount/2;

rightcount + 1=rightcount*2;

count++;

}

int total=0;

for(int i=1;i<=count;i++){

if(lefti%2==1){

total+=righti;

}

}

printf("%d*%d=",left1,right1);

int flag=0;

for(int i =1;i<=count;i++){

if(lefti%2==1){

if(flag){

printf("+");

}

flag=1;

printf("%d",righti);

}

}

printf("=%d\n",total);

}

}

相关推荐
vibecoding日记3 小时前
双非如何快速入职字节等大厂大模型?真实案例分析:推理优化和投机解码
算法·求职·大模型工程师
yszaygr21385 小时前
Verilog参数化游程编码RLE模块
算法
望易5 小时前
刚设计的大模型架构-双域耦合认知框架
算法·架构
复杂网络9 小时前
多个 Claude Code 与多个 Codex 协同工作:设计与实现方案
算法
HjhIron1 天前
面试常客:字符串算法从入门到进阶
算法·面试
吴佳浩1 天前
DeepSeek DSpark:Confidence-Scheduled Speculative Decoding 技术解析
人工智能·算法·deepseek
触底反弹1 天前
🧠 搞懂 Token,才算真正入门大模型——从分词原理到 Embedding 语义实战
javascript·人工智能·算法
vivo互联网技术1 天前
ICLR 2026 | 基于后验采样的图像恢复方法LearnIR:人脸去阴影、去雾
人工智能·算法·aigc
浮生望1 天前
JS字符串与回文算法:从包装类到双指针的面试进阶之路
javascript·算法
黄敬峰1 天前
面试必刷:从JS底层包装类到双指针,彻底搞懂字符串与回文算法
算法