第九周第三天

强化学习是一种机器学习方法,通过与环境的交互来学习最佳策略。在强化学习框架中,代理观察环境的状态并采取相应的行动以获得奖励或惩罚。代理的目标是通过不断的探索和学习找到一种策略,使长期累积回报最大化。与监督学习不同,强化学习通常不依赖于大量的标记数据,而是通过反复试验来提高决策能力。强化学习在许多复杂的任务中取得了成功,如机器人控制、自动驾驶和游戏人工智能。在著名的围棋程序AlphaGo中,强化学习与深度神经网络相结合,使计算机能够达到甚至超过顶级人类棋手的水平。然而,在实际应用中,强化学习仍然面临着样本效率低、训练成本高等挑战。

49

#include<bits/stdc++.h>

using namespace std;

void insertSort(int arr[],int n){

for(int i=1;i<n;i++){

int key=arr[i];

int j=i-1;

while(j>=0&&key<arr[j]){

arr[j+1]=arr[j];

j--;

}

arr[j+1]=key;

}

}

int main(){

int m,c;//m代表木板数,c代表牛棚数

scanf("%d %d",&m,&c);

vector<int> a(c);

for(int i=0;i<c;i++){

scanf(" %d",&a[i]);

}

insertSort(a.data(),c);

vector<int> arr(c-1);

for(int i=0;i<c-1;i++){

arr[i]=a[i+1]-a[i]-1;

}

insertSort(arr.data(),c-1);

int total=c;

for(int i=0;i<c-m;i++){

total+=arr[i];

}

printf("%d",total);

return 0;

}

50

#include <iostream>

#include <set>

using namespace std;

int main() {

int n;

// 循环读取多组测试数据

while (cin >> n) {

set<long long> s; // 使用set自动去重和排序,long long防止溢出

long long num;

for (int i = 0; i < n; i++) {

cin >> num;

s.insert(num); // 插入进去,set会自动去重排序

}

// 遍历set输出结果

bool first = true; // 控制空格输出

for (auto it = s.begin(); it != s.end(); it++) {

if (!first) cout << " "; // 不是第一个数,先打印空格

cout << *it;

first = false;

}

cout << endl; // 每组结果换行

}

return 0;

}

51

#include<bits/stdc++.h>

int main(){

int left[101],right[101];

while(scanf("%d %d",&left[1],&right[1])!=EOF){

int count=1;

while(left[count]!=1){

left[count + 1]=left[count]/2;

right[count + 1]=right[count]*2;

count++;

}

int total=0;

for(int i=1;i<=count;i++){

if(left[i]%2==1){

total+=right[i];

}

}

printf("%d*%d=",left[1],right[1]);

int flag=0;

for(int i =1;i<=count;i++){

if(left[i]%2==1){

if(flag){

printf("+");

}

flag=1;

printf("%d",right[i]);

}

}

printf("=%d\n",total);

}

}

相关推荐
自信150413057592 小时前
选择排序算法
c语言·数据结构·算法·排序算法
2401_873544922 小时前
基于C++的游戏引擎开发
开发语言·c++·算法
add45a2 小时前
C++中的组合模式
开发语言·c++·算法
無限進步D2 小时前
简单贪心算法 cpp
c++·算法·贪心算法·蓝桥杯·入门·竞赛
2501_945423542 小时前
模板编程中的SFINAE技巧
开发语言·c++·算法
AMoon丶2 小时前
Golang--垃圾回收
java·linux·开发语言·jvm·后端·算法·golang
承渊政道2 小时前
【优选算法】(实战感悟二分查找算法的思想原理)
c++·笔记·学习·算法·leetcode·visual studio code
☆5662 小时前
C++中的策略模式应用
开发语言·c++·算法
2401_884563242 小时前
C++中的原型模式变体
开发语言·c++·算法