【人工智能学习-AI入试相关题目练习-第十三次】

人工智能学习-AI入试相关题目练习-第十三次

1-前言

为了应对大学院考试,我们来学习相关人工智能相关知识,并做各种练习。

通过学习,也算是做笔记,让自己更理解些。

3-问题题目训练





【模擬問題①】(既出近似:強化学習・価値関数)

問題1

強化学習では,エージェントが環境との相互作用を通じて学習を行う。

このとき,環境は状態 (a),行動 (b),および報酬 © によって記述される。

状態遷移が現在の状態と行動のみに依存する性質を (d) といい,

この仮定に基づいて強化学習の問題は (e) として定式化される。

価値反復法では,状態価値関数は (f) によって再帰的に定義され,

この関係式を (g) 方程式と呼ぶ。

(a)~(g) に入る最も適切な語句を記せ。


【模擬問題②】(既出近似:教師あり学習・最適化)

問題2

教師あり学習では,入力データとそれに対応する (a) の組を用いて学習を行う。

学習の目的は,モデルの出力と正解との差を表す (b) を最小化することである。

この最適化では,誤差関数の © を計算し,

更新量を制御する (d) を用いてパラメータを修正する。

しかし,誤差関数が非凸である場合,学習は (e) に収束する可能性がある。

この問題を抑制するため,(f) を導入する手法が広く用いられている。

(a)~(f) に入る語句を記せ。


【予測問題①】(新傾向:確率的推論・状態推定)

問題3

実世界の知能システムでは,観測情報に (a) が含まれるため,

現在の状態を一意に決定できない場合が多い。

このような場合,状態を単一の値ではなく (b) として表現し,

観測が得られるたびにその分布を更新する手法が用いられる。

この手法では,まず © に基づいて状態分布を予測し,

次に観測モデルを用いて (d) を計算する。

最後に,分布の総和が 1 となるように (e) を行い,

更新後の分布を (f) と呼ぶ。

(a)~(f) に入る最も適切な語句を記せ。


【予測問題②】(新傾向:学習の限界・評価)

問題4

機械学習モデルは,学習データに対して高い性能を示しても,

未知データに対して同様の性能を示すとは限らない。

このような現象は,モデルが学習データに過度に適合することによって生じ,

一般に (a) と呼ばれる。

(a) が発生すると,モデルの (b) が低下する。

これを防ぐため,学習時にモデルの複雑さを抑制する © が導入される。

また,データを複数に分割して性能を評価する方法として (d) があり,

学習途中で性能悪化を検知して学習を停止する手法を (e) という。

(a)~(e) に入る語句を記せ。


4-练习(日语版本)解析

【模擬問題①】問題1(強化学習・価値関数)

  • (a) 状態(状态)
  • (b) 行動(动作)
  • © 報酬(奖励)
  • (d) マルコフ性(马尔可夫性)
  • (e) マルコフ決定過程(MDP)(马尔可夫决策过程)
  • (f) ベルマン方程式(贝尔曼方程式)
  • (g) ベルマン(贝尔曼)

【模擬問題②】問題2(教師あり学習・最適化)

  • (a) 正解ラベル(正确标签)
  • (b) 損失関数(誤差関数)(损失/误差函数)
  • © 勾配(梯度)
  • (d) 学習率(学习率)
  • (e) 局所最小値(局部最小值)
  • (f) 正則化(正则化)

【予測問題①】問題3(確率的推論・状態推定)

  • (a) ノイズ(噪声)
  • (b) 確率分布(概率分布)
  • © 状態遷移モデル(状态转移模型)
  • (d) 尤度(似然)
  • (e) 正規化(归一化)
  • (f) 事後分布(事後確率分布)(后验分布)

【予測問題②】問題4(学習の限界・評価)

  • (a) 過学習(オーバーフィッティング)(过拟合)
  • (b) 汎化性能(泛化性能)
  • © 正則化(正则化)
  • (d) 交差検証(交叉验证)
  • (e) 早期終了(Early Stopping)(提前停止)

5-単語练习(日语版本)

6-总结

知识一点点记录吧,最后应对考试,打下基础

相关推荐
冬奇Lab9 小时前
Workflow 系列(01):基础理论——三种执行模型与 Anthropic 5 种模式
人工智能·agent·工作流引擎
冬奇Lab9 小时前
每日一个开源项目(第143篇):page-agent - 纯 JS 的网页 GUI Agent,无需截图、无需插件、无需后端
前端·人工智能·agent
程序员cxuan11 小时前
虽迟但到!GPT-5.6 终于来了!
人工智能·后端·程序员
ZhengEnCi13 小时前
Q03-UI设计进阶技巧-让界面更高级的7个核心原则
人工智能
IT_陈寒13 小时前
React的这个渲染问题连官方文档都没说清楚
前端·人工智能·后端
不加辣椒14 小时前
第12章 工具调用与 Agent 提示工程
人工智能
用户16931761726614 小时前
前端给AI消息做日期分组与时间线
人工智能
i晟14 小时前
Claude Code Harness 深度拆解:从你敲回车到模型回复,中间发生了什么
人工智能
用户2527362781416 小时前
【踩坑复盘】我在本地跑 RAG 知识库时踩了 5 个大坑,吐血整理避坑指南
人工智能
大模型真好玩16 小时前
LangChain DeepAgents 速通指南(九)—— 生产级智能体框架 DeepAgents Code 源码导读
人工智能·langchain·agent