【人工智能学习-AI入试相关题目练习-第十三次】

人工智能学习-AI入试相关题目练习-第十三次

1-前言
3-问题题目训练
【模擬問題①】（既出近似：強化学習・価値関数）
- 問題1
【模擬問題②】（既出近似：教師あり学習・最適化）
- 問題2
【予測問題①】（新傾向：確率的推論・状態推定）
- 問題3
【予測問題②】（新傾向：学習の限界・評価）
- 問題4
4-练习（日语版本）解析
5-単語练习（日语版本）
6-总结

1-前言

为了应对大学院考试，我们来学习相关人工智能相关知识，并做各种练习。

通过学习，也算是做笔记，让自己更理解些。

3-问题题目训练

【模擬問題①】（既出近似：強化学習・価値関数）

問題1

強化学習では，エージェントが環境との相互作用を通じて学習を行う。

このとき，環境は状態 (a)，行動 (b)，および報酬 © によって記述される。

状態遷移が現在の状態と行動のみに依存する性質を (d) といい，

この仮定に基づいて強化学習の問題は (e) として定式化される。

価値反復法では，状態価値関数は (f) によって再帰的に定義され，

この関係式を (g) 方程式と呼ぶ。

(a)～(g) に入る最も適切な語句を記せ。

【模擬問題②】（既出近似：教師あり学習・最適化）

問題2

教師あり学習では，入力データとそれに対応する (a) の組を用いて学習を行う。

学習の目的は，モデルの出力と正解との差を表す (b) を最小化することである。

この最適化では，誤差関数の © を計算し，

更新量を制御する (d) を用いてパラメータを修正する。

しかし，誤差関数が非凸である場合，学習は (e) に収束する可能性がある。

この問題を抑制するため，(f) を導入する手法が広く用いられている。

(a)～(f) に入る語句を記せ。

【予測問題①】（新傾向：確率的推論・状態推定）

問題3

実世界の知能システムでは，観測情報に (a) が含まれるため，

現在の状態を一意に決定できない場合が多い。

このような場合，状態を単一の値ではなく (b) として表現し，

観測が得られるたびにその分布を更新する手法が用いられる。

この手法では，まず © に基づいて状態分布を予測し，

次に観測モデルを用いて (d) を計算する。

最後に，分布の総和が 1 となるように (e) を行い，

更新後の分布を (f) と呼ぶ。

(a)～(f) に入る最も適切な語句を記せ。

【予測問題②】（新傾向：学習の限界・評価）

問題4

機械学習モデルは，学習データに対して高い性能を示しても，

未知データに対して同様の性能を示すとは限らない。

このような現象は，モデルが学習データに過度に適合することによって生じ，

一般に (a) と呼ばれる。

(a) が発生すると，モデルの (b) が低下する。

また，データを複数に分割して性能を評価する方法として (d) があり，

学習途中で性能悪化を検知して学習を停止する手法を (e) という。

(a)～(e) に入る語句を記せ。

4-练习（日语版本）解析

【模擬問題①】問題1（強化学習・価値関数）

(a) 状態（状态）
(b) 行動（动作）
© 報酬（奖励）
(d) マルコフ性（马尔可夫性）
(e) マルコフ決定過程（MDP）（马尔可夫决策过程）
(f) ベルマン方程式（贝尔曼方程式）
(g) ベルマン（贝尔曼）

【模擬問題②】問題2（教師あり学習・最適化）

(a) 正解ラベル（正确标签）
(b) 損失関数（誤差関数）（损失/误差函数）
© 勾配（梯度）
(d) 学習率（学习率）
(e) 局所最小値（局部最小值）
(f) 正則化（正则化）

【予測問題①】問題3（確率的推論・状態推定）

(a) ノイズ（噪声）
(b) 確率分布（概率分布）
(d) 尤度（似然）
(e) 正規化（归一化）
(f) 事後分布（事後確率分布）（后验分布）

【予測問題②】問題4（学習の限界・評価）

(a) 過学習（オーバーフィッティング）（过拟合）
(b) 汎化性能（泛化性能）
© 正則化（正则化）
(d) 交差検証（交叉验证）
(e) 早期終了（Early Stopping）（提前停止）

5-単語练习（日语版本）

6-总结

知识一点点记录吧，最后应对考试，打下基础