【人工智能学习-AI-MIT公开课第 18. 表示:分類、軌跡、過渡】

人工智能学习-AI-MIT公开课第 18. 表示:分類、軌跡、過渡

1-前言

为了应对大学院考试,我们来学习相关人工智能相关知识,并且是基于相关课程。使用课程为MIT的公开课。

通过学习,也算是做笔记,让自己更理解些。

2-课程链接

是在B站看的视频,链接如下:
https://www.bilibili.com/video/BV1dM411U7qK?spm_id_from=333.788.videopod.episodes&vd_source=631b10b31b63df323bac39281ed4aff3&p=18

3-具体内容解释说明

一句话总览(先记这个)

表示(Representation)= AI 如何在内部"描述世界"

而这三种表示方式分别对应三类问题:

表示方式 解决什么问题
分類(Classification) 现在是什么?
軌跡(Trajectory) 过去到现在怎么走的?
過渡(Transition) 下一步会变成什么?

① 分類(Classification)

是什么

把输入映射到离散类别

例子:

  • 图片 → 是猫 / 是狗
  • 邮件 → 垃圾 / 非垃圾
  • 状态 → 正常 / 异常

表示方式的核心

  • 一个状态 → 一个标签

  • 表示通常是:

    • one-hot
    • 类别编号
    • 概率分布(softmax)

入试常考点

  • 分类 ≠ 回归
  • 分类结果是 离散的
  • 用于 状态判断 / 识别

👉 关键词

「入力をクラスに割り当てる」


② 軌跡(Trajectory)

是什么

一系列状态按时间顺序排列,形成"路径"。

例子:

  • 机器人移动轨迹
  • 目标跟踪(tracking)
  • 无人机飞行路径
  • 手写笔画顺序

表示方式的核心

  • 状态序列:

    x_1 \\rightarrow x_2 \\rightarrow x_3 \\rightarrow \\dots

  • 时间维度是关键

与"経路探索"的关系

  • 経路探索:找"最优轨迹"
  • 軌跡表示:如何描述这条路径

👉 关键词

「時系列」「状態の列」


③ 過渡(Transition)

是什么

状态如何从一个变到下一个的规则

例子:

  • 马尔可夫过程
  • 状态遷移確率
  • 动作 → 状态变化
  • 强化学习中的 state transition

表示方式的核心

  • 用函数或概率表示:

    P(s_{t+1} \\mid s_t, a_t)

  • 强调"变化规则",不是结果本身

入试极易考混点

  • 不是"轨迹"
  • 而是 生成轨迹的规则

👉 关键词

「遷移確率」「状態方程式」


一张"考试脑内图"(非常重要)

复制代码
分類     → 状态是什么
軌跡     → 状态怎么走
過渡     → 状态怎么变

4-课后练习(日语版本)

【人工知能】表示(分類・軌跡・過渡)模擬問題

【問題1】分類の表現

ある画像認識システムでは,入力画像を「人」「車」「その他」の3クラスに分類する。

このとき,分類(classification)の表現として最も適切なものはどれか。

:画像から得られた特徴量の時間的変化
:各クラスに属する確率のベクトル
:状態間の遷移確率行列
:連続的な位置座標の系列


【問題2】軌跡の表現

移動ロボットがスタート地点からゴール地点まで移動したときの挙動を表現する。

この表現として**軌跡(trajectory)**に最も適したものはどれか。

:ロボットが最終的に到達した地点のクラス
:各時刻におけるロボットの位置の列
:次状態が現在状態に依存する確率分布
:ゴールに到達するか否かの二値ラベル


【問題3】過渡の表現

強化学習において,エージェントの行動によって状態が変化する関係を表現する。

このとき,過渡(transition)の表現として最も適切なものはどれか。

:状態をクラスに割り当てる関数
:状態列を時間順に並べたもの
:状態と行動から次状態が決まる確率モデル
:最適経路を表すノード列


【問題4】表示の対応関係

次の記述のうち,表示の対応関係として正しいものはどれか。

:分類は状態の時間的変化を表す方法である
:軌跡は状態間の遷移規則を表す
:過渡は次の状態がどのように決まるかを表す
:分類は連続値の状態空間をそのまま扱う方法である


【注意(本番対策)】

  • すべて 1 問 1 正解
  • 数式計算不要
  • **「何を表しているか」**を正確に区別できるかが評価点

5-课后练习(日语版本)解析

很好,我们逐题核对 + 给出「本番判定理由」 ,看你是不是站在出题老师视角


【問題1】分類の表現

你的答案:い ✅ 正解

理由(入试标准):

  • 分類的本质:输入 → 类别(或其概率)
  • 「各クラスに属する確率のベクトル」 正是分类器(如 softmax)的标准输出

👉 其他选项的问题:

  • ア:时间变化 → 軌跡
  • ウ:遷移確率 → 過渡
  • エ:连续坐标序列 → 軌跡

【問題2】軌跡の表現

你的答案:い ✅ 正解

理由:

  • 軌跡 = 状態の時間的系列
  • 「各時刻におけるロボットの位置の列」
    → 完全符合 trajectory 的定义

👉 本题是送分题,你稳稳拿下。


【問題3】過渡の表現

你的答案:う ✅ 正解

理由:

  • 過渡关注的是:

    (状態, 行動) \\rightarrow 次状態

  • 「確率モデル」 是强化学习 / 马尔可夫模型的核心

👉 其他选项对应关系:

  • ア:分類
  • イ:軌跡
  • エ:結果(最短路)≠ 過渡规则

【問題4】表示の対応関係

你的答案:う ✅ 正解

理由:

  • 過渡 = 次状態如何决定
  • 这是对 transition 的教科书级定义

👉 错误选项的典型陷阱:

  • ア:把 軌跡 说成 分类
  • イ:把 过渡 和 軌跡 混了
  • エ:分类不"直接处理连续空间",而是映射到类别

6-总结

知识一点点记录吧,最后应对考试,打下基础

相关推荐
Gorgous—l6 分钟前
数据结构算法学习:LeetCode热题100-多维动态规划篇(不同路径、最小路径和、最长回文子串、最长公共子序列、编辑距离)
数据结构·学习·算法
Hello_Embed1 小时前
libmodbus 移植 STM32(基础篇)
笔记·stm32·单片机·学习·modbus
●VON2 小时前
Flutter for OpenHarmony 21天训练营 Day03 总结:从学习到输出,迈出原创第一步
学习·flutter·openharmony·布局·技术
香芋Yu2 小时前
【大模型教程——第四部分:大模型应用开发】第1章:提示工程与上下文学习 (Prompt Engineering & ICL)
学习·prompt
LYS_06182 小时前
寒假学习10(HAL库1+模数电10)
学习
runningshark2 小时前
【项目】示波器学习与制作
学习
€8112 小时前
Java入门级教程24——Vert.x的学习
java·开发语言·学习·thymeleaf·数据库操作·vert.x的路由处理机制·datadex实战
自可乐2 小时前
n8n全面学习教程:从入门到精通的自动化工作流引擎实践指南
运维·人工智能·学习·自动化
深蓝海拓3 小时前
PySide6从0开始学习的笔记(二十六) 重写Qt窗口对象的事件(QEvent)处理方法
笔记·python·qt·学习·pyqt
星火开发设计4 小时前
C++ 预处理指令:#include、#define 与条件编译
java·开发语言·c++·学习·算法·知识