吴教授《AI for everyone》笔记梳理(DAY1)

理解AI的两个核心概念

人工窄智能(当前现实)

定义:仅擅长单一任务的AI系统(如智能音箱、自动驾驶、搜索引擎)。

现状:发展迅速,已创造巨大实际价值。

举例:一位机器人教授指出,虽然AI机器人目前难以处理复杂发型,但像吴恩达本人的简单发型,机器人可以完成。

通用人工智能(未来展望)

定义:能够执行人类所有智能任务的AI。

现状:进展甚微,仍需多项基础突破,可能需数十年甚至更久才能实现。

核心观点:当前窄AI的成功被误读为AGI的快速进展,从而引发了对"杀手机器人"等不切实际的恐惧。无需过度担忧AGI的威胁。

人工智能的核心驱动力:机器学习

当前人工智能的兴起,主要由机器学习这一工具驱动。

机器学习的主流类型:监督学习

最常用&创造巨大价值的类型:监督学习

  • 核心思想 :学习从输入(A) 到**输出(B)**的映射关系(A → B)。
  • 通俗理解:教AI根据"输入"做出正确的"输出"判断。
监督学习的应用场景

|---------------|----------------|------------------------|
| 输入 (A) | 输出 (B) | 应用领域 |
| 一封电子邮件 | 是否为垃圾邮件(是/否) | 垃圾邮件过滤 |
| 一段音频 | 对应的文字稿 | 语音识别 |
| 英语句子 | 中文/西班牙语等翻译 | 机器翻译 |
| (广告信息 + 用户信息) | 用户是否会点击(是/否) | 在线广告推荐(当前最盈利的应用之一) |
| (图片 + 雷达数据) | 周围车辆的位置 | 自动驾驶(避障) |
| 刚下生产线的产品图片 | 是否存在划痕或凹陷(是/否) | 制造业视觉检测(减少缺陷) |

核心价值:虽然看起来只是简单的A→B映射,但一旦找到合适的应用场景,就能创造巨大价值。

监督学习为何在近期爆发?

监督学习:概念已有几十年历史,近期崛起主要归因于2个要素的协同作用:数据量 、**算法(神经网络)**的进步。

关键洞察:性能表现曲线
  1. 横轴:可用于特定任务的数据量(过去几十年因数字化、互联网而激增)。
  2. 纵轴:AI系统的性能表现(如:语音识别的准确率)。
  • 传统AI系统 :随着数据增加,性能提升很快达到天花板,不再显著增长。
  • (现代)神经网络/深度学习
    • 使用小型神经网络:性能随数据增加而提升。
    • 使用大型神经网络 :性能可以持续、稳定地提升,达到前所未有的高水平。
实现高性能AI必要条件
  1. 大量数据(大数据):训练的基础。
  2. 训练大型神经网络的能力 :依赖于快速计算机(如遵循摩尔定律的CPU)和**专用处理器(如图形处理单元GPU)**的发展,这使得不仅是科技巨头,许多公司都能训练出高性能模型。

重点强调:"输入-输出映射"的核心逻辑、性能增长曲线的直观解释。

相关推荐
倔强的石头1062 小时前
昇腾大模型量化实战:ModelSlim 工具上手与 W8A8 精度优化全流程解析
人工智能·机器学习
初来乍到到2 小时前
elementUI表格tableixed=“right“ 导致固定列错位的解决方法
笔记
TMT星球2 小时前
“智汇众力 共擎新元”,机器人租赁平台“擎天租”发布
大数据·人工智能·机器人
HUT_Tyne2652 小时前
第2章 语言模型基础
人工智能·语言模型·自然语言处理
愚昧之山绝望之谷开悟之坡2 小时前
放通业务系统到统一用户单点登录cas。这个cas到底是什么?
笔记
熬夜敲代码的小N2 小时前
自然语言处理与Transformer模型
人工智能·自然语言处理·transformer
KlipC2 小时前
字节跳动加码AI布局
人工智能·klipc
十铭忘2 小时前
SAM2跟踪的理解14——mask decoder
人工智能·计算机视觉
HyperAI超神经2 小时前
入选NeurIPS 2025,智源/北大/北邮提出多流控制视频生成框架,基于音频解混实现精确音画同步
人工智能·ai·音视频·视频生成·neurlps 2025