What is data ?

Data is the fuel of AI. 数据是 AI 的燃料。

Data is a set of observations that we use to learn an A→B mapping. 数据是一组观测样本,用来学习从 A 到 B 的映射

In machine learning, data often comes as pairs (A, B), where A is input and B is output/label. 机器学习里,数据常以 **(A,B) 样本对 ** 出现:

  • A = input(输入)
  • B = output /label(输出 / 标签)

📌典型案例

  • Housing price prediction A:Size, location, floor(面积、位置、楼层) B:House price(房价) Data:Many rows of (A,B) → 模型学会 A→B 映射
  • Cat photo detection A:Image(图片) B:Yes/No(是不是猫) Data:Lots of images + labels

🧩两类数据:结构化 / 非结构化

  1. Structured data(结构化数据) Tables, spreadsheets, databases(表格、Excel、数据库) Example: User ID, age, income(用户 ID、年龄、收入)
  2. Unstructured data(非结构化数据) Images, audio, text, video(图片、语音、文本、视频)

💡 吴恩达金句(高频、必背)

  • Data > Algorithm > Compute 数据 > 算法 > 算力
  • It's not just big data; it's good data. 不在于大数据,而在于高质量数据
  • 80% of AI is data. AI 80% 是数据。

🔗 跟你前面 "A→B 映射" 的关系(他课里直接连)

Today's AI = ANI = learning fixed A→B mappings from data. 现在的 AI = 弱 AI = 从数据学固定的 A→B 映射

相关推荐
袋鼠云数栈UED团队6 分钟前
一套 Spec-First 的 AI 编程工作流
前端·人工智能
Awu122716 分钟前
⚡从零开发 Agent CLI(二):CLI 框架搭建与子命令路由
人工智能·aigc
码上天下20 分钟前
React Query 缓存 AI 对话历史的几个权衡
人工智能
米小虾30 分钟前
2026半年盘点:AI界发生的6件大事,正在彻底改变产业格局
人工智能
道友可好2 小时前
让 AI 自己验收,等于让学生自己批卷
前端·人工智能·后端
美团技术团队3 小时前
美团海报生成 AIGC 技术创新与实践
人工智能
冬哥聊AI3 小时前
放弃 Spring AI?这 3 个开源框架,才是让 SpringBoot 玩转 AI Agent 的正解
人工智能
小爷毛毛_卓寿杰3 小时前
当 max_tokens=1 遇上 reasoning 模型:从 Xagent 一次“测试连接“按钮的失败说起
人工智能
用户5191495848453 小时前
Flex QR Code Generator 漏洞利用工具 CVE-2025-10041
人工智能·aigc