What is data ?

Data is the fuel of AI. 数据是 AI 的燃料。

Data is a set of observations that we use to learn an A→B mapping. 数据是一组观测样本,用来学习从 A 到 B 的映射

In machine learning, data often comes as pairs (A, B), where A is input and B is output/label. 机器学习里,数据常以 **(A,B) 样本对 ** 出现:

  • A = input(输入)
  • B = output /label(输出 / 标签)

📌典型案例

  • Housing price prediction A:Size, location, floor(面积、位置、楼层) B:House price(房价) Data:Many rows of (A,B) → 模型学会 A→B 映射
  • Cat photo detection A:Image(图片) B:Yes/No(是不是猫) Data:Lots of images + labels

🧩两类数据:结构化 / 非结构化

  1. Structured data(结构化数据) Tables, spreadsheets, databases(表格、Excel、数据库) Example: User ID, age, income(用户 ID、年龄、收入)
  2. Unstructured data(非结构化数据) Images, audio, text, video(图片、语音、文本、视频)

💡 吴恩达金句(高频、必背)

  • Data > Algorithm > Compute 数据 > 算法 > 算力
  • It's not just big data; it's good data. 不在于大数据,而在于高质量数据
  • 80% of AI is data. AI 80% 是数据。

🔗 跟你前面 "A→B 映射" 的关系(他课里直接连)

Today's AI = ANI = learning fixed A→B mappings from data. 现在的 AI = 弱 AI = 从数据学固定的 A→B 映射

相关推荐
Elastic 中国社区官方博客1 小时前
Elasticsearch:使用预计算上下文降低 agent 成本
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索
码以致用1 小时前
OpenFoundry 开源数据操作系统:架构解析与实战指南
人工智能·ai·架构·开源
m0_715674431 小时前
技术创新突破·可管可控·对标行标 医疗API安全解决方案实践指南
大数据·人工智能·安全
SelectDB技术团队1 小时前
97% 召回率、900 QPS:Apache Doris 4.1 生产级向量检索的工程实践
数据库·人工智能·数据分析·apache doris·selectdb
skywalk81631 小时前
python run.py “请讨论一下中文编程语言的设计“ --max-rounds 4
开发语言·人工智能
读创商闻1 小时前
解锁强劲算力,数聚红芯 AI 智算服务器甄选指南
运维·服务器·人工智能
三掌柜6661 小时前
自主智能体开发实战:Skills 从原理到工程化落地
人工智能
袁煦丞 cpolar内网穿透实验室1 小时前
Remotion让视频创作告别剪按钮——AI生成视频+像素级精准控制!cpolar内网穿透实验室第700个成功挑战
人工智能·音视频·远程工作·内网穿透·cpolar·安全内网连接