当今世界的数据量增长速度简直超乎想象。从 20 世纪 80 年代开始,世界上的数据存储容量大
约每 3 年就翻一番。在你读完本章的这段时间内,世界上的数据存储会增加10的18次方位。很难想象这个
数字有多大,可以打个比方, 10的18次方 枚加拿大便士的面积大约是地球表面积的两倍。
当然,更多数据并不一定能提供更多有用信息。进化是一个缓慢的过程,人类思维对数据的
吸收能力也不可能每 3 年就翻一番。如果要从"大数据"中尽可能提取有用信息,现在可以使用
统计机器学习 。
机器学习很难明确地定义。从某种意义上说,所有可用的程序都可以学习到一些东西。例如,
对牛顿法的程序实现可以"学习"一个多项式的根。最早的一种机器学习定义是由美国电气工程
师、计算机科学家亚瑟·塞缪尔 ① 提出的,他给出的定义是:"机器学习是使计算机不用特意编程
就可以获得学习能力的研究领域。"
人类通过两种方式进行学习 ------ 记忆和归纳。我们通过记忆积累单个事实。例如,在英国,
小学生会学习英国的历代君王。我们使用 归纳 从旧的事实推导出新的事实。例如,一个政治学专
业的大学生会观察很多政客的行为,然后从这些观察中归纳出一个结论:所有政客都会在竞选活
动中说谎。
当计算机科学家说起机器学习时,他们通常指的是进行一种训练,通过这种训练可以编写
能自动学会根据数据隐含模式进行合理推断的程序。举例来说,通过线性回归
可以学习一条曲线,作为一组实例的模型,然后使用这个模型对未知实例进行预测。
机器学习简介
微酸已着枝2023-10-11 14:26
相关推荐
程序员cxuan4 小时前
为每个任务配一套 harness:Claude Code 里的动态工作流程序员cxuan4 小时前
Claude Fable 5 来了云边云科技_云网融合4 小时前
云边云科技亮相 2026 WOD 制造业数智化博览会 云网融合赋能制造焕新Σίσυφος19004 小时前
激光三角 光平面标定-多高度误差分析JS菌4 小时前
手写一个 AI Agent 全栈项目:从沙箱执行到子智能体的完整实现lqqjuly4 小时前
前沿算法深度解析(二)Bode_20024 小时前
基于大数据分析的全生命周期质量追溯质量评估体系落地方案分布式存储与RustFS5 小时前
RustFS S3 Table 开源后,我重新梳理了一下 Iceberg 数据湖的选型思路DevOpenClub5 小时前
用 Agent 搭建网页内容采集与结构化处理流水线56AI5 小时前
2026 企业级AI智能体开发平台推荐:聚焦底层安全与准确率的智能体平台