当今世界的数据量增长速度简直超乎想象。从 20 世纪 80 年代开始,世界上的数据存储容量大
约每 3 年就翻一番。在你读完本章的这段时间内,世界上的数据存储会增加10的18次方位。很难想象这个
数字有多大,可以打个比方, 10的18次方 枚加拿大便士的面积大约是地球表面积的两倍。
当然,更多数据并不一定能提供更多有用信息。进化是一个缓慢的过程,人类思维对数据的
吸收能力也不可能每 3 年就翻一番。如果要从"大数据"中尽可能提取有用信息,现在可以使用
统计机器学习 。
机器学习很难明确地定义。从某种意义上说,所有可用的程序都可以学习到一些东西。例如,
对牛顿法的程序实现可以"学习"一个多项式的根。最早的一种机器学习定义是由美国电气工程
师、计算机科学家亚瑟·塞缪尔 ① 提出的,他给出的定义是:"机器学习是使计算机不用特意编程
就可以获得学习能力的研究领域。"
人类通过两种方式进行学习 ------ 记忆和归纳。我们通过记忆积累单个事实。例如,在英国,
小学生会学习英国的历代君王。我们使用 归纳 从旧的事实推导出新的事实。例如,一个政治学专
业的大学生会观察很多政客的行为,然后从这些观察中归纳出一个结论:所有政客都会在竞选活
动中说谎。
当计算机科学家说起机器学习时,他们通常指的是进行一种训练,通过这种训练可以编写
能自动学会根据数据隐含模式进行合理推断的程序。举例来说,通过线性回归
可以学习一条曲线,作为一组实例的模型,然后使用这个模型对未知实例进行预测。
机器学习简介
微酸已着枝2023-10-11 14:26
相关推荐
小陈工1 小时前
Python Web开发入门(十七):Vue.js与Python后端集成——让前后端真正“握手言和“墨染天姬5 小时前
【AI】端侧AIBOX可以部署哪些智能体AI成长日志5 小时前
【Agentic RL】1.1 什么是Agentic RL:从传统RL到智能体学习2501_948114245 小时前
2026年大模型API聚合平台技术评测:企业级接入层的治理演进与星链4SAPI架构观察小小工匠6 小时前
LLM - awesome-design-md 从 DESIGN.md 到“可对话的设计系统”:用纯文本驱动 AI 生成一致 UI 的新范式黎阳之光6 小时前
黎阳之光:视频孪生领跑者,铸就中国数字科技全球竞争力小超同学你好6 小时前
面向 LLM 的程序设计 6:Tool Calling 的完整生命周期——从定义、决策、执行到观测回注智星云算力6 小时前
本地GPU与租用GPU混合部署:混合算力架构搭建指南jinanwuhuaguo6 小时前
截止到4月8日,OpenClaw 2026年4月更新深度解读剖析:从“能力回归”到“信任内建”的范式跃迁xiaozhazha_6 小时前
效率提升80%:2026年AI CRM与ERP深度集成的架构设计与实现