当今世界的数据量增长速度简直超乎想象。从 20 世纪 80 年代开始,世界上的数据存储容量大
约每 3 年就翻一番。在你读完本章的这段时间内,世界上的数据存储会增加10的18次方位。很难想象这个
数字有多大,可以打个比方, 10的18次方 枚加拿大便士的面积大约是地球表面积的两倍。
当然,更多数据并不一定能提供更多有用信息。进化是一个缓慢的过程,人类思维对数据的
吸收能力也不可能每 3 年就翻一番。如果要从"大数据"中尽可能提取有用信息,现在可以使用
统计机器学习 。
机器学习很难明确地定义。从某种意义上说,所有可用的程序都可以学习到一些东西。例如,
对牛顿法的程序实现可以"学习"一个多项式的根。最早的一种机器学习定义是由美国电气工程
师、计算机科学家亚瑟·塞缪尔 ① 提出的,他给出的定义是:"机器学习是使计算机不用特意编程
就可以获得学习能力的研究领域。"
人类通过两种方式进行学习 ------ 记忆和归纳。我们通过记忆积累单个事实。例如,在英国,
小学生会学习英国的历代君王。我们使用 归纳 从旧的事实推导出新的事实。例如,一个政治学专
业的大学生会观察很多政客的行为,然后从这些观察中归纳出一个结论:所有政客都会在竞选活
动中说谎。
当计算机科学家说起机器学习时,他们通常指的是进行一种训练,通过这种训练可以编写
能自动学会根据数据隐含模式进行合理推断的程序。举例来说,通过线性回归
可以学习一条曲线,作为一组实例的模型,然后使用这个模型对未知实例进行预测。
机器学习简介
微酸已着枝2023-10-11 14:26
相关推荐
badhope几秒前
Python、C、Java 终极对决!谁主沉浮?谁将消亡?薛不痒1 分钟前
模型部署:基于flask和pytorchlinxinglu4 分钟前
DeepMind:解开智能之谜与「科学发现」的终极自动化杠杆AEIC学术交流中心4 分钟前
【快速EI检索 | ACM ICPS出版】2026年人工智能、虚拟现实与文化遗产国际学术会议 (AIVRCH 2026)wenzhangli76 分钟前
OUC NLP双链路闭环设计:基于ooderAgent的LLM+知识库+RAG架构深度解析KKKlucifer7 分钟前
动态数据识别与分类分级一体化技术研究balmtv7 分钟前
Gemini 3多模态统一架构深度拆解:从稀疏注意力到原生视频生成的工程实现IT_陈寒9 分钟前
JavaScript开发者必知的5个高效调试技巧,比console.log强10倍!咚咚王者18 分钟前
人工智能之语言领域 自然语言处理 第十四章 预训练模型