当今世界的数据量增长速度简直超乎想象。从 20 世纪 80 年代开始,世界上的数据存储容量大
约每 3 年就翻一番。在你读完本章的这段时间内,世界上的数据存储会增加10的18次方位。很难想象这个
数字有多大,可以打个比方, 10的18次方 枚加拿大便士的面积大约是地球表面积的两倍。
当然,更多数据并不一定能提供更多有用信息。进化是一个缓慢的过程,人类思维对数据的
吸收能力也不可能每 3 年就翻一番。如果要从"大数据"中尽可能提取有用信息,现在可以使用
统计机器学习 。
机器学习很难明确地定义。从某种意义上说,所有可用的程序都可以学习到一些东西。例如,
对牛顿法的程序实现可以"学习"一个多项式的根。最早的一种机器学习定义是由美国电气工程
师、计算机科学家亚瑟·塞缪尔 ① 提出的,他给出的定义是:"机器学习是使计算机不用特意编程
就可以获得学习能力的研究领域。"
人类通过两种方式进行学习 ------ 记忆和归纳。我们通过记忆积累单个事实。例如,在英国,
小学生会学习英国的历代君王。我们使用 归纳 从旧的事实推导出新的事实。例如,一个政治学专
业的大学生会观察很多政客的行为,然后从这些观察中归纳出一个结论:所有政客都会在竞选活
动中说谎。
当计算机科学家说起机器学习时,他们通常指的是进行一种训练,通过这种训练可以编写
能自动学会根据数据隐含模式进行合理推断的程序。举例来说,通过线性回归
可以学习一条曲线,作为一组实例的模型,然后使用这个模型对未知实例进行预测。
机器学习简介
微酸已着枝2023-10-11 14:26
相关推荐
爱的叹息4 分钟前
DeepSeek 大模型 + LlamaIndex + MySQL 数据库 + 知识文档 实现简单 RAG 系统PeterOne14 分钟前
Trae MCP + Obsidian 集成如何缓解开发者的时间损耗sduwcgg44 分钟前
kaggle配置DolphinScheduler社区1 小时前
白鲸开源与亚马逊云科技携手推动AI-Ready数据架构创新欣然~1 小时前
借助 OpenCV 和 PyTorch 库,利用卷积神经网络提取图像边缘特征白熊1882 小时前
【计算机视觉】CV实战项目 - 基于YOLOv5的人脸检测与关键点定位系统深度解析nenchoumi31192 小时前
VLA 论文精读(十六)FP3: A 3D Foundation Policy for Robotic Manipulation后端小肥肠2 小时前
文案号搞钱潜规则:日入四位数的Coze工作流我跑通了LCHub低代码社区2 小时前
钧瓷产业原始创新的许昌共识:技术破壁·产业再造·生态重构(一)-曾牛2 小时前
Spring AI 快速入门:从环境搭建到核心组件集成