当今世界的数据量增长速度简直超乎想象。从 20 世纪 80 年代开始,世界上的数据存储容量大
约每 3 年就翻一番。在你读完本章的这段时间内,世界上的数据存储会增加10的18次方位。很难想象这个
数字有多大,可以打个比方, 10的18次方 枚加拿大便士的面积大约是地球表面积的两倍。
当然,更多数据并不一定能提供更多有用信息。进化是一个缓慢的过程,人类思维对数据的
吸收能力也不可能每 3 年就翻一番。如果要从"大数据"中尽可能提取有用信息,现在可以使用
统计机器学习 。
机器学习很难明确地定义。从某种意义上说,所有可用的程序都可以学习到一些东西。例如,
对牛顿法的程序实现可以"学习"一个多项式的根。最早的一种机器学习定义是由美国电气工程
师、计算机科学家亚瑟·塞缪尔 ① 提出的,他给出的定义是:"机器学习是使计算机不用特意编程
就可以获得学习能力的研究领域。"
人类通过两种方式进行学习 ------ 记忆和归纳。我们通过记忆积累单个事实。例如,在英国,
小学生会学习英国的历代君王。我们使用 归纳 从旧的事实推导出新的事实。例如,一个政治学专
业的大学生会观察很多政客的行为,然后从这些观察中归纳出一个结论:所有政客都会在竞选活
动中说谎。
当计算机科学家说起机器学习时,他们通常指的是进行一种训练,通过这种训练可以编写
能自动学会根据数据隐含模式进行合理推断的程序。举例来说,通过线性回归
可以学习一条曲线,作为一组实例的模型,然后使用这个模型对未知实例进行预测。
机器学习简介
微酸已着枝2023-10-11 14:26
相关推荐
小鸡吃米…6 小时前
机器学习 - K - 中心聚类好奇龙猫6 小时前
【AI学习-comfyUI学习-第三十节-第三十一节-FLUX-SD放大工作流+FLUX图生图工作流-各个部分学习】沈浩(种子思维作者)6 小时前
真的能精准医疗吗?癌症能提前发现吗?minhuan6 小时前
大模型应用:大模型越大越好?模型参数量与效果的边际效益分析.51Cherry的跨界思维6 小时前
28、AI测试环境搭建与全栈工具实战:从本地到云平台的完整指南MM_MS7 小时前
Halcon变量控制类型、数据类型转换、字符串格式化、元组操作ASF1231415sd7 小时前
【基于YOLOv10n-CSP-PTB的大豆花朵检测与识别系统详解】水如烟7 小时前
孤能子视角:“意识“的阶段性回顾,“感质“假说Carl_奕然8 小时前
【数据挖掘】数据挖掘必会技能之:A/B测试旅途中的宽~8 小时前
《European Radiology》:2024血管瘤分割—基于MRI T1序列的分割算法