拥抱人工智能,从机器学习开始
目录:
转载链接:
文章-阿里云开发者社区-云计算社区-阿里云
背景:
自"阿尔法狗"(AlphaGo)完胜人类围棋顶尖高手后,有关人工智能(AI)的讨论就从未停歇。工业4.0方兴未艾,人工智能引领的工业5.0时代却已悄然苏醒。
人工智能的火爆离不开互联网、云计算、大数据、芯片和软件等技术的发展,而深度学习的进步却是当今人工智能大爆炸的核心驱动。
作为一个跨学科产物,人工智能的内容浩如烟海,各种复杂的模型和算法更让人望而生畏。那么作为一个普通程序员,在已有语言技能的前提下,该如何拥抱变化,向人工智能靠拢?如何在自己的工作中应用人工智能?学习人工智能应该从哪里开始? 人工智能并非遥不可及,人人都可以做人工智能!
人工智能是让机器像人一样思考,而机器学习则是人工智能的核心,是使计算机具有智能的根本途径。学习人工智能,首先要了解机器学习的相关算法。 本文我们将与大家一起探讨机器学习的相关算法,共同揭开人工智能的神秘面纱。
1. 机器学习
一种实现人工智能的方法
智能是现代生活中一个很常见的词,例如智能手机、智能家居产品、智能机器人等,但是不同的场合智能的含义也不一样。我们所说的"人工智能"(Artificial Intelligence, AI)则是指让机器像人一样思考,具备人类的智能。
从诞生至今,人工智能这个领域经历了一次又一次的繁荣与低谷,其发展上大体上可以分为"推理期","知识期"和"学习期"。推理期主要注重逻辑推理但是感知器过于简单;知识期虽然建立了各种各样的专家系统,但是自主学习能力和神经网络资源能力都不足。学习期机器能够自己学习知识,而直到1980年后,机器学习因其在很多领域的出色表现,才逐渐成为热门学科。近代,随着互联网、云计算、大数据的发展,以及GPU、芯片和软件技术的提升,深度学习开始兴起,拓展了人工智能的领域范围,也推动着社会从数字化向智能化的变革。
人工智能的主要包含几个部分:首先是感知,包括视觉、语音、语言;然后是决策,例如做出预测和判断;最后是反馈,如果想做一套完整的系统,就像机器人或是自动驾驶,则需要一个反馈。 人工智能众多的能力中,很重要的一个能力是其学习能力-机器学习,它是人工智能的核心,是使计算机具有智能的关键。不能自我学习,人工智能也只是徒有其表。
认识人工智能,还需要理清几个概念之间的关系:人工智能是一个大的概念,是让机器像人一样思考甚至超越人类;而机器学习是实现人工智能的一种方法,是使用算法来解析数据、从中学习,然后对真实世界中的事件做出决策和预测;深度学习是机器学习的一种实现方式,通过模拟人神经网络的方式来训练网络;而统计学是机器学习和神经网络的一种基础知识。
机器学习最大的特点是利用数据而不是指令来进行各种工作,其学习过程主要包括:数据的特征提取、数据预处理、训练模型、测试模型、模型评估改进等几部分。接下来我们重点介绍机器学习过程中的常见算法。
2. 机器学习算法:是使计算机具有智能的关键
是使计算机具有智能的关键 算法是通过使用已知的输入和输出以某种方式"训练"以对特定输入进行响应。代表着用系统的方法描述解决问题的策略机制。人工智能的发展离不开机器学习算法的不断进步。 机器学习算法可以分为传统的机器学习算法和深度学习。传统机器学习算法主要包括以下五类:
- 回归:建立一个回归方程来预测目标值,用于连续型分布预测
- 分类:给定大量带标签的数据,计算出未知标签样本的标签取值
- 聚类:将不带标签的数据根据距离聚集成不同的簇,每一簇数据有共同的特征
- 关联分析:计算出数据之间的频繁项集合
- 降维:原高维空间中的数据点映射到低维度的空间中
下面我们将选取几种常见的算法,一一介绍。
1. 线性回归:找到一条直线来预测目标值
一个简单的场景:已知房屋价格与尺寸的历史数据,问面积为2000时,售价为多少?
此类问题可以用回归算法来解决。回归是指确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,通过建立一个回归方程(函数)来估计特征值对应的目标变量的可能取值。 最常见的是线性回归(Y= a X + b),即找到一条直线来预测目标值。回归的求解就是求解回归方程的回归系数(a,b)的过程,并且使误差最小。 房价场景中,根据房屋面积和售价的关系,求出回归方程,则可以预测给定房屋面积时的售价。
线性回归的应用非常广泛,例如:
预测客户终生价值: 基于老客户历史数据与客户生命周期的关联关系,建立线性回归模型,预测新客户的终生价值,进而开展针对性的活动。
机场客流量分布预测: 以海量机场WiFi数据及安检登机值机数据,通过数据算法实现机场航站楼客流分析与预测。
货币基金资金流入流出预测: 通过用户基本信息数据、用户申购赎回数据、收益率表和银行间拆借利率等信息,对用户的申购赎回数据的把握,精准预测未来每日的资金流入流出情况。
电影票房预测: 依据历史票房数据、影评数据、舆情数据等互联网公众数据,对电影票房进行预测。