机器学习和人工智能之间的区别
人工智能(AI)和机器学习(ML)是更广泛的计算机科学领域中两个密切相关但又不同的领域。人工智能是一门专注于创建智能机器的学科,这些机器可以执行通常需要人类智能的任务,例如视觉感知、语音识别、决策和自然语言处理。它涉及开发可以根据输入数据进行推理、学习和决策的算法和系统。
另一方面,机器学习 (ML) 是人工智能的一个子领域,涉及教导机器从数据中学习,而无需明确编程。机器学习算法可以识别数据的模式和趋势,并使用它们来做出预测和决策。机器学习用于构建预测模型、对数据进行分类和识别模式,是许多人工智能应用程序的重要工具。
人工智能和机器学习的发展有潜力改变各个行业并在很多方面改善人们的生活。人工智能系统可用于诊断疾病、检测欺诈、分析财务数据和优化制造流程。机器学习算法可以帮助个性化内容和服务,改善客户体验,甚至帮助解决世界上一些最紧迫的环境挑战。
尽管人工智能和机器学习有很多好处,但人们也担心与这些技术相关的潜在风险和挑战。其中包括工作岗位流失的风险、对人类自主和决策的影响,以及人工智能和机器学习以有害方式使用的可能性。因此,以负责任和合乎道德的方式开发和使用人工智能和机器学习,并解决与这些技术相关的潜在风险和挑战非常重要。
人工智能(AI)
人工智能 包括"人工智能"和"人工智能"两个词。人工是指人类制造的东西或非自然的东西,智能是指理解或思考的能力。人们有一种误解,认为人工智能是一个系统,但其实它不是一个系统。系统中实现了人工智能。人工智能可以有很多定义,其中一个定义可以是"它是一门研究如何训练计算机,以便计算机能够做目前人类可以做得更好的事情"。因此,我们希望将人类所拥有的所有能力添加到机器中,这是一种智能。
机器学习(ML)
机器学习是机器无需明确编程即可自行学习的学习。它是人工智能的一种应用,为系统提供自动学习和从经验中改进的能力。在这里,我们可以通过集成该程序的输入和输出来生成一个程序。机器学习的简单定义之一是"如果学习者在该类任务中的表现(按 P 衡量)随着经验而提高,则机器学习可以从经验 E 中学习某类任务 T 和绩效指标 P。"
人工智能 (AI) 和机器学习 (ML) 之间的主要区别:
人工智能 | 机器学习 |
---|---|
1956 年"人工智能"一词最初由 John McCarthy 使用,他也是第一届 AI 会议的主持人。 | "机器学习"一词于 1952 年由人工智能和计算机游戏领域的先驱 IBM 计算机科学家 Arthur Samuel 首次使用。 |
AI代表人工智能,其中智能被定义为 获取和应用知识的能力。 | ML代表机器学习,定义为 知识或技能的获取 |
AI 是一个更广泛的家族,由 ML 和 DL 作为其组件。 | 机器学习是人工智能的子集。 |
目的是增加成功的机会而不是准确性。 | 目的是提高准确率,但并不关心;成功 |
人工智能的目标是开发一种能够 执行各种复杂工作的智能系统。决策 | 机器学习试图构建 只能完成其接受过训练的工作的机器。 |
它作为一个可以智能工作的计算机程序来工作。 | 在这里,任务系统机器获取数据并从数据中学习。 |
目标是模拟自然智能来解决复杂问题。 | 目标是从某些任务的数据中学习,以最大限度地提高 该任务的性能。 |
人工智能有着非常广泛的应用。 | 机器学习的范围受到限制。 |
人工智能就是决策。 | 机器学习允许系统从数据中学习新事物。 |
它正在开发一种模仿人类来解决问题的系统。 | 它涉及创建自学习算法。 |
人工智能将寻找最佳解决方案。 | 无论最优与否,机器学习都会寻求解决方案。 |
人工智能带来智慧。 | 机器学习带来知识。 |
AI 是一个更广泛的家族,由 ML 和 DL 作为其组件。 | 机器学习是人工智能的一个子集。 |
人工智能分为三大类:窄人工智能 (ANI)通用人工智能(AGI)超级人工智能(ASI) | 机器学习的三大类是:监督学习无监督学习强化学习 |
人工智能可以处理结构化、半结构化和非结构化数据。 | 机器学习只能处理结构化和半结构化数据。 |
人工智能的主要用途包括------ Siri,通过聊天机器人提供客户服务专家系统机器翻译,如谷歌翻译智能人形机器人如索菲亚 等。 | 机器学习最常见的用途 -Facebook 的自动好友推荐Google 的搜索算法银行欺诈分析 股价预测在线推荐系统等等。 |
人工智能是指创造能够模拟人类智能并执行理解自然语言、识别图像和声音、做出决策和解决复杂问题等任务的机器的广泛领域。 | 机器学习是人工智能的一个子集,涉及根据数据训练算法以做出预测、决策和建议。 |
人工智能是一个广泛的概念,包括创建智能机器的各种方法,包括基于规则的系统、专家系统和机器学习算法。人工智能系统可以被编程为遵循特定规则、进行逻辑推理或使用机器学习从数据中学习。 | 专注于教导机器如何使用神经网络、决策树和聚类等算法从数据中学习,而无需显式编程。 |
人工智能系统可以使用结构化和非结构化数据来构建,包括文本、图像、视频和音频。人工智能算法可以处理各种格式的数据,并且可以分析和处理数据以提取有意义的见解。 | 相比之下,机器学习算法需要大量结构化数据来学习和提高其性能。用于训练机器学习算法的数据的质量和数量是决定系统准确性和有效性的关键因素。 |
人工智能是一个更广泛的概念,涵盖许多不同的应用,包括机器人、自然语言处理、语音识别和自动驾驶汽车。人工智能系统可用于解决医疗、金融和交通等各个领域的复杂问题。 | 另一方面,机器学习主要用于营销、欺诈检测和信用评分等领域的模式识别、预测建模和决策。 |
人工智能系统可以设计为自主工作或以最少的人为干预工作,具体取决于任务的复杂性。人工智能系统可以根据提供给他们的数据和规则做出决策并采取行动。 | 相比之下,机器学习算法需要人工参与来设置、训练和优化系统。机器学习算法需要数据科学家、工程师和其他专业人员的专业知识来设计和实现系统。 |
机器学习问题中应遵循的一般步骤
机器学习是一种自动构建分析模型的数据分析方法。简单来说,机器学习就是"让机器学习"。机器学习是一个结合了许多传统学科的新领域。它是人工智能的一个子集。
机器学习是一种自动构建分析模型的数据分析方法。简单来说,机器学习就是"让机器学习"。机器学习是一个结合了许多传统学科的新领域。它是人工智能的一个子集。
什么是机器学习管道?
- ML 管道通过提供有关如何继续处理机器学习模型的系统方法来表达工作流程。
- ML 管道自动化了机器学习的过程,并且遵循管道使得 ML 模型的过程变得系统化和简单。
以下是 ML 管道的示意图:
- 机器学习管道从数据收集和集成开始。收集数据后,完成数据分析和可视化。此外,执行最关键的步骤特征选择和工程,然后训练模型。在该模型之后,评估就完成了,我们的模型就可以进行预测了!
- 为了更好地理解管道,请考虑为公司的客户服务构建一个机器学习模型。假设 XYZ 公司是一家在线书店,它向客户提供书籍和 Kindle,并且该公司希望改进客户服务。它希望如果客户因任何问题拨打帮助热线,例如更换书籍、购买 Kindle 的投诉或其他一些服务。该公司希望确保客户的电话在最短的时间内转接到正确的服务人员,并且整个过程应该顺利。为了构建公司的客户服务模型,我们将使用机器学习管道对模型进行系统开发。
1. 数据收集与整合:
- 机器学习管道的第一步涉及数据收集和数据集成。
- 收集的数据作为模型的输入(数据准备阶段)
- 输入称为特征。
- 在我们考虑的示例中收集的数据涉及大量数据。收集的数据应回答以下问题 - 过去的客户历史记录是什么?过去的订单是什么?顾客是我们书店的高级会员吗?客户有 kindle 吗?客户之前是否曾提出过任何投诉?投诉次数最多的是多少?
- 数据越多,我们的模型就越好。
- 收集数据后,我们需要整合和准备数据。
- 数据集成意味着将所有相关数据放在一起。
- 然后数据准备阶段开始,我们手动地、批判性地探索数据。
- 数据准备阶段告诉开发人员数据符合预期。是否有足够的信息来做出准确的预测?数据是否一致?
2. 探索性数据分析和可视化:
- 准备好数据后,开发人员需要将数据可视化,以便更好地理解数据集中的关系。
- 当我们看到数据时,我们可以注意到我们在第一阶段可能没有注意到的看不见的模式。
- 它可以帮助开发人员轻松识别丢失的数据和异常值。
- 数据可视化可以通过绘制直方图、散点图等来完成。
- 可视化完成后,对数据进行分析,以便开发人员可以决定他可以使用哪种机器学习技术。
- 在所考虑的示例情况中,无监督学习可用于分析客户购买习惯。
3. 特征选择和工程:
- 特征选择意味着选择开发人员想要在模型中使用哪些特征。
- 应选择特征,使得它们之间存在最小相关性,并且所选特征和输出之间存在最大相关性。
- 特征工程是将原始数据处理成新的潜在数据的过程,其中包含很多特征。
- 简而言之,特征工程就是将原始数据转换为有用的数据,或者最大限度地利用原始数据。
- 特征工程可以说是机器学习管道中最关键和最耗时的步骤。
- 特征选择和工程回答问题------这些特征对我们的预测有意义吗?
- 它涉及数据的准确性和精确度。
4.模型训练:
- 前三步完成后我们就进入模型训练阶段。
- 这是开发人员根据数据训练模型的正式第一步。
- 为了训练模型,数据被分为三部分:训练数据、验证数据和测试数据。
- 大约 70%-80% 的数据进入用于训练模型的训练数据集。
- 验证数据也称为开发集或开发集,用于避免过度拟合或欠拟合情况,即启用超参数调整。
- 超参数调整是一种用于对抗过度拟合和欠拟合的技术。
- 模型评估期间使用验证数据。
- 大约 10%-15% 的数据用作验证数据。
- 其余 10%-15% 的数据进入测试数据集。测试数据集用于模型准备后的测试。
- 在分割数据时随机化数据集以获得准确的模型至关重要。
- 可以使用 Python 中的 Scikit learn 来随机化数据。
5.模型评估:
- 模型训练后,验证或开发数据用于评估模型。
- 为了获得最准确的预测,测试数据可用于进一步的模型评估。
- 模型评估后创建混淆矩阵,以数值计算准确度和精度。
- 模型评估后,我们的模型进入最后阶段,即预测。
6.预测:
- 在预测阶段,开发人员部署模型。
- 模型部署后,就可以进行预测了。
- 对训练数据和测试数据进行预测,以便更好地理解构建模型。
模型的部署不是一次性的。随着越来越多的数据生成,模型会根据新数据进行训练,再次评估并再次部署。模型训练、模型评估、预测阶段相互循环。