AI, Machine Learning和 Deep Learning有什么差异？

由于人工智能的爆炸式增长，我们看到了解决各种问题的新技术的爆发。虽然这是一个积极的结果，但这导致人工智能团队内部对如何最好地解决问题感到困惑。

这篇文章的灵感来自于与客户的多次讨论。我得到的最常见的问题之一是我如何选择合适的工具来完成这项工作。今天，我将讨论我在提供解决方案时在传统人工智能、监督机器学习和深度学习之间进行选择的框架。虽然这不是一门精确的科学，但一些一般的启发式方法可以作为指导方针。这是我对各种技术的评估------

传统人工智能------最安全、最容易理解和最高性能。然而，传统人工智能的良好实现要求我们定义系统背后的规则，这使得其他两种技术蓬勃发展的许多用例不可行。
监督机器学习------中间的人工智能和深度学习。当我们对系统的工作有一些洞察力，但无法为其创建具体、定义明确的规则时，这很好。
深度学习------不透明且成本高昂，太多的团队在其他解决方案足够的情况下急于使用深度学习。然而，对于非常非结构化的数据，识别规则和关系非常困难（甚至不可能）。在这里，深度学习可能是唯一的前进道路。

其中一个并不比另一个好。它们也不是相互排斥的。即使在现代人工智能管道中，传统的人工智能技术，如正则表达式、概率分布和聚类，也用于数据提取、特征工程和管道监控。这使得机器学习和深度学习的有效部署成为可能。

AI, Machine Learning和 Deep Learning有什么差异

实际上，DL是机器学习的子类，机器学习是人工智能中的一个子领域。人工智能本身就是一个巨大的领域，包含从if语句集合到复杂进化算法和自组织系统的一切。

传统的人工智能系统是通过分析系统并围绕它创建规则来开发的。这些规则是明确编程的，大大提高了系统的透明度。这些系统在计算上也很高效，因为没有昂贵的训练过程，但是，由于这些规则必须在运行系统之前定义，传统的人工智能经常在适应范围内受到阻碍。在非常复杂（或高维系统）的情况下，推断变量之间的规则/关系可能是不切实际或不可能的。这就是ML的用武之地。ML工程师为机器提供大量数据，并让机器自己近似规则。

机器学习之所以引人注目，是因为它符合信息时代的许多要求------

廉价的计算和大量的数据使得训练ML系统变得可行。
人类专家的时间是昂贵的，所以付钱给他们来尝试识别非常复杂的规则并不总是有意义的。

深度学习只是更进一步。传统的机器学习依赖于特征抽取，这可能不可能在所有用例中实现。例如，当我在Deepfalse检测工作时，我真的很难手动提取与深伪技术相关的特征。这就是DL可以发挥作用的地方。

深度学习使过程中的大部分特征抽取自动化，消除了一些所需的人工干预...深度学习模型需要更多的数据点来提高准确率，而机器学习模型依赖于更少的数据，因为它的底层数据结构。

有了这个解释，现在让我们看看一些变量，这些变量可以用来识别这些变量的来源。首先从数据的可用性开始。

数据可用性

如果无法访问高质量和大量的数据，ML和DL通常是不可行的。当数据稀缺时，传统的人工智能系统是唯一能有效工作的解决方案------假设你拥有创建规则的领域专业知识。

对于无法制定明确规则的非常复杂的系统呢？我的第一反应是考虑放弃并找到更好的方式来使用你的资源。这么说可能不太好------但不是所有问题都可以通过自动化决策来解决。也不应该是这样。有时最好把想法放在以后。太多的团队犯了一个错误，即对这项技术过于吹毛求疵，却没有充分考虑它是否真的是一个好主意。

为了讨论起见，假设你有一个低质量数据的用例，你必须在此基础上进行构建。你注定要失败吗？嗯...看情况。

如果你有大量低质量的数据，事情会很有趣。数据有很多问题------信息不可靠、缺失度高、维度高。

拥有大量高质量的数据使ML和DL变得可行，但这并不总是意味着我们需要使用它们。你可能会发现投资回报率不值得。这就是你需要与产品和工程团队保持紧密联系的地方，以创建有意义的基线和截止线。

对领域的理解

下一个要考虑的因素是你对领域的理解。为了创建有效的规则，你需要深入了解你的系统。如果你对你的系统有很好的理解，那么传统 AI 会给你惊人的性能。引用NetHack挑战赛中的这句话：我们看到各种自动化代理对决以击败游戏。有趣的是，挑战由符号AI而不是RL代理主导。

符号机器人擅长将完整的游戏状态保存在记忆中，并将外部知识融入他们的策略中。他们发现将领域知识转移到决策过程中很容易。相比之下，神经代理发现在记忆中维护信息更难，尤其是在没有直接相关奖励的情况下。

如果你能创造好的规则，传统的人工智能可以创造奇迹。

如果没有良好的领域理解，你就是在传统人工智能上浪费时间。这是人工智能系统的一个缺点，因为领域专家提供输入的时间和开发人员将这些输入转化为规则的时间都非常昂贵。试图为非常复杂（或混乱）的系统制定规则是一场噩梦。这就是机器学习可以发挥作用的地方。

机器学习可以大大减少开发系统所需的专家时间。领域专家的见解可以快速转换为特征，然后将其提供给模型。这些特征充当模型的指南，告诉它什么是重要的，而不需要我们明确地建模关系。机器会为我们做这件事。

在本文中，我们比较了四种不同的PLM在三个公共无域数据集和一个包含特定领域单词的真实世界数据集上与具有TFIDF矢量化文本的简单SVM线性分类器的性能。在四个数据集上的实验结果表明，使用PLM，即使微调，也不会提供比线性的SVM分类器显著的增益。因此，我们建议对于文本分类任务，传统的SVM加上仔细的特征工程可以提供比PLM更便宜和更优越的性能。

如果你不了解领域，那么深度学习就会成为你的好朋友。视觉和语言就是完美的例子。为这些任务想出好的功能是一场噩梦（我们有大量的数据）。所以DL可以去解决问题。我们的研究中看到了另一个例子------LSTM能够在击败信号干扰方面优于特征工程+神经网络。对于非常非结构化/复杂的数据，DL可以创造奇迹。

在这种情况下，我的观点是，团队应该从纯深度学习转向更无聊的方法。这些无聊的方法可以增加系统的效率、稳定性和透明度。这可能涉及构建过滤器来限制DL模型的使用，将一些功能集成到您的决策引擎中，或者投资显著性可视化以更好地理解您的模型认为什么是重要的。

请注意，这并不意味着删除有效的方法，而是使用额外的时间来理解系统，从而增强深度学习能力。人们经常产生的一个误解是认为深度学习总是优越的（或者它的反文化等价物"深度学习不起作用"）。事实是，这些技术通常是相辅相成的。几乎我使用过的每一个系统都以不同的方式使用了这三种方法。网上所有声称一种比另一种好的讨论都只是毫无意义的文化战争。尽量不要参与这种毫无意义的部落主义，把你的时间投入到更好的事情上。

预算

这个相当简单，但为了完整起见，我把它包括在内。你的预算通常会告诉你你想构建什么样的解决方案。如果你有很多时间和专业知识，但计算量较低------传统人工智能是你最好的朋友。求逆，DL是你回家的那个。机器学习存在于中间。

安全

深度学习和安全并不完全一致，这不应该让你感到震惊。由于我们在没有太多领域知识的领域使用DL，我们无法完全控制它是很自然的。深度学习就像你和孩子们在组装项目上一起工作了几个小时后拼凑起来的粗糙逻辑。你们都不知道它是如何或为什么工作的。你把数据扔给DL，重新发现你对上帝的信仰，并大力祈祷它能起作用。

这也意味着你要证明你的系统是有效的，或者预测系统将来会如何变化。你不知道它在你没有意识到的情况下收集了什么样的偏见/信息。你可以投资更好的训练或透明度协议，但你只能做这么多。

传统人工智能在这方面恰恰相反。就其本质而言，你对它的工作有相当大的透明度，它的安全性在理论上是可以证明的。理论上，这个词在那里做了一些布莱恩·肖级别的繁重工作，但即使如此，你仍然对你的传统人工智能系统的工作有很多洞察力。

同样，机器学习位于中间。特征的使用（+特征重要性计算）意味着你可以很好地了解你的模型希望在哪里做出决定。这很重要，但你又不能证明什么。这有点棘手。这是我偏向简单模型的原因之一。将计算引入数据工程、模型评估和管道监控弥补了基于机器学习/机器学习DL的系统透明度较低的问题。

希望这篇文章对你有用。良好的判断和设计与其说是一门科学，不如说是一门艺术。