人工智能导论（期末复习）

人工智能导论

人工智能（Artifical Intelligence，简称AI）

人工智能的本质：人工智能是一门研究如何制造出人造的智能机器或智能系統，来模拟人类智能活动的能力，以延伸人们智能的科学。

一、如何判定人工智能的存在（人工智能系统的智能存在性判别）

1、图灵测试

（1）概述：

图灵测试是哲学领域，思想实验，从形式上判别人工智能（从行为上对智能检测）

（2）基本思想：

通过模拟对话来判断一个机器是否能够表现得像一个有智能的人一样

（3）实验概述：

在图灵测试中，有一个评判者（通常是人类）与一个机器和一个真实的人进行对话，评判者不能直接看到对话的参与者。如果评判者无法区分哪个是机器哪个是真人，即无法通过对话内容来判断出机器的存在，那么这台机器就通过了图灵测试，被认为具备了智能。

（4）实验方案：

++提问者、被提问者（一台机器，一个人）；++

++提问的方式没有额外的信息泄露；++

++如果提问者区分两者的正确率小于50%，则可以认为机器具有智能。++

（5）三个重点

一个测试者，一个受测者，一台机器；

所有交流信息无泄漏；

如果提问者区分两者的正确率小于50%，则可以认为机器具有智能。

2、希尔勒的中文屋子实验

（1）实验描述

一个对中文一窍不通的，以英语为母语的人被关闭在一个只有两个通口的封闭房间中。房间里有一本中英翻译手册。房间外的人不断向房间内递进用中文写成的问题。房内的人便按照手册的说明，用中文回答出问题，并将答案递出房间。

（希尔勒中文屋子实验表明，用图灵测试来定义智慧是远远不够的。）

（2）实验要旨：

++提问者使用中文讲故事并提出问题，被提问者（只懂得英文）使用规则（用英语表示）产生问题的答案，即使被提问者完全不懂中文，仍然能够产生正确的答案。（也是一个思想实验）++

（3）实验目的一>通过了图灵测试就具有了智能吗？

++即使计算机给出了正确的答案，即使一台机器已经实际通过了简化的图灵检验的电脑，这台电脑仍然完全不具备和理解相关的"精神属性"。++

（4）如何理解希尔勒的中文屋子？

这个实验挑战了计算机的智能和意识是否与人类的智能和意识相似或等价的观点。西尔认为，即使机器能够通过模仿人类的行为和回答通过图灵测试，也不能证明机器具有真正的智能和意识。通过中文屋子实验，西尔试图阐述了"强人工智能"观点的问题，即机器是否能够真正具备与人类相似或等价的智能和意识。

"强人工智能"：某种形式的人工智能能够真正地推理和解决问题。

人工智能的定义是未知的，判定方法是哲学的。

3、莫拉维克悖论一>人的智能与机器的智能是同一个智能吗？

++从现象上看，计算机和人类似乎具有不同的智能。为什么具有不同的智能？计算机强于计算和逻辑推理（具有非常强悍的逻辑推理能力），人强于（例如：）图形识别。所以人的智能和机器的智能是不同的智能。计算机的智能更注重执行逻辑推理和高速计算，人类的智能更注重感知、理解和适应复杂环境。++

4、应用：

图灵测试+莫拉维克悖论可用于做验证码（图形识别对人来说非常快，但对计算机而言非常困难）

二、人工智能的四个流派

1、符号主义（基于符号处理的符号主义）Symbolism

人类思维的基本单元是符号，思维过程是对符号的处理过程，自然语言也是用符号表示的。

（1）理论基础：

理论基础：物理符号系统假设和有限合理性原理。

物理符号系统假设：物理符号系统是表现智能行为必要和充分的条件；
有限合理性原理：人类行为表现出有限的合理性。

（2）理解：

符号主义是从计算机的角度来讲的，计算机本质上是一个逻辑机器即符号机器（计算机能完成人类的第一语言符号系统、第二语言符号系统.....］

符号主义做了一个物理符号假设，它认为人类和机器都具有等价的智能。

（3）深入讨论：

**符号主义认为人类和机器是一样的。**从机械的角度阐述智能的产生。

++建立在机器的基础上，完成人工领域的探索，做成计算机最早的模型为图灵机，图灵机是一个理想的机器。++

++图灵机＜一>RAM（冯•诺依曼机）＜一>入程序（编程语言）++

1）机器中分为两部分：

a. 数据段（DS）：知识表示

知识表示，即如何把一个二进制串转换为人类理解的模式？或把人类理解的模式转变为二进制比特？

知识表示有很多项：

b. 代码段（CS）：算法和搜索一＞我们表示的数据怎么拿出？怎么样进行变化？怎么样读、写和增删查？

2、联接主义（以人工神经网络为代表的连接主义）Connectionism

人工神经网络是典型代表，其理论基础是脑模型，人工神经网络具有良好的自学习、自适应和自组织能力，以及大规模并行，分布式信息存储和处理的特点。可以处理不确定性问题。

（1）理论基础：

连接主义的理论基础是脑模型。

（2）典型代表：

人工神经网络是连接主义的典型代表。

（3）核心：

智能的本质是联接机制。

（4）补充：

人工神经网络具有良好的自学习，自适应和自组织能力，以及大规模并行，分布式信息存储和处理的特点，可以处理不确定性问题。

3、演化主义（以演化计算为代表的演化主义）Evolutionism

模拟自然界的生物演化过程入手，以解决智能系统如何从环境中进行学习的问题。理论基础为达尔文的进化论。

（1）理论基础：

++演化理论的理论基础是达尔文的进化论。++

（2）理解：

++智能是进化产生的。++

4、行为主义（以多智能体系为代表的行为主义）Actionism

在没有对简单的智能系统有清楚的了解和大量的实践以前，不可能准确的地理解构造更为复杂的人类智能的方法。从简单的系统开始，逐步构造出更为复杂的系统理论基础为控制论Cybernetics。

（1 )理解：

++从自动化的角度去研究智能的产生。++

（2）补充：

从简单的系统开始，逐步构造出更为复杂的系统。

理论基础为控制论Cybernetics。

三、知识表示及其对应搜索

1、知识表示的分类：

（1）状态空间表示：线性代数

++状态空间表示法即线性代数。++

（2）逻辑表示：命题的表示、一阶谓词的表示

逻辑表示分为命题的表示和一阶谓词表示法。

逻辑表示法和其他的方法都是等价的。

（3）产生式表示：^

理解：逻辑表示的"与或非"改成产生式"推导"和"入"，此时会构成一个个规则（规则1，规则2， ...，规则n），得到产生式X（每一个答案即是一个产生式），那么我们的系统就会变成一个产生次数的系统。

实质：逻辑表示的"与或非"改成"推导"和"A"

在产生式系统下研究它，可发现他们之间都是一致、等价的。

（4）语义网络表示

语义网络表示实际是一个图形化表示方法，其最终可变成二元谓词表示。X--->yf（x,y）。

语义网络表示实际是一个二元谓词的表示。

++！！！多元谓词如何处理？将其转换成多个二元谓词，通过加入一个虚元，把每一个谓词的元素都连接上它，即可将多元谓词转换成多个二元谓词。！！++

（5）框架表示

框架表示，本质上就是语义网络表示，就是一个谓词表示。

等价于一阶谓词表示、面向对象程序设计、数据库，是一致的。所以数据库也是一阶谓词。

集合是一阶谓词。理解：一个谓词x等于1，构造一个集合，将x放入该集合，所以集合与一阶谓词之间构成了一一等价的关系，也就是一一映射、对应关系，所以，一个集合就是一个谓词。

集合与集合之间的关系：集合的运算一＞子交井补差

四、算法与搜索

1. 算法（不讲）

2. 搜索（实验编程）

（1）广度优先！！！

（2）深度优先！！！

（3）广度优先和深度优先统称为盲目搜索

（4）逻辑性搜索算法

刚才表示里对应的搜索，它们全部是逻辑的，因此可以通过逻辑的方式来进行搜索，这个就叫机器证明。

机器证明：在逻辑上的搜索，在一阶谓词上的搜索。

合并性归结：...（书上不同的搜索之间的区别等等）

（5）启发搜索

五、不确定性推理方法

1、模糊数学！！！

（1）计算（交井补差）

（2）公理

++一般的公理，如交换律、结合律、分配律、德摩根律等等都是存在的。++

++但排中律不是绝对的，对模糊集合来说排中律失效。++

排中律指的是任何命题要么为真，要么为假，不存在中间的状态。

（3）模糊集合和明确集合之间的关系

++例如：C=赵/0.3+钱/0.5+孙/0.9+李/1++

++权重：元素对整个集合有贡献++

++CO+=｛赵，钱，孙，李｝权重大于0元素++

++C0.4=｛钱，孙，李｝权重大于0.4的元素++

（4）数据库等价于一阶谓词，等价于函数

++x与y之间存在一个映射关系，Y=×2，此时是一个函数，也可以写成：++

++if x=1, then y=1; if x=2, then y=4; if x=3,++

++then y=9 >记忆法++

++记忆法：任意给定一个数据，都能大致得出它在做什么（结果是什么）记忆法等价于人工智能的神经网络。++

++Kamogror压缩：将该程序压缩（根据x，求y的程序），转换成另一个更简单的程序，得到加速程序。++

六、机器学习

1、本质

++机器学习本质上：根据数据得到一个记忆法（函数），对这个记忆法进行kdmogror压缩。++

++神经网络可解释性：神经网络是不是可以得到这样一个函数，是不是可以得到一种非常简单的情形。++

++本质上即记忆法能不能压缩到这样一个情形，显然存在着一个数据是不可被压缩的，即存在不可压缩的神经网络。++

++存在不可压缩的数据（神经网络），存在着不可解释的神经网络。++

七、神经网路

1、BP神经网络

（1 ）感知机

++感知机不能做线性划分。不能解决不可线性划分问题，只能解决线性可分问题。++

++异或不可划分问题：在二元形式上，共有16个函数，其中"同或"和"异或++"这两个函数不可线性划分。

如何证明异或不可划分问题？

基本思想：逐步地将样本集中的样本输入到网络中，根据输出结果和理想输出之间的差别来调整网络中的权矩阵

（2）BP算法

原理：多层感知器的输入输出关系与单层感知器完全相同。前一层的输出是下一层的输入。也被称为BP网络。

八、演化计算

演化计算的本质上是一种迭代算法，是一种生成测试法，生成新个体的规则是统一的。

1. 分类

（1） GA

（2）EA

（3） GP：函数规约

给一串数据，提供其表达式。

（4） EP：博弈论

策略是最好的

2、NFt定理

重要定理：Nft定理，不存在超级算法能解决优化问题。

++NFt定理的核心思想是：在所有可能的问题上，平均而言，任何两个优化算法的性能是相等的。换句话说，没有一种通用的优化算法可以在所有问题上都表现最好。++

九、重要概念

1、哥德尔不完备性定理

++哥德尔不完备性定理表明，对于足够强大的形式系统（如数学中的公理系统），必然存在一些无法在该系统内被证明或推导出的命题。（只要是不那么简单的系统，一定存在着一些为真的命题不能被证明。++

++两个性质：相容性、完备性++

2、莫拉维克悖论

3、补充

（1）图灵完备性（Turing Completeness）

图灵完备性是指某个计算系统能够模拟图灵机的计算能力。这意味着只要一个系统具有图灵完备性，它就可以进行任何可计算的计算。这个定理对于理解计算机的能力和限制非常重要。

（2） NFt定理（No Free Lunch Theorem）

NFt定理表明，在所有可能的问题上，平均而言，任何两个优化算法的性能是相等的。这个定理强调了没有通用的优化算法适用于所有问题，需要根据问题的特点选择合适的算法。

（3）贝叶斯定理（Bayes' Theorem）

贝叶斯定理是概率论中的一个基本定理，用于计算在已知一些先验条件下，事件的后验概率。在机器学习和统计推断中，贝叶斯定理被广泛应用于概率模型的更新和参数估计。

（4）维度灾难（Curse of Dimensionality）

维度灾难是指在高维空间中，数据稀疏性增加、计算复杂度增加的现象。随着维度的增加，数据点之间的距离变得越来越远，导致难以有效地处理和分析高维数据。

（5） VC维理论（Vapnik-Chervonenkis Theory）

VC维理论是统计学习理论中的一个重要定理，用于衡量一个分类算法的能力和复杂度。VC维描述了一个分类器能够拟合的样本集的最大数量，在模型选择和泛化能力评估中具有重要意义。

十、题型

选择 2*10

简答题 4*6

证明：1*8

表示与计算（3*4）+（8+6）

编程题 2*11

习题见附件（人工智能导论）

人工智能导论（期末复习）