:::info
💡 根据 遗忘曲线:如果没有记录和回顾,6天后便会忘记75%的内容
读书笔记正是帮助你记录和回顾的工具,不必拘泥于形式,其核心是:记录、翻看、思考
:::
书名 | 《人工智能导论》 |
---|---|
作者 | 王万良 |
状态 | 学习中 |
简介 |
思维导图
用思维导图,结构化记录本书的核心观点。
一、知识
1.1 什么是知识?
人类的智能活动主要是获得并运用知识。知识是智能的基础。知识的表示成为人工智能中一个非常重要的研究课题
知识是人们长期的生产、生活、科学研究以及实验中积累起来的对客观世界的认识与经验。人们把实践中获得的信息关联子啊一起,就形成了知识。一般来说,把有关信息关联在一起所形成的信息结构称为知识。
eg 如果头疼且流鼻涕,则有可能患了感冒 。 表示了头疼且流鼻涕与有可能患了感冒之间的一种因果关系。人工智能中将前一种知识称为“事实”,后一种称为“结论”。
1.2 知识的特性
- 相对正确性
在一定条件及范围下,知识一般是正确的。例如:1+1=2,在十进制下成立,但在二进制下不成立
- 不确定性
- 由随机性引起的不确定性:如果头疼且流鼻涕,则有可能患了感冒 ,也有可能是得了肺炎
- 由模糊性引起的不确定性
- 由经验引起的不确定性
- 由不完全性引起的不确定性
- 可表示性与可利用性:知识可以用适当形式表示出来,如语言、文字、图形、神经网络等
1.3 知识的表示
知识表示(Knowledge representation)就是将人类知识形式化或者模型化。一种计算机可以接受的用于描述知识的数据结构。
目前已经提出了很多种知识表示方法,例如本书重点介绍的一阶谓词逻辑表示法、产生式规则、框架表示法、状态空间、人工神经网络、遗传编码等。
已有知识表示法大多是在进行某项具体研究时提出,有一定针对性和局限性,应用时要根据实际情况作适当调整。
二、一阶谓词逻辑表示法
人工智能中用到的逻辑分为两大类。
- 经典逻辑:任何一个命题的真值或者为真,或者为假,二者必居其一。命题逻辑是一阶谓词逻辑的特例。
- 非经典逻辑:模糊逻辑用的较多
2.1.1 命题
谓词逻辑是在命题逻辑基础上发展起来的,命题逻辑可以看作谓词逻辑的一种特殊形式
命题:一个非真即假的陈述句。
一个命题不能同时即为真又为假,但可以在一种条件下为真,在另一种条件下为假。
简单命题(原子命题):简单陈述句表达的命题
复合命题:引入否定、合取、析取、条件、双条件等连接词,将原子命题构成复合命题
命题逻辑表示法的局限性:无法反应所描述的事物的结构及逻辑特征,也无法反应不同事物的共同特征。
eg. 用字母P,则无论如何也看不出老李和小李的父子关系。
eg. 对“李白是一个诗人”和“杜甫是一个诗人”这两个命题,用命题逻辑表示时,也无法把两者的共同特征(都是诗人)形式化地表现出来。
正因为命题逻辑的局限性,谓词逻辑在此基础上发展起来。
2.1.2 谓词
谓词(predicate)逻辑是基于命题中谓词分析的一种逻辑。谓词分为谓词名和个体两个部分。
- 个体:表示某个独立存在的事物或者某个抽象的概念。
- 谓词名:用于刻画个体的性质、状态或个体间的关系。
谓词的一般形式:
其中是谓词名,是个体。
谓词中包含的个体数目称为谓词的元数。是一元谓词,是二元谓词,是n元谓词。
注意:
- 谓词名最好是用相应含义的英文单词表示,就像我们编程时变量名的要求一样。
- 在谓词中,个体既可以是一个常量、还可以是一个变元,甚至是一个函数。个体常量、个体变元、函数统称为“项”,也可以自身又是一个一阶谓词。
eg. “老张是一个教师”-> Teacher(Zhang)或者Is-a(Zhang,Teacher)
eg. “库克作为一个CEO为苹果工作” -> Work(Ku,Apple,CEO)
从上面的例子中我们可以看出,同样的一个命题,其谓词表示不是唯一的。下面我们再举出两个个体是变元和函数的栗子。
eg. “x<5” -> Less(x,5),x是变元
eg. “库克的朋友是一个伟大的发明家” -> Is-a(friend(ku),inventor),friend是函数
注意: 函数:在个体域中从一个个体到另一个个体的映射,无真值可言。函数可以递归调用 eg. “库克的敌人的敌人就是朋友” -> Is-a(enemy(enemy(ku)),friend),friend是函数
在谓词中,若都是个体常量、个体变元或函数,称为一阶谓词。若自身又是一个一阶谓词,则称为二阶谓词。
eg. “库克作为一个CEO为苹果工作”-> Works(CEO(Ku),Apple),CEO(Ku)也是一个一阶谓词。
2.1.3 谓词公式
无论是命题逻辑还是谓词逻辑,均可用下列连接词把一些简单命题连接构成一个复合命题
1. 连接词
- :称为“否定”(negation)或者“非”。
- :称为“析取”(disjunction)。表示被它连接的两个命题具有“或”关系。
- :称为“合取”(conjunction)。表示被它连接的两个命题具有“与”关系。
- :称为“蕴含”(implication)或者“条件”(condition)。表示“P蕴含Q”,即“如果P则Q”,其中称为条件的前件,称为条件的后件。
- :称为“等价”(equivalence)或者“双条件”(bicondition)。表示“ 当且仅当”。
P | Q | ||
---|---|---|---|
T | T | T | T |
T | F | F | F |
F | T | T | F |
F | F | T | T |
注意:“蕴含”与汉语中的“如果…则…”有区别,汉语中前后要有联系,而命题中可以毫无联系。 eg. “太阳从西边出来”则“雪是白的”是一个真值为T的命题 在蕴含关系中,前件为假,(无论后件取值如何)或者后件为真(无论前件取值如何),则蕴含取值为T,否则为F。
理解蕴含关系
2. 量词(quantifier)
为了刻画谓词与个体间的关系,在谓词逻辑中引入了两个量词:全称量词和存在量词。
- 全称量词(universal quantifier)():表示“对个体域中的所有(或人一个)个体”。
eg. “所有的中国人都是爱好和平的”:
- 存在量词(existential quantifier)():表示“在个体域中存在一个个体。
eg. “程序中存在一个bug”:
注意:当全称量词和存在量词出现在同一个命题中时,量词的次序将影响命题的意思。
eg.
任何一个程序都存在一个bug
eg.
有一个bug在所有的程序中都存在(log4j)
eg.
对每一个女孩,总有一个男孩爱着她
eg.
有一个男孩,他爱着所有的女孩(doge)
3. 谓词公式
满足如下规则:
- 单个谓词是谓词公式,称为原子谓词公式。
- 若A是谓词公式,也是谓词公式。
- 若A和B都是谓词公式,则,,,也都是谓词公式。
- 若A是谓词公式,则,,也都是谓词公式。
- 有限步应用1~4生成的公式也都是谓词公式。
是不是有点像基本初等函数和初等函数之间的关系!
在谓词公式中,连接词的优先级从高到低排列是:
4. 量词的辖域
辖域,辖域顾名思义就是管辖的区域。对于任何一个量词都有其管辖的区域。位于量词后面的单个谓词或者用括弧括起来的谓词公式称为量词的辖域。
约束变元:在量词辖域内与量词同名的变元称为约束变元。
自由变元:不受约束的变元。
注意:在谓词公式中变元的名字是无关紧要的,可以改名,但对辖域内的约束变元改名时要把同名的约束变元都改成相同的名字。
2.1.4 谓词公式的性质
谓词公式的解释
对命题公式中各个命题变元的一次真值指派称为命题公式的一个解释。
谓词逻辑中,由于个体可能为变元或者函数,因此不能像命题公式那样直接通过真值指派给出解释。必须考虑个体变元和函数在个体域中的取值,因此一个谓词公式的解释可能有多个,对于每一个解释,谓词公式都可求出一个真值。
永真性、可满足性
- 永真性:谓词公式P对个体域D上的任何一个解释都取得真值T,则P在D上是永真的,如果P在每个非空个体域上均永真,则称P是永真的。
- 永假性:谓词公式P对个体域D上的任何一个解释都取得真值F,则P在D上是永假的,如果P在每个非空个体域上均永假,则称P是永假的。
所以,当解释的个数无限时,公式的永真性很难判定。
- 可满足性:谓词公式P,至少存在个体域D上的一个解释使得P的真值为T,谓词公式P对个体域D上的任何一个解释都取得真值F。
- 不可满足性:
等价性
P和Q是两个谓词公式,D是它们共同的个体域,若对D上的任何一个解释,P与Q都有相同的真值,则称公式P和Q在D上是等价的。若D是任意个体域,则P和D是等价的,记为
最好理解常用的主要等价式
永真蕴含
- 假言推理
- 拒取式推理
- 假言三段论
- 全称固化(其中,y为个体域中任意一个个体)
- 存在固化(其中,y为使得P(y)为真的个体)
- 反证法
2.1.5 表示特点
优点:
- 自然性
- 精确性
- 严密性
- 容易实现
局限性
- 不能表示不确定的知识(产生式解决了这一问题)
- 组合爆炸
-
三、产生式表示法
产生式与谓词逻辑中的蕴含式基本形式相同,但蕴含式只是产生式一种特殊情况。
除逻辑蕴含外,产生式还包含各种操作、规则、变换、算子、函数等
-
3.1 表示法
3.1.1 确定性规则知识的产生式表示
3.1.2 不确定性规则知识的产生式表示
3.1.3 确定性事实性知识的产生式表示
(对象,属性,值)
(关系,对象1,对象2)
eg.
老李年龄是40岁,(li,age,40)
老李和老王是朋友(friend,li,wang)3.1.4 不确定性事实性知识的产生式表示
(对象,属性,值,置信度)
(关系,对象1,对象2,置信度)
eg.
老李年龄是40岁,(li,age,40,0.6)
老李和老王是朋友(friend,li,wang,0.1)3.2 产生式系统
产生式系统由规则库、控制系统(推理机)、综合数据库三部分组成。
3.2.1 规则库
3.2.2 综合数据库
又称为事实库,用于存放问题求解过程中各种当前信息的数据结构,如问题的初始状态、原始证据、推理得到的中间结论和最终结论。
3.2.3 推理机
由一组程序组成,控制整个产生式系统的运行。其运行流程如下。
推理:按一定策略从规则库中选择与综合数据库中的已知事实进行匹配,若匹配成功,相应的规则可被使用。并且将匹配成功的规则标注为已经被选用过的记号,避免下次被匹配。
- 冲突消解:当匹配成功的规则不止一条时,这时发生了冲突。推理机必须调用相应的冲突解决策略进行消解,从中选出一条执行。
- 执行规则:如果某一规则的结果是一个或多个结论,则把它们加入到综合数据库中;若结果是一个或多个操作,则继续执行;对于不确定性知识,在执行每一条规则时,还需要按一定的算法计算结论的不确定性。
- 检查推理终止条件:检查综合数据库中是否包含了最终结论,决定是否停止系统的运行。
特点
有点:
- 自然性
- 模块性
- 有效性
- 清晰性
缺点:
- 效率不高
-
四、框架表示法
明斯基提出哦!!!
一种结构化的知识表示方法,产生式规则也可以用框架表示。
一个框架可以有任意有限数目的槽,一个槽可以有任意有限数目的侧面,一个侧面可以有任意有限数目的侧面值。
可以表示具有因果关系,甚至更复杂关系
特点: 结构性
- 自然性
- 继承性