第01周 人工智能概述

第1讲 人工智能概述.pdf
1 如果一个问题或者任务不可计算,那么对这个问题或任务的描述哪一句是正确的( )
A.该问题或任务所需计算时间是线性增加的

B.该问题或任务所需计算时间是非线性增加的

C.无法将该问题或任务所需数据一次性装入内存进行计算

D.图灵机不可停机

正确答案:D
2 下面哪一句话准确描述了摩尔定律( )
A.摩尔定律描述了计算机的体积大小随时间不断减少的规律

B.摩尔定律描述了计算机内存大小随时间不断增长的规律

C.摩尔定律描述了互联网所链接节点随时间不断增长的规律

D.摩尔定律描述了计算机的计算速度每一年半增长一倍的规律

正确答案:D
3 下面哪个方法于20世纪被提出来,用来描述对计算机智能水平进行测试( )
A.香农定律

B.图灵测试

C.费马定理

D.摩尔定律

正确答案:B
4 1955年,麦卡锡、明斯基、香农和诺切斯特四位学者首次提出“artificial intelligence(人工智能)”这个概念时,希望人工智能研究的主题是( )
A.全力研究人类大脑

B.避免计算机控制人类

C.用计算机来模拟人类智能

D.人工智能伦理

正确答案:C
5 下面哪个描述不属于对人工智能的分类( )
A.生物智能

B.混合增强人工智能

C.通用人工智能/跨域人工智能

D.领域人工智能/弱人工智能

正确答案:A
6 下面对人类智能和机器智能的描述哪一句是不正确的( )
A.人类智能和机器智能均具备常识,因此能够进行常识性推理

B.人类智能具备直觉和顿悟能力,机器智能很难具备这样的能力

C.人类智能具有自适应特点,机器智能则大多是“依葫芦画瓢”

D.人类智能能够自我学习,机器智能大多是依靠数据和规则驱动

正确答案:A
7 我们常说“人类是智能回路的总开关”,即人类智能决定着任何智能的高度、广度和深度,下面哪一句话对这个观点的描述不正确( )
A.机器智能目前已经超越了人类智能

B.人类智能是机器智能的设计者

C.机器智能和人类智能相互协同所产生的智能能力可超越人类智能或机器智能

D.机器智能目前无法完全模拟人类所有智能

正确答案:A
8 下面哪句话描述了现有深度学习这一种人工智能方法的特点( )
A.大数据,大任务

B.小数据,大任务

C.小数据,小任务

D.大数据,小任务

正确答案:D
9 20世纪30年代,围绕可计算这一重要思想,一些模型被提出。下述哪个模型不是于这个时期在可计算思想推动下产生的( )
A.lambda 演算

B.原始递归函数

C.冯诺依曼模型

D.图灵机

正确答案:C
10 德国著名数学家希尔伯特在1900年举办的国际数学家大会中所提出的“算术公理的相容性 (the compatibility of the arithmetical axioms)”这一问题推动了可计算思想研究的深入。在希尔伯特所提出的这个问题中,一个算术公理系统是相容的需要满足三个特点。下面哪个描述不属于这三个特点之一( )
A.完备性,即所有能够从该形式化系统推导出来的命题,都可以从这个形式化系统推导出来。

B.复杂性,即算法性能与输入数据大小相关

C.可判定性,即算法在有限步内判定命题的真伪

D. 一致性,即一个命题不可能同时为真或为假

正确答案:B


第02周 搜索求解

第2讲 搜索求解.pdf
1 在启发式搜索(有信息搜索)中,评价函数的作用是()
A.判断搜索算法的空间复杂度

B.从当前节点出发来选择后续节点

C.判断搜索算法的时间复杂度

D.计算从当前节点到目标节点之间的最小代价值

正确答案:B
2 在贪婪最佳优先搜索中,评价函数取值和启发函数取值之间的关系是( )
A.大于

B.小于

C.相等

D.不等于

正确答案:C
3 在A*搜索算法中,评价函数可以如下定义( )
A.评价函数之值=(从起始节点出发到当前节点最小开销代价)/(从当前节点出发到目标结点最小开销代价)

B.评价函数之值=(从起始节点出发到当前节点最小开销代价)*(从当前节点出发到目标结点最小开销代价)

C.评价函数之值=(从起始节点出发到当前节点最小开销代价)-(从当前节点出发到目标结点最小开销代价)

D.评价函数之值=(从起始节点出发到当前节点最小开销代价)+(从当前节点出发到目标结点最小开销代价)

正确答案:D
4 A*算法是一种有信息搜索算法,在最短路径搜索中引入的辅助信息是( )
A.旅行者兴趣偏好信息

B.任意一个城市到起始城市之间直线距离

C.路途中天气和交通状况等信息

D.任意一个城市到目标城市之间直线距离

正确答案:D
5 为了保证A*算法是最优的,需要启发函数具有可容(admissible)和一致(consistency)的特点,下面对启发函数具有可容性这一特点的解释正确的是( )
A.启发函数是递减的

B.启发函数不会过高估计从当前节点到目标结点之间的实际开销代价

C.启发函数是递增的

D.启发函数不会过高估计从起始节点到目标结点之间的实际开销代价

正确答案:B
6 下面对Alpha-Beta剪枝搜索算法描述中,哪句描述是不正确的( )
A.节点先后次序不会影响剪枝效率

B.节点先后次序会影响剪枝效率

C.在大多数情况下,剪枝会提高算法效率

D.剪枝本身不影响算法输出结果

正确答案:A
7 下面对minimax搜索算法描述中,哪句描述是不正确的( )
A.MAX节点希望自己收益最大化

B.MIN节点希望对方收益最小化

C.minimax搜索不需要遍历游戏树中所有节点

D.给定一个游戏搜索树,minimax算法通过每个节点的minimax值来决定最优策略

正确答案:C
8 Alpha和Beta两个值在Alpha-Beta剪枝搜索中被用来判断某个节点的后续节点是否可被剪枝,下面对Alpha和Beta的初始化取值描述正确的是( )
A.Alpha的初始值大于Beta的初始值

B.Alpha和Beta初始值分别为负无穷大和正无穷大

C.Alpha和Beta初始值分别为正无穷大和负无穷大

D.Alpha和Beta可随机初始化
正确答案:B
9 下面哪一种有序组合是蒙特卡洛树搜索中一次正确的迭代步骤( )
A.反向传播、选举、扩展、模拟

B.扩展、模拟、采样、选举

C.反向传播、扩展、模拟、选举

D.选举、扩展、模拟、反向传播

正确答案:D
10 下面对minimax搜索、alpha-beta剪枝搜索和蒙特卡洛树搜索的描述中,哪一句描述是不正确的( )
A.minimax是穷举式搜索

B.三种搜索算法中,只有蒙特卡洛树搜索是采样搜索

C.对于一个规模较小的游戏树,alpha-beta剪枝搜索和minimax搜索的结果会不同

D.alpha-beta剪枝搜索和蒙特卡洛树搜索都是非穷举式搜索

正确答案:C


第03周 逻辑与推理

第3讲 逻辑与推理.pdf
1 如果命题p为真、命题q为假,则下述哪个复合命题为真命题( )
A.如果q则p

B.如果p则q
C.非p
D.p且q
正确答案:A
2 下面哪个复合命题与“如果秋天天气变凉,那么大雁南飞越冬”是逻辑等价的( )
A.如果秋天天气变凉,那么大雁不南飞越冬

B.如果秋天天气没有变凉,那么大雁不南飞越冬
C.如果大雁不南飞越冬,那么秋天天气没有变凉
D.如果大雁不南飞越冬,那么秋天天气变凉
正确答案:C
3 下面哪一句话对命题逻辑中的归结(resolution)规则的描述是不正确的( )
A.对命题q及其反命题应用归结法,所得到的命题为假命题

B.如果命题q出现在一个析取复合命题中,命题q的反命题单独存在,则通过归结法可得到一个新的析取复合命题,只是在析取复合命题中要去除命题q及其反命题。
C.对命题q及其反命题应用归结法,所得到的命题为空命题
D.在两个析取复合命题中,如果命题q及其反命题分别出现在这两个析取复合命题中,则通过归结法可得到一个新的析取复合命题,只是在析取复合命题中要去除命题q及其反命题。
正确答案:A
4 下面哪一句话对命题范式的描述是不正确的( )
A.一个析取范式是不成立的,当且仅当它包含一个不成立的简单合取式

B.一个合取范式是成立的,当且仅当它的每个简单析取式都是成立的
C.有限个简单合取式构成的析取式称为析取范式
D.有限个简单析取式构成的合取式称为合取范式
正确答案:A
5 下面哪个逻辑等价关系是不成立的( )
A.人工智能:模型与算法 - 图1

B.人工智能:模型与算法 - 图2
C.人工智能:模型与算法 - 图3
D.人工智能:模型与算法 - 图4
正确答案:B
6 下面哪个谓词逻辑的推理规则是不成立的( )
A.人工智能:模型与算法 - 图5
B.人工智能:模型与算法 - 图6
C.人工智能:模型与算法 - 图7
D.人工智能:模型与算法 - 图8
正确答案:C
7 知识图谱可视为包含多种关系的图。在图中,每个节点是一个实体(如人名、地名、事件和活动等),任意两个节点之间的边表示这两个节点之间存在的关系。下面对知识图谱的描述,哪一句话的描述不正确( )
A.知识图谱中一条边连接了两个节点,可以用来表示这两个节点存在某一关系

B.知识图谱中的节点可以是实体或概念
C.知识图谱中一条边可以用一个三元组来表示
D.知识图谱中两个节点之间仅能存在一条边
正确答案:D
8 如果知识图谱中有David和Mike两个节点,他们之间具有classmate和brother关系。在知识图谱中还存在其他丰富节点和丰富关系(如couple, parent等)前提下,下面描述不正确的是( )
A.可以从知识图谱中形成classmate的表达,这里classmate是谓词。

B.仅可从知识图谱中找到classmate和brother这个谓词的正例,无法找到这两个谓词的反例。
C.可从知识图谱中找到classmate和brother这个谓词的正例和反例。
D.可以从知识图谱中形成brother的表达,这里brother是谓词。
正确答案:B
9 在一阶归纳学习中,只要给定目标谓词,FOIL算法从若干样例出发,不断测试所得到推理规则是否还包含反例,一旦不包含负例,则学习结束,展示了 “归纳学习”能力。下面所列出的哪个样例,不属于FOIL在学习推理规则中所利用的样例( )。
A.所得到推理规则涵盖的反例

B.信息增益超过一定阈值推理规则涵盖的例子
C.所得到推理规则涵盖的正例
D.背景知识样例
正确答案:B
10 下面对一阶归纳推理(FOIL)中信息增益值(information gain)阐释不正确的是( )
A.信息增益值用来判断向推理规则中所加入前提约束谓词的质量。

B.信息增益值大小与背景知识样例数目有关。
C.在计算信息增益值过程中,需要利用所得到的新推理规则和旧推理规则分别涵盖的正例和反例数目。
D.在算法结束前,每次向推理规则中加入一个前提约束谓词,该前提约束谓词得到的新推理规则具有最大的信息增益值。
正确答案:B


第04周 逻辑与推理

第4讲 逻辑与推理.pdf
1 基于知识图谱的路径排序推理方法可属于如下哪一种方法( )
A.监督学习(即利用标注数据)
B.一阶逻辑推理
C.因果推理
D.无监督学习(即无标注数据)
正确答案:A
2 下面哪个步骤不属于基于知识图谱的路径排序推理方法中的一个步骤( )
A.定义和选择若干标注训练数据
B.定义和选择某一特定的分类器
C.定义和选择训练数据的特征
D.定义和选择do算子操作
正确答案:D
3 在基于知识图谱的路径排序推理方法中,最后训练所得分类器的功能是( )
A.判断一个给定实体(知识图谱中的一个节点)是否存在邻接节点
B.给定两个实体(知识图谱中的两个节点),判断其是否存在超过小于一定长度的路径
C.给定两个实体(知识图谱中的两个节点),判断其是否具有分类器所表达的关系(即节点之间是否具有分类器所能够辨认的关系)
D.给定两个实体(知识图谱中的两个节点),判断其是否存在超过一定长度的路径
正确答案:C
4 下面对辛普森悖论描述不正确的是( )
A.在某些情况下,忽略潜在的“第三个变量”,可能会改变已有的结论,而我们常常却一无所知。
B.为了克服辛普森悖论,需要从观测结果中寻找引发结果的原因,由果溯因。
C.辛普森悖论的原因在于数据之间相互不关联。
D.如果忽略了一些潜在因素,可能会导致全部数据上观察到的结果却在部分数据上不成立。
正确答案:C
5 下面哪个描述的问题不属于因果分析的内容( )
A.购买了A商品的顾客是否会购买B商品
B.如果商品价格涨价一倍,预测销售量P′(sales)的变化
C.如果广告投入增长一倍,预测销售量的增长
D.如果放弃吸烟,预测癌症P′(cancer) 的概率
正确答案:A
6 下面哪个模型不属于用来进行因果推理的模型( )
A.因果图
B.结构因果模型
C.贝叶斯网络
D.有向有环图
正确答案:D
7 下面哪个说法是不正确的( )
A.一个有向无环图唯一地决定一个联合分布

B.在有向无环图中,父辈节点“促成”了孩子节点的取值
C.一个有向无环图无法唯一地决定一个联合分布
D.一个联合分布不能唯一地决定有向无环图
正确答案:C
8 下面对干预(intervention)和do算子(do-calculus)描述不正确的是( )
A.干预(intervention)指的是固定(fix)系统中某个变量,然后改变系统,观察其他变量的变化
B.do算子的意思可理解为 “干预”(intervention)
C.do(x)=a表示将DAG中指向节点x的有向边全部切断,并且将x的值固定为常数a
D.do(x)=a表示将DAG中指向节点x的所有节点取值均固定为a
正确答案:D
9 下面对反事实推理 (counterfactual model)描述不正确的是( )
A.事实是指在某个特定变量(A)的影响下可观测到的某种状态或结果(B)。“反事实”是指在该特定变量(A)取负向值时可观测到的状态或结果(B’)。
B.条件变量对于结果变量的因果性就是A成立时B的状态与A取负向值时“反事实”状态(B’)之间的差异。如果这种差异存在且在统计上是显著的,说明条件变量与结果变量不存在因果关系。
C.反事实推理是用于因果推理的一种方法。
D.条件变量对于结果变量的因果性就是A成立时B的状态与A取负向值时“反事实”状态(B’)之间的差异。如果这种差异存在且在统计上是显著的,说明条件变量与结果变量存在因果关系。
正确答案:B
10 下面对通过因果图来进行因果推理所存在不足描述不正确的是( )
A.难以得到一个完整的DAG用于阐述变量之间的因果关系或者数据生成机制,使得 DAG 的应用受到的巨大的阻碍。

B.DAG 作为一种简化的模型,在复杂系统中可能不完全适用,需要将其拓展到动态系统(如时间序列)。
C.在因果推理中引入了do算子,即从系统之外人为控制某些变量。但是,这依赖于一个假定:干预某些变量并不会引起 DAG 中其他结构的变化。
D.因果图无法刻画数据之间的联合分布。
正确答案:D


第05周 统计机器学习:监督学习

第5讲 统计机器学习:监督学习.pdf
1 下面哪一种机器学习方法没有利用标注数据( )
A.有监督学习
B.半监督学习
C.无监督学习
D.回归分析
正确答案:C
2 下面对经验风险和期望风险的描述中,哪一个属于欠学习( )
A.经验风险大、期望风险小
B.经验风险小、期望风险大
C.经验风险大、期望风险大
D.经验风险小、期望风险小
正确答案:C
3 下面对经验风险和期望风险的描述中,哪一个属于过学习( )
A.经验风险大、期望风险大
B.经验风险小、期望风险小
C.经验风险小、期望风险大
D.经验风险大、期望风险小
正确答案:C
4 下面对结构风险最小化的描述中,哪一个描述是不正确的( )
A.结构风险最小化与经验风险最小化的目标是不同的
B.为了更好保证结构风险最小化,可适当减少标注数据
C.结构风险最小化在最小化经验风险与降低模型复杂度之间寻找一种平衡
D.在结构风险最小化中,优化求解目标为使得经验风险与模型复杂度之和最小
正确答案:B
5 监督学习方法又可以分为生成方法(generative approach)和判别方法(discriminative approach)。下面哪个方法不属于判别方法( )
A.Ada boosting
B.回归模型
C.贝叶斯方法
D.神经网络
正确答案:C
6 下面哪句话语较为恰当刻画了监督学习方法中生成方法的特点( )
A.三个臭皮匠、抵一个诸葛亮
B.授之于鱼、不如授之于“渔”
C.毕其功于一役
D.屡败屡战、屡战屡败、最后成功
正确答案:B
7 线性回归中优化目标函数的求取过程与下面哪一种方法是相同的( )
A.最大后验概率

B.最大似然估计
C.最小化后验概率
D.最小二乘法
正确答案:D
8 下面哪一句话对Ada Boosting的描述是不正确的( )
A.该算法将若干弱分类器线性加权组合起来,形成一个强分类器
B.在所构成的强分类器中,每个弱分类器的权重累加起来等于1
C.在所构成的强分类器中,每个弱分类器的权重是不一样的
D.在每一次训练弱分类器中,每个样本的权重累加起来等于1
正确答案:B
9 Ada Boosting在最小化如下目标函数( )
A.绝对损失函数
B.指数损失函数
C.0-1损失函数
D.平方损失函数
正确答案:B
10 下面对回归和分类的描述不正确的是( )
A.在分类模型中,学习得到一个函数将输入变量映射到离散输出空间
B.回归是一种无监督学习、分类学习是有监督学习
C.在回归分析中,学习得到一个函数将输入变量映射到连续输出空间
D.两者均是学习输入变量和输出变量之间潜在关系模型
正确答案:B


第06周 统计机器学习:无监督学习

第6讲 统计机器学习:无监督学习.pdf
1 由于K均值聚类是一个迭代过程,我们需要设置其迭代终止条件。下面哪句话正确描述了K均值聚类的迭代终止条件( )
A.已经达到了迭代次数上限,或者前后两次迭代中聚类质心基本保持不变
B.已经达到了迭代次数上限,或者每个待聚类样本分别归属唯一一个聚类集合
C.已经形成了K个聚类集合,或者每个待聚类样本分别归属唯一一个聚类集合
D.已经形成了K个聚类集合,或者已经达到了迭代次数上限
正确答案:A
2 我们可以从最小化每个类簇的方差这一视角来解释K均值聚类的结果,下面对这一视角描述不正确的是( )
A.最终聚类结果中每个聚类集合中所包含数据呈现出来差异性最小
B.每个簇类的方差累加起来最小
C.每个样本数据分别归属于与其距离最近的聚类质心所在聚类集合
D.每个簇类的质心累加起来最小
正确答案:D
3 下面哪一句话描述不属于K均值聚类算法的不足( )
A.算法迭代执行
B.K均值聚类是无监督聚类
C.需要初始化聚类质心
D.需要事先确定聚类数目
正确答案:B
4 下面对数据样本方差解释不正确的是( )
A.方差刻画了随机变量或一组数据离散程度
B.方差刻画了样本数据的大小
C.方差(样本方差)是每个样本数据与全体样本数据平均值之差的平方和的平均数
D.方差描述了样本数据在平均值附近的波动程度
正确答案:B
5 协方差可以用来计算两个变量之间的相关性,或者说计算两维样本数据中两个维度之间的相关性。基于计算所得的协方差值,可以来判断样本数据中两维变量之间是否存在关联关系。下面哪一个说法是不正确的( )
A.当协方差值等于0 时,则两个变量线性不相关
B.当协方差值大于0 时,则两个变量线性正相关
C.当协方差值等于0 时,则两个变量线性正相关
D.当协方差值小于0 时,则两个变量线性负相关
正确答案:C
6 皮尔逊相关系数(Pearson Correlation coefficient )可将两组变量之间的关联度规整到一定的取值范围内。下面对皮尔逊相关系数描述不正确的是( )
A.皮尔逊相关系数的值域是[-1,1]
B.皮尔逊相关系数刻画了两组变量之间线性相关程度,如果其取值越大,则两者在线性相关的意义下相关程度越大;如果其值越小,表示两者在线性相关的意义下相关程度越小
C.皮尔逊相关系数是对称的
D.皮尔逊相关系数等于1的充要条件是该两组变量具有线性相关关系
正确答案:B
7 下面对相关性(correlation)和独立性(independence)描述不正确的是( )
A.“不相关”是一个比“独立”要强的概念,即不相关一定相互独立
B.如果两维变量彼此独立,则皮尔逊相关系数等于0
C.如果两维变量线性不相关,则皮尔逊相关系数等于0
D.独立指两个变量彼此之间不相互影响
正确答案:A
8 下面对主成分分析的描述不正确的是( )
A.在主成分分析中,所得低维数据中每一维度之间具有极大相关度
B.主成分分析可保证原始高维样本数据被投影映射后,其方差保持最大
C.在主成分分析中,将数据向方差最大方向进行投影,可使得数据所蕴含信息没有丢失,以便在后续处理过程中各个数据“彰显个性”
D.主成份分析是一种特征降维方法
正确答案:A
9 在主成分分析中,我们将带约束的最优化问题,通过拉格朗日乘子法将其转化为无约束最优化问题。下面对主成分分析中优化的目标函数和约束条件描述正确的是 ( )
A.保证映射投影(即降维后)所得结果冗余度最小以及投影后结果方差最大
B.保证映射投影(即降维后)所得结果方差最大以及投影方向正交(以去除冗余度)
C.保证映射投影(即降维后)所得结果相关度最大以及投影后结果方差最大
D.保证映射投影方向之间的方差最大以及投影方向正交(以去除冗余度)
正确答案:B
10 下面对特征人脸算法描述不正确的是( )
A.每一个特征人脸的维数与原始人脸图像的维数一样大
B.特征人脸方法是用一种称为“特征人脸(eigenface)”的特征向量按照线性组合形式来表达每一张原始人脸图像
C.特征人脸之间的相关度要尽可能大

D.特征人脸方法是一种应用主成分分析来实现人脸图像降维的方法
正确答案:C


第07周 统计机器学习算法应用

第7讲 统计机器学习算法应用.pdf
1 下面对逻辑斯蒂回归(logistic regression)描述不正确的是( )
A.逻辑斯蒂回归中所使用Sigmoid函数的输出形式是概率输出
B.在逻辑斯蒂回归中,能够实现数据特征加权累加
C.逻辑斯蒂回归是一种非线性回归模型
D.在逻辑斯蒂回归中,输入数据特征加权累加值在接近−∞或+∞附近时,模型输出的概率值变化很大
正确答案:D
2 逻辑斯蒂回归模型(logistic regression)属于( )
A.无监督学习
B.半监督学习
C.监督学习
D.以上都不是
正确答案:C
3 潜在语义分析属于( )
A.半监督学习
B.监督学习
C.无监督学习
D.以上都不是
正确答案:C
4 线性区别分析属于( )
A.监督学习
B.半监督学习
C.无监督学习
D.以上都不是
正确答案:A
5 逻辑斯蒂回归函数也可被称为( )
A.最大后验估计回归模型
B.对数几率回归(log-odds regression)
C.交叉熵回归模型
D.最大似然估计回归模型
正确答案:B
6 在隐性语义分析中,给定M个单词和N个文档所构成的单词-文档矩阵(term-document)矩阵,对其进行分解,将单词或文档映射到一个R维的隐性空间。下面描述不正确的是( )
A.单词和文档映射到R维隐性空间后,单词和文档具有相同的维度
B.隐性空间维度的大小由分解过程中所得对角矩阵中对角线上不为零的系数个数所决定
C.这一映射过程中需要利用文档的类别信息
D.通过矩阵分解可重建原始单词-文档矩阵,所得到的重建矩阵结果比原始单词-文档矩阵更好捕获了单词-单词、单词-文档、文档-文档之间的隐性关系
正确答案:C
7 线性区别分析(linear discriminant analysis, LDA)在进行数据降维时,原始高维数据被映射到低维空间中后需要达到的优化的目标是( )
A.既要保证不同类别样本尽可能靠近,也要保证同一类别样本尽可能彼此远离
B.只要保证同一类别样本尽可能靠近
C.只要保证不同类别样本尽可能彼此远离
D.既要保证同一类别样本尽可能靠近,也要保证不同类别样本尽可能彼此远离
正确答案:D
8 LDA(线性区别分析)与PCA(主成分分析)均是降维的方法,下面描述不正确的是( )
A.LDA降维后所得到维度是与数据样本的类别个数K有关(与数据本身维度无关)
B.PCA对高维数据降维后的维数是与原始数据特征维度相关(与数据类别标签无关)
C.假设原始数据一共有K个类别,那么LDA所得数据的降维维度小于或等于K−1
D.PCA和LDA均是基于监督学习的降维方法
正确答案:D
9 下面对逻辑斯蒂回归(logistic regression)和多项逻辑斯蒂回归模型(multi-nominal logistic model)描述不正确的是( )
A.多项逻辑斯蒂回归模型也被称为softmax函数
B.两者都是监督学习的方法
C.逻辑斯帝回归是监督学习,多项逻辑斯蒂回归模型是非监督学习
D.两者都可被用来完成多类分类任务
正确答案:C
10 逻辑斯蒂回归和线性区别分析均可完成分类任务,下面描述正确的是( )
A.逻辑斯蒂回归可直接在数据原始空间进行分类,线性区别分析需要在降维所得空间中进行分类
B.逻辑斯蒂回归在降维所得空间中进行分类,线性区别分析在数据原始空间进行分类
C.逻辑斯蒂回归和线性区别分析都是直接在数据原始空间进行分类
D.以上都不正确
正确答案:A


第08周 深度学习

第8讲 深度学习.pdf
1 在神经网络学习中,每个神经元会完成若干功能,下面哪个功能不是神经元所能够完成的功能( )
A.向前序相邻神经元反馈加权累加信息
B.将加权累加信息向后续相邻神经元传递
C.对前序相邻神经元所传递信息进行加权累加
D.对加权累加信息进行非线性变化(通过激活函数)
正确答案:A
2 下面对前馈神经网络描述不正确的是( )
A.同一层内神经元之间存在全连接
B.各个神经元接受前一级神经元的输入,并输出到下一级
C.层与层之间通过“全连接”进行连接,即两个相邻层之间神经元完全成对连接
D.同一层内的神经元相互不连接
正确答案:A
3 下面对感知机网络(Perceptron Networks)描述不正确的是( )
A.感知机网络是一种特殊的前馈神经网络

B.感知机网络没有隐藏层
C.感知机网络具有一层隐藏层
D.感知机网络不能拟合复杂数据
正确答案:C
4 下面对梯度下降方法描述不正确的是( )
A.梯度下降算法用来优化深度学习模型的参数

B.梯度方向是函数值下降最快方向
C.梯度反方向是函数值下降最快方向
D.梯度下降算法是一种使得损失函数最小化的方法
正确答案:B
5 下面对误差反向传播 (error back propagation, BP)描述不正确的是( )
A.对前馈神经网络而言,BP算法可调整相邻层神经元之间的连接权重大小

B.BP算法将误差从后向前传递,获得各层单元所产生误差,进而依据这个误差来让各层单元修正各单元参数
C.BP算法是一种将输出层误差反向传播给隐藏层进行参数更新的方法
D.在BP算法中,每个神经元单元可包含不可偏导的映射函数
正确答案:D
6 我们可以将深度学习看成一种端到端的学习方法,这里的端到端指的是( )
A.输入端-中间端

B.输出端-中间端
C.中间端-中间端
D.输入端-输出端
正确答案:D
7 在前馈神经网络中,误差后向传播(BP算法)将误差从输出端向输入端进行传输的过程中,算法会调整前馈神经网络的什么参数( )
A.神经元和神经元之间连接有无

B.同一层神经元之间的连接权重
C.输入数据大小
D.相邻层神经元和神经元之间的连接权重
正确答案:D
8 前馈神经网络通过误差后向传播(BP算法)进行参数学习,这是一种( )机器学习手段
A.无监督学习

B.半监督学习
C.监督学习
D.无监督学习和监督学习的结合
正确答案:C
9 下面对前馈神经网络这种深度学习方法描述不正确的是( )
A.隐藏层数目大小对学习性能影响不大
B.是一种端到端学习的方法
C.是一种监督学习的方法
D.实现了非线性映射
正确答案:A
10 下面对浅层学习和深度学习描述不正确的是( )
A.包含了若干隐藏层的前馈神经网络是一种深度学习方法

B.浅层学习仅能实现线性映射、深度学习可以实现非线性映射
C.K-means聚类是一种浅层学习方法
D.线性回归分析是一种浅层学习方法
正确答案:B


第09周 深度学习

1 卷积操作是卷积神经网络所具备的一个重要功能,对一幅图像进行高斯卷积操作的作用是( )
A.对图像进行分类
B.对图像进行增强
C.对图像进行裁剪
D.对图像进行平滑(模糊化)
正确答案:D
2 对完成特定任务的卷积神经网络训练采用的是监督学习方法。在这个过程中,通过误差后向传播来优化调整网络参数,请问下面哪个参数不是通过误差后向传播来优化的( )
A.激活函数中的参数
B.卷积滤波矩阵中的参数
C.全连接层的链接权重
D.模型的隐藏层数目
正确答案:D
3 下面哪个作用是池化(pooling)层所完成的( )
A.上采样
B.图像裁剪
C.图像增强
D.下采样
正确答案:D
4 假设我们需要训练一个卷积神经网络,来完成500种概念的图像分类。该卷积神经网络最后一层是分类层,则最后一层输出向量的维数大小可能是( )
A.500

B.300
C.1
D.100
正确答案:A
5 下面对Word2Vec描述不正确的是( )
A.可以利用某个单词来分别预测该单词的上下文单词,从而训练得到词向量模型

B.可以根据某个单词的上下文单词来预测该单词,从而训练得到词向量模型
C.词向量是一种分布式的单词表达形式
D.词向量是一种one-hot的单词表达形式
正确答案:D
6 前馈神经网络和卷积神经网络的模型学习均是通过误差后向传播来优化模型参数,因此是一种监督学习方法。
A.×
B.√
正确答案:B
7 一般而言,在深度学习模型中,层数越多,其完成的非线性映射就越复杂,因此模型就具有更强的学习能力。
A.√
B.×
正确答案:A
8 与one-hot的单词表达不同,在词向量模型中,单词和单词之间的共现关系被忽略了。
A.×
B.√
正确答案:A
9 卷积神经网络一般包括卷积层、池化层、全连接层,一般激活函数在卷积层后进行使用。
A.×

B.√
正确答案:B
10 在使用卷积神经网络对图像分类中,一般将最后一层全连接层(即与输出层相连的全连接层)的输出作为每幅图像的特征表达。
A.√
B.×
正确答案:A


第10周 强化学习

第10讲 强化学习.pdf
1 下面对强化学习、监督学习和深度卷积神经网络学习的描述正确的是( )
A.无标注学习、有标注信息学习方式、端到端学习方式
B.评估学习方式、有标注信息学习方式、端到端学习方式
C.评估学习方式、端到端学习方式、端到端学习方式
D.有标注信息学习方式、端到端学习方式、端到端学习方式
正确答案:B
2 在强化学习中,通过哪两个步骤的迭代,来学习得到最佳策略( )
A.Q-learning 与 贪心策略优化
B.动态规划与Q-Learning
C.策略优化与策略评估
D.价值函数计算与动作-价值函数计算
正确答案:C
3 在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力( )
A.蒙特卡洛采样
B.动态规划
C.贪心策略
D.Bellman方程
正确答案:C
4 深度强化学习是深度学习与强化学习的结合。在深度强化学习中,神经网络被用来进行哪个函数的学习?
A.蒙特卡洛采样函数

B.贪心策略函数
C.Bellman方程
D.q函数
正确答案:D
5 与马尔可夫奖励过程相比,马尔可夫决策过程引入了哪一个新的元素( )?
A.反馈
B.动作
C.终止状态
D.概率转移矩阵
正确答案:B
6 在本课程所讲述的范围内,“在状态s,选择一个动作,使得状态s得到最大的反馈期望”,这句话描述了状态s的( )
A.采样函数

B.动作-价值函数
C.策略学习与优化
D.价值函数
正确答案:C
7 在本课程内容范围内,“在状态s,按照某个策略采取动作a后在未来所获得反馈值的期望”,这句话描述了状态s的( )
A.策略优化
B.动作-价值函数
C.采样函数
D.价值函数
正确答案:B
8 下面哪句话正确描述了马尔科夫链中定义的马尔可夫性( )
A.t+1时刻状态和t时刻状态相互独立
B.t-1时刻状态取决于t+1时刻状态
C.t+1时刻状态取决于t时刻状态
D.t+2时刻状态取决于t时刻状态
正确答案:C
9 下面对强化学习、有监督学习和无监督学习描述正确的是( )
A.都不需要标注信息
B.都需要标注数据
C.都是人工智能的学习算法
D.都是深度学习的学习算法
正确答案:C
10 下面哪一种方法不是通过迭代计算贝尔曼方程来进行策略评估( )
A.深度学习

B.时序差分(Temporal Difference)
C.动态规划
D.蒙特卡洛采样
正确答案:A


第11周 人工智能博弈

第11讲 博弈安全.pdf
1 标志着现代博弈理论的初步形成的事件是( )
A.纳什均衡思想的提出

B.1944年冯·诺伊曼与奥斯卡·摩根斯特恩合著《博弈论与经济行为》的出版
C.冯·诺伊曼计算机的实现
D.囚徒困境思想的提出
正确答案:B
2 下面对博弈研究分类不正确的是( )
A.囚徒困境与纳什均衡
B.合作博弈与非合作博弈
C.完全信息博弈与不完全信息博弈
D.静态博弈与动态博弈
正确答案:A
3 囚徒困境是一种( )
A.纳什均衡
B.动态博弈
C.合作博弈
D.最优解
正确答案:A
4 下面对纳什均衡描述正确的是( )
A.在一个策略组合上,当所有其他人都改变策略时,也无法破坏先前的博弈平衡,则该策略组合就是一个纳什均衡。
B.参与者所作出的这样一种策略组合,在该策略组合上,有且只有1个参与者改变策略后,其收益会增加。
C.参与者所作出的这样一种策略组合,在该策略组合上,任何参与者单独改变策略都不会得到好处。
D.参与者所作出的这样一种策略组合,在该策略组合上,有且只有1个参与者改变策略后,其不会得到好处。
正确答案:C
5 下面对混合策略纳什均衡描述正确的是( )
A.博弈过程中,博弈方通过概率形式随机从可选策略中选择一个策略而达到的纳什均衡被称为混合策略纳什均衡。
B.博弈过程中,博弈方通过非概率形式随机从可选策略中选择一个策略而达到的纳什均衡被称为混合策略纳什均衡。
C.博弈过程中,博弈方以概率形式随机从可选收益中选择一个收益,而达到的纳什均衡被称为混合策略纳什均衡。
D.博弈过程中,博弈方以非概率形式随机从可选收益中选择一个收益,而达到的纳什均衡被称为混合策略纳什均衡。
正确答案:A
6 最佳反应策略和纳什均衡之间的关系是( )
A.每个玩家的策略相对于其他玩家的策略而言不少于一个是最佳反应策略,那么策略组就是一个纳什均衡策略。
B.至少一个玩家的策略相对于其他玩家的策略而言都是最佳反应策略,那么策略组就是一个纳什均衡策略。
C.如果每个玩家的策略相对于其他玩家的策略中至少有一个是最佳反应策略,那么策略组就是一个纳什均衡策略。
D.如果每个玩家的策略相对于其他玩家的策略而言都是最佳反应策略,那么策略组就是一个纳什均衡策略。
正确答案:D
7 ε-纳什均衡与纳什均衡的关系是( )
A.纳什均衡不是ε-纳什均衡
B.ε-纳什均衡是纳什均衡
C.纳什均衡和ε-纳什均衡均是最优解
D.纳什均衡是ε-纳什均衡
正确答案:D
8 在遗憾最小化算法中,玩家i按照如下方法来计算其在每一轮产生的悔恨值( )
A.所有玩家策略均改变,所产生的收益之差。
B.至少改变1个以上玩家的策略, 所产生的收益之差。
C.其他玩家策略不变,只改变玩家i的策略后,所产生的收益之差。
D.每个玩家策略不变,只改变收益函数,所产生的收益之差。
正确答案:C
9 下面对生成对抗网络(Generative Adversarial Network)描述不正确的是( )
A.GAN包含生成网络和判别网络两个网络。
B.GAN是一种生成学习模型。
C.生成网络和判别网络分别依次迭代优化。
D.GAN是一种区别学习模型。
正确答案:D
10 在生成对抗网络(Generative Adversarial Network)中,生成网络和判别网络的功能分别是( )
A.区别真实数据与合成的虚假数据/学习真实数据的分布
B.学习真实数据的标签分布/区别真实数据与合成的虚假数据
C.学习真实数据的分布/区别真实数据与合成的虚假数据
D.区别真实数据与合成的虚假数据/学习真实数据的标签分布
正确答案:C