tags: [知识追踪, DKT-DSC]
categories: [知识追踪, DKT-DSC]


Abstract 在智能导学系统(ITS)中,为了提供更具支持性的学习指导,对学生在学习过程中的知识状态进行跟踪的研究已有几十年历史。在本文中,我们提出了一种新的知识追踪模型,即:(1)捕捉学生的学习能力,并在固定的时间间隔内动态地将学生分配到具有相似能力的不同组中;(2)将这些信息与一种称为深度知识追踪(Deep Knowledge Tracing)的递归神经网络结构相结合。实验结果证实,该模型在预测学生表现方面明显优于目前最先进的学生建模技术。
Index Terms Student model, Deep knowledge tracing, K-means clustering, RNNs, LSTMs

I. INTRODUCTION

ITS是一个活跃的研究领域,旨在为学生提供个性化的指导。早期的工作可以追溯到20世纪70年代末。。人工智能和知识表示技术已经得到了广泛的探索,其中我们可以提到学生知识和误解的基于规则和贝叶斯表示,项目反应理论中使用Logistic回归的技能建模,基于案例的推理,以及最近的强化学习和深度学习[1][2]。甚至可以认为,人工智能和数据挖掘中的大多数主要技术都已经进入了智能导学系统(ITS)领域,特别是知识追踪问题,其目的是根据观察到的任务上的表现来模拟学生掌握概念性或程序性知识的状态[3]。

本文提出了一种新的知识追踪模型——基于动态学生分类的深度知识追踪模型(DKT-DSC)。在每个时间间隔,该模型首先将一个学生分配到一组具有相似学习能力的学生当中。然后,这些信息被馈送到递归神经网络(RNN),该网络被称为DKT结构[4],用于根据数据预测学生的表现。我们可以认为学生分类是对学生能力的长期记忆,因为RNN的输入改进了DKT的知识追踪,这是最先进的知识追踪方法之一。

本文的其余部分组织如下。第二节回顾了关于学生建模技术的相关工作。第三节提出了DKT-DSC模型。第四节描述了我们实验中使用的数据集。第五节给出了实验结果,第六节对本文进行了总结,并讨论了未来的研究方向。

II. RELATED WORK

我们在这里回顾了四种最著名的、最先进的用于评估学生表现的学生建模方法,要么是因为它们在心理测量学(IRT)或教育数据挖掘(BKT)方面的优势,要么是因为它们是表现最好的方法(PFA,DKT)。详见[5]。

A. Item Response Theory (IRT)

IRT假设学生的知识状态是静态的,用她在考试期间完成评估时的熟练程度表示[6]、[7]、[8]、[9]。IRT对单个技能进行建模,并假设测试项目是一维的。它给学生i分配一个静态的熟练程度2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图1,每个题目j都有它自己的难度2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图2。IRT的主要思想是利用学生的能力和题目的难度来估计学生i正确回答题目j的概率。广泛使用的IRT的单参数版本,称为Rasch模型,是
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图3
最近,Wilson[6]提出了一种IRT模型,该模型的性能优于最新的知识追踪模型。其中,2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图42018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图5的最大后验概率(MAP)估计是用Newton-Raphson(牛顿-拉夫森方法)计算的。

B. Bayesian Knowledge Tracing (BKT)

在抛弃静态知识状态假设的学习环境中引入BKT进行知识追踪的[3]、[10]。它还假设每个项目只测试一种技能,但这个假设在后来的BKT工作中有所放宽。学生对某项技能知识的标准BKT估计会用四种概率持续更新:[2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图6掌握的初始概率,P(T)从非掌握到掌握的转变,P(G)猜测和P(S)失误],一旦学生每次都给出她的回答:
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图7
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图8
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图9
在过去的几十年里,BKT有了各种扩展[11]、[12]。

C. Performance Factor Analysis (PFA)

PFA被提出作为BKT的替代方案,它还放松了静态知识假设,并以其基本结构同时对多种技能进行建模[13]。它将学生i对项目j的成功概率定义为:
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图10
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图11
其中β是技能k的偏差,γ和ρ分别代表技能k的每次成功尝试和失败尝试的学习增益。S是学生i在技能k上成功尝试的次数,fik是学生i在技能k上失败尝试的次数。

D. Deep Knowledge Tracing (DKT)

DKT在[4]中被引入。它使用长短期记忆(LSTM)[14]来动态地表示学生潜在的知识空间。学生通过作业增加的知识可以通过利用学生以前的表现历史来推断。DKT使用大量的人工神经元来表示潜在的知识状态和时间动态结构,并允许模型从数据中学习潜在的知识状态。它由以下方程式定义:
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图12
2018-DKT_DSC-Deep Knowledge Tracing and Dynamic Student Classification for Knowledge Tracing(Sein Minn et al.) - 图13
在DKT中,tanh和sigmoid函数都是按元素应用的,并由输入权重矩阵W、递归权重矩阵W、初始状态h和读出权重矩阵W来参数化。潜在单元和读出单元的偏差由b和b表示。

III. DEEP KNOWLEDGE TRACING WITH DYNAMIC STUDENT CLASSIFICATION

人类的学习是一个涉及练习的过程:我们通过练习变得熟练。然而,学习也受到个人学习能力的影响,或者说通过或多或少的练习变得熟练。我们把少练就熟练的能力称为学习能力。基于这一观点,我们提出了一个基于动态学生分类的深度知识追踪模型(DKT-DSC),该模型评估学生的学习能力,并将其分配到一组能力相近的学生中,然后在不同的时间间隔调用一个RNN来跟踪她在每个不同组中的知识。它可以根据学生的学习能力追踪他们的表现,并随着时间的推移定期重新评估。

A. Dynamic assessment of student’s learning ability and grouping

根据学生以往在学习系统中不同内容上的表现,将学生划分为不同的学习能力相似的群体,已在教育领域的几项研究工作[15]、[16]中进行了探索,以便为每一组学习能力相似的学生提供更具适应性的指导。在每个时间间隔对学生学习能力的动态评估是通过基于在下一个时间间隔开始之前对其先前表现历史的评估进行聚类来执行的。

1)时间间隔:时间间隔是包含学生在系统中尝试回答的一批问题的分段。从这个角度来看,时间的一瞬就是对一个问题或练习的单个首次尝试。

2)对学生的尝试序列进行分段:将每个学生的反应序列分割成多个时间间隔,有两个目的:1)减少整个长序列学习的计算负担和记忆空间分配。2)在每个时间间隔后重新评估学生的学习能力,并在下一个时间间隔动态地将其分配到她所属的组中。