| |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
-> 人工智能 -> NCAT:用于在线教育的神经计算机自适应测试 (AAAI2022--论文解析) -> 正文阅读 |
|
[人工智能]NCAT:用于在线教育的神经计算机自适应测试 (AAAI2022--论文解析) |
文章目录Abstract计算机自适应测评(CAT)目标:用少量的选题准确测量学生在所需学科/领域的熟练程度。
传统方法法不足: 文章核心:本文提出了一种无度量、可学习的神经计算机自适应测试(NCAT)框架,该框架将CAT形式化地定义为一个强化学习问题,直接从实际数据中学习选择算法。 Introduction类似内容可看:BOBCAT: 基于双层优化的计算机化自适应测验 motivation: Related WorkNCAT Framework从双层优化的角度将NCAT中的可学习选择算法形式化,然后将其转化为等价的强化学习问题来有效地解决。 问题描述元组(Q,A) ----Q 代表问题,A 回答状况 一个完整的CAT系统包括两个组成部分: 2、问题选择算法 π 根据 M 中的当前估计 ^θ 从 J 中选择。更具体地说,在轮∈[1,T]中,CAT为学生选择一个问题qj(T)~π(?θt?1)。收到回复j(T)后,M更新和估计新的熟练程度?θt。 定长和变长:在测试结束时让估计的熟练程度接近θ0,即?θT→θ0。 可学习选择算法主要内容:可以直接从大规模学生回答数据中学习的双层优化问题的目标。 受到元学习方法的启发,将NCAT中的选择算法πφ重塑为双层优化目标,具体思想类似于之前BOBCAT: 基于双层优化的计算机化自适应测验这篇文章,感兴趣的同学可以看一下。 minimize ? ? 1 n ∑ i = 1 n ∑ t = 1 T 1 ∣ Γ i ∣ ∑ j ∈ Γ i l ( a i j , M ( q j ∣ θ ^ i t ) ) ( 2 ) ?s.t.? θ ^ i t = arg ? min ? θ i ∑ j ∈ { j i 1 , … , j i t } l ( a i j , M ( q j ∣ θ i ) ) ( 3 ) \begin{aligned} &\underset{\phi}{\operatorname{minimize}} \frac{1}{n} \sum_{i=1}^{n} \sum_{t=1}^{T} \frac{1}{\left|\Gamma_{i}\right|} \sum_{j \in \Gamma_{i}} l\left(a_{i j}, \mathcal{M}\left(q_{j} \mid \hat{\theta}_{i}^{t}\right)\right) (2) \\ &\text { s.t. } \quad \hat{\theta}_{i}^{t}=\underset{\theta_{i}}{\arg \min } \sum_{j \in\left\{j_{i}^{1}, \ldots, j_{i}^{t}\right\}} l\left(a_{i j}, \mathcal{M}\left(q_{j} \mid \theta_{i}\right)\right) (3) \end{aligned} ??minimize?n1?i=1∑n?t=1∑T?∣Γi?∣1?j∈Γi?∑?l(aij?,M(qj?∣θ^it?))(2)?s.t.?θ^it?=θi?argmin?j∈{ji1?,…,jit?}∑?l(aij?,M(qj?∣θi?))(3)? ?where? j i t ~ π ( q j ( 1 ) , a i , j ( 1 ) , … , q j ( t ? 1 ) , a i , j ( t ? 1 ) ; ? ) .? \text { where } \quad j_{i}^{t} \sim \pi\left(q_{j(1)}, a_{i, j(1)}, \ldots, q_{j(t-1)}, a_{i, j(t-1)} ; \phi\right) \text {. } ?where?jit?~π(qj(1)?,ai,j(1)?,…,qj(t?1)?,ai,j(t?1)?;?).? 在内层优化(Eq.(3))中,学生 i 的支持集中由算法 π 根据她之前的反应顺序选择; 然后,我们最小化 二元交叉熵损失 l(·) 以估计外层的^θt 。 在外层优化(Eq.(2))中,我们最小化学生查询集上的二元交叉熵损失来学习目标选择算法 π 给定当前 ^θ(在内层估计)。 双层优化的优点: 强化学习优化强化学习简介强化学习第一层结构:基本元素 强化学习过程:是玩家在与环境的互动中为了达成一个目标而学习的过程
强化学习的第二层结构:主要元素
强化学习的第三层结构:核心元素
具体细节我们注意到无度量选择算法πφ可以通过优化一个双层优化问题来学习。 min ? ? 1 n ∑ i = 1 n ∑ t = 1 T 1 ∣ Γ i ∣ ∑ j ∈ Γ i l ( a i j , M ( q j ∣ θ ^ i t ) ) ? max ? ? E i ~ π ? [ ∑ t = 1 T ? 1 ∣ Γ i ∣ ∑ j ∈ Γ i l ( a i j , M ( q j ∣ θ ^ i t ) ) ] = max ? ? E i ~ π ? [ ∑ t = 1 T ? L M ( Γ i , θ ^ i t ) ] \begin{aligned} & \min _{\phi} \frac{1}{n} \sum_{i=1}^{n} \sum_{t=1}^{T} \frac{1}{\left|\Gamma_{i}\right|} \sum_{j \in \Gamma_{i}} l\left(a_{i j}, \mathcal{M}\left(q_{j} \mid \hat{\theta}_{i}^{t}\right)\right) \\ \triangleq & \max _{\phi} \mathbb{E}_{i \sim \pi_{\phi}}\left[\sum_{t=1}^{T}-\frac{1}{\left|\Gamma_{i}\right|} \sum_{j \in \Gamma_{i}} l\left(a_{i j}, \mathcal{M}\left(q_{j} \mid \hat{\theta}_{i}^{t}\right)\right)\right] \\ =& \max _{\phi} \mathbb{E}_{i \sim \pi_{\phi}}\left[\sum_{t=1}^{T}-\mathcal{L}_{\mathcal{M}}\left(\Gamma_{i}, \hat{\theta}_{i}^{t}\right)\right] \end{aligned} ?=??min?n1?i=1∑n?t=1∑T?∣Γi?∣1?j∈Γi?∑?l(aij?,M(qj?∣θ^it?))?max?Ei~π??????t=1∑T??∣Γi?∣1?j∈Γi?∑?l(aij?,M(qj?∣θ^it?))????max?Ei~π???[t=1∑T??LM?(Γi?,θ^it?)]? 其中LM(·)代表的是给定预测变量M的元问题集上的平均二元交叉熵损失
给定学生先前的回答和特定的CDM,哪个问题最适合准确地测量其水平;实际上,学生回答的转换、熟练程度评估和选择算法的决策过程相互影响和依赖,演化为一个复杂的系统。因此,与将计算机辅助教学的动态作为一个整体进行优化相比,RL框架可以从长远的角度为不同的学生探索更多“最适合”的问题。 Attentive Neural Selection Algorithm基于上述强化学习中的NCAT框架,用分层注意力神经网络实现了强化学习中的选择算法,用于建模学生与问题之间的复杂交互。 问题嵌入:
s
t
=
{
q
j
(
1
)
,
a
i
,
j
(
1
)
,
…
,
q
j
(
t
?
1
)
,
a
i
,
j
(
t
?
1
)
}
:
学
生
i
回
答
q
j
的
结
果
s_{t}=\left\{q_{j(1)}, a_{i, j(1)}, \ldots, q_{j(t-1)}, a_{i, j(t-1)}\right\}:学生i回答qj的结果
st?={qj(1)?,ai,j(1)?,…,qj(t?1)?,ai,j(t?1)?}:学生i回答qj的结果 双通道性能学习(PL)
为了赋予模型非线性,并考虑不同潜在维度之间的相互作用,我们将逐点两层前馈网络应用于St 矛盾学习(CL)学生在计算机辅助测试中行为的复杂性主要体现在猜测和失误因素上:例如,当面对有4个选项的选择题时,即使学生没有掌握答案,也有25%的机会答对(即猜测因素);当面对简单的问题时,可能有很小的机会(例如5%)答错(即失误因素)。 当出现猜测或滑移因素时,正确的回答和不正确的回答之间可能会有一些矛盾。例如,学生答对了乘法题(较难),但回答错了加法题(较简单)。因此,可能的矛盾是:乘法可能是猜测的,也可能是加法中的滑移因子,或者两者兼而有之。 我们设计了一种新颖的双注意操作来捕捉正确和错误回答之间的矛盾:
然后,分别从行维和列维两个维度用Softmax函数对矛盾得分进行归一化。 α ~ i j = exp ? ( α i j ) ∑ j = 1 k 1 exp ? ( α i j ) \widetilde{\alpha}_{i j}=\frac{\exp \left(\alpha_{i j}\right)}{\sum_{j=1}^{k_{1}} \exp \left(\alpha_{i j}\right)} α ij?=∑j=1k1??exp(αij?)exp(αij?)? and α ~ i j = exp ? ( α i j ) ∑ i = 1 k 0 exp ? ( α i j ) \widetilde{\alpha}_{i j}=\frac{\exp \left(\alpha_{i j}\right)}{\sum_{i=1}^{k_{0}} \exp \left(\alpha_{i j}\right)} α ij?=∑i=1k0??exp(αij?)exp(αij?)? form A ~ 0 , A ~ 1 ∈ R k 0 × k 1 \widetilde{\mathbf{A}}_{0}, \widetilde{\mathbf{A}}_{1} \in \mathbb{R}^{k_{0} \times k_{1}} A 0?,A 1?∈Rk0?×k1? respectively 为了进一步提取矛盾问题对的信息,我们使用性能学习中生成的矩阵F0t和F1分别与分数矩阵A0、EA1(即具有Softmax的矩阵)进行双注意和前馈操作。 其中F01t∈Rk1×d 和F10t∈Rk0×d 分别是两个通道中问题的矛盾特征矩阵 策略层在多个注意块自适应地、分层地提取先前回答的信息之后,我们基于四个矩阵{F0t,F1t,F01t,F10t}来预测下一次选择的得分。 表示选择每个问题的预测累积奖励/值 Qφ(st,·)=[Qφ(st,q1),…,Qφ(st,Q|J|)],策略层由两个前馈层处理。 通过使用该框架,在传统的RL算法中,选择Q值最大的问题和估计的Qφ(st,·)来产生选择。 问题选择(Question Selection):选择问题的概率与其在给定状态下的Q值成正比 当ν→为0时,公式(6)等同于Arg Maxqφ,显然,完全随机化是最简单的曝光控制方法,可以产生相同的曝光率。然而,它与选择“最佳匹配”问题以加快测量过程的想法相冲突。 测量精度和曝光率之间的平衡将在后续的实验中进一步研究。 Policy Learning我们使用Q-Learning学习策略权重φ EXPERIMENTS实验设置
训练、测试、评估:对所有数据集进行5倍交叉验证;对于每个折叠,我们分别使用60%-20%-20%的学生进行培训、验证和测试。我们将每个学生回答的问题划分为培训(Ji70%)和元(Γi,30%)问题集。 比较方法:CAT中的选择算法需要依赖于上述认知诊断模型(CDM)。我们的实验主要涉及两个经典的CDM:传统的项目反应理论(Embretson和Reise 2013)和最近提出的深度学习模型(例如NCDM(Wang et al.2020a))。 精度(AUC/ACC)比较
知识点覆盖率E在每个测试步骤中,他们所选问题中所涵盖的知识概念(如数学中的代数和几何)的比例 复杂运动交互(RQ3)行为记录中的矛盾: 这些观察结果表明,我们提出的NCAT可以提供一种很好的方式来捕捉问题和学生之间的复杂关系,以便进行更好的选择。 熟练程度的估计和猜测和失误。人工构建学生的熟练程度θ0并产生相应的反应,用于水平估计。因此,我们使用均方误差(MSE)对所有构建的学生进行评估. 我们用简单的IRT进行这一操作,并利用在整个数据集上学习的熟练程度参数作为基本事实,而不是生成它们。我们可以看到,即使在存在多重扰动的情况下,NCAT框架在MSE度量上也表现良好,进一步证实了其在熟练程度估计中的高准确性和鲁棒性。 消融实验NCA T-C和NCA T-P:它们是NCAT的变体,分别只使用矛盾学习和绩效学习模块。 结论在本文中,我们提出了一个完全自适应的CAT框架,称为NCAT,它为在线教育提供了一种从真实数据中学习选择算法的通用方法。具体来说,为了克服手动设计的选择算法的局限性,NCAT被重新编码并在有效的强化学习环境中解决。此外,本文还提出了一种专注的神经选择算法,用于模拟测试中复杂的非线性交互作用。大量实验表明,NCAT可以成功地捕捉学生与问题之间的复杂关系(例如猜测和失误因素),并准确测量学生的熟练程度,缩短考试时间。
|
|
|
上一篇文章 下一篇文章 查看所有文章 |
|
开发:
C++知识库
Java知识库
JavaScript
Python
PHP知识库
人工智能
区块链
大数据
移动开发
嵌入式
开发工具
数据结构与算法
开发测试
游戏开发
网络协议
系统运维
教程: HTML教程 CSS教程 JavaScript教程 Go语言教程 JQuery教程 VUE教程 VUE3教程 Bootstrap教程 SQL数据库教程 C语言教程 C++教程 Java教程 Python教程 Python3教程 C#教程 数码: 电脑 笔记本 显卡 显示器 固态硬盘 硬盘 耳机 手机 iphone vivo oppo 小米 华为 单反 装机 图拉丁 |
360图书馆 购物 三丰科技 阅读网 日历 万年历 2025年1日历 | -2025/1/8 4:34:21- |
|
网站联系: qq:121756557 email:121756557@qq.com IT数码 |