传统的数据清洗方法因需专家手动定义数据质量规则,不仅复杂且耗时巨大,且清洗后的数据可能不能被重复利用,降低了数据清洗的质量和效率.为此,提出基于双重深度Q网络的否定约束迁移(double deep Q-network for denial constraints trans...传统的数据清洗方法因需专家手动定义数据质量规则,不仅复杂且耗时巨大,且清洗后的数据可能不能被重复利用,降低了数据清洗的质量和效率.为此,提出基于双重深度Q网络的否定约束迁移(double deep Q-network for denial constraints transfer,DDQN-DCT)算法.该算法设计否定约束(denial constraint,DC)的相似性度量方法,并结合相似性和DC的简洁性和覆盖度,使用双重深度Q网络(double deep Q-network,DDQN)对DC规则中的谓词进行修改从而实现DC迁移,目标是使迁移后的规则与原规则具有最大的相似性,以保留原有规则的信息.基于DDQN-DCT进一步设计了DDQN-DCT+算法,把DDQN的动作选择策略划为增加和删除2个阶段,并通过对比实验证明DDQN-DCT+在DC简洁性上有更好的表现.通过与暴力依赖约束迁移(brute-force dependency constraint transfer,BFDC)、DDQN-DCT+和结构扩大/缩小(structure expansion/reduction,SER)方法进行对比实验,发现DDQN-DCT算法在规则相似度上相较于BFDC平均提升约10%,相较于DDQN-DCT+平均提升约10.6%,相较于SER平均提升约16.4%.DDQN-DCT能够有效地将源域的规则迁移到相似的目标域数据上.展开更多
文摘传统的数据清洗方法因需专家手动定义数据质量规则,不仅复杂且耗时巨大,且清洗后的数据可能不能被重复利用,降低了数据清洗的质量和效率.为此,提出基于双重深度Q网络的否定约束迁移(double deep Q-network for denial constraints transfer,DDQN-DCT)算法.该算法设计否定约束(denial constraint,DC)的相似性度量方法,并结合相似性和DC的简洁性和覆盖度,使用双重深度Q网络(double deep Q-network,DDQN)对DC规则中的谓词进行修改从而实现DC迁移,目标是使迁移后的规则与原规则具有最大的相似性,以保留原有规则的信息.基于DDQN-DCT进一步设计了DDQN-DCT+算法,把DDQN的动作选择策略划为增加和删除2个阶段,并通过对比实验证明DDQN-DCT+在DC简洁性上有更好的表现.通过与暴力依赖约束迁移(brute-force dependency constraint transfer,BFDC)、DDQN-DCT+和结构扩大/缩小(structure expansion/reduction,SER)方法进行对比实验,发现DDQN-DCT算法在规则相似度上相较于BFDC平均提升约10%,相较于DDQN-DCT+平均提升约10.6%,相较于SER平均提升约16.4%.DDQN-DCT能够有效地将源域的规则迁移到相似的目标域数据上.
文摘探究教师注意力对于评估课堂教师行为具有极其重要的研究价值。然而,现有的教师注意力识别算法存在无法应对极端头部姿态角度等问题。为此,提出一种基于6DRep Net360模型的教师注意力状态识别算法,提升极端角度中头部姿态估计算法的准确性。相较于传统的依赖条件判断来分类教师注意力状态的方法,设计一种基于支持向量机(SVM)的教师注意力分类模型,对复杂头部姿态角度进行注意力状态的精准识别。为进一步解决算法稳定性和准确性带来的误差数据,提出基于滑动窗口的数据清洗算法,有效提高整体识别结果的真实性和可靠性。通过在构建的CCNUTeacherS tat e数据集上进行一系列的算法评估,实验结果表明,所提出的教师注意力识别算法在CCNUTeacherS tate数据集上达到了90.67%的准确率。