期刊文献+
共找到14篇文章
< 1 >
每页显示 20 50 100
基于类别对抗联合学习的跨提示自动作文评分方法
1
作者 张春云 赵洪焱 +3 位作者 邓纪芹 崔超然 董晓琳 陈竹敏 《计算机研究与发展》 北大核心 2025年第5期1190-1204,共15页
自动作文评分(automated essay scoring,AES)能够有效减轻教师的作文评阅负担并为学生提供客观、及时的反馈,是自然语言处理在教育领域的一项重要应用.跨提示AES旨在学习一个可迁移的自动评分模型,使之能够有效为目标提示的作文评分.然... 自动作文评分(automated essay scoring,AES)能够有效减轻教师的作文评阅负担并为学生提供客观、及时的反馈,是自然语言处理在教育领域的一项重要应用.跨提示AES旨在学习一个可迁移的自动评分模型,使之能够有效为目标提示的作文评分.然而,现有的跨提示AES大都是面向目标提示数据可见的场景,通过将源提示和目标提示的特征分布进行对齐,学习提示不变特征表示来学习可迁移到目标提示的评分模型,但是这类方法无法应用于目标提示数据不可见的场景.面向目标提示数据不可见的场景,提出一种基于类别对抗联合学习的跨提示AES方法.一方面,通过对分类和回归联合任务进行联合建模来学习2个任务的共享特征,从而实现二者性能的相互促进;另一方面,不同于现有方法采用提示无关特征来提升模型泛化性能,针对不同提示的类别分布差异引入类别对抗策略,通过对不同提示进行类别级特征对齐,学习不同提示间的细粒度不变特征表示,从而提升模型泛化性能.将所提出方法用于自动学生评估奖(ASAP)和ASAP++数据集,分别对作文的总体评分和属性评分进行预测.实验结果表明,与6种经典方法相比,在平方卡帕(QWK)指标上取得最好的实验效果. 展开更多
关键词 自动作文评分 跨提示 类别对抗 联合建模 领域泛化
在线阅读 下载PDF
基于判决链的法律判决预测
2
作者 吕由钢 郝继泰 +5 位作者 王梓涵 高莘 任鹏杰 陈竹敏 马军 任昭春 《计算机研究与发展》 北大核心 2025年第8期1918-1930,共13页
智能司法旨在通过采用各种自然语言处理技术,自动分析法律领域中的文本,已经引起了自然语言处理社区的极大关注.作为法律文本挖掘最关键的任务之一,法律判决预测旨在根据法律案件的事实描述,自动预测判决结果(如适用的法律条文、指控和... 智能司法旨在通过采用各种自然语言处理技术,自动分析法律领域中的文本,已经引起了自然语言处理社区的极大关注.作为法律文本挖掘最关键的任务之一,法律判决预测旨在根据法律案件的事实描述,自动预测判决结果(如适用的法律条文、指控和刑罚条款),成为人工智能技术的一个有前景的应用.然而,现有的法律判决预测方法主要集中在只涉及单一被告的案件上,而忽略了涉及多个被告的案件研究.在实际的刑事案件中,往往涉及多个被告者,并且在他们之间存在着错综复杂的交互关系,现有的单被告法律判决预测技术很难精确区分多被告案件中不同被告的判决结果.为了加速多被告法律判决预测任务的研究,收集了一个大规模的多被告法律判决预测数据集,其具有以下3个特点:1)数据集是多被告法律判决预测最大的人工标注数据集;2)数据集中的多被告案件需要区分不同被告者的法律判决预测结果;3)数据集中包含了完整的多被告判决链,其中包括犯罪关系、量刑情节、法条、罪名和刑期.此外,对数据集进行了全面而深入的分析,其中包括法条、罪名、刑期、犯罪关系、量刑情节、文本长度、被告人数的数据分布以及多被告判决结果、基于判决链的判决结果的统计分析.此外,提出了基于判决链的法律判决预测方法,其中包括判决链生成策略明确生成犯罪事实相关的判决链,判决链对比策略对比正确判决链和易混淆的判决链来进一步提升效果.实验结果表明,多被告法律判决预测数据集对现有的法律判决预测方法和预训练模型具有挑战性,而基于判决链的法律判决预测方法能显著优于基准方法,显示出判决链在法律判决预测中的关键作用. 展开更多
关键词 法律判决预测 判决链 数据集构建 数据集分析 大语言模型
在线阅读 下载PDF
面向主题爬取的多粒度URLs优先级计算方法 被引量:1
3
作者 陈竹敏 马军 +1 位作者 韩晓晖 雷景生 《中文信息学报》 CSCD 北大核心 2009年第3期31-38,共8页
垂直检索系统中主题爬虫的性能对整个系统至关重要。在设计主题爬虫时需要解决两个问题:一是计算当前页面与给定主题的相关度,二是计算待爬取URLs的访问优先级。对第一个问题,给出利用页面的主题文本块和相关链接块的相关度计算方法;对... 垂直检索系统中主题爬虫的性能对整个系统至关重要。在设计主题爬虫时需要解决两个问题:一是计算当前页面与给定主题的相关度,二是计算待爬取URLs的访问优先级。对第一个问题,给出利用页面的主题文本块和相关链接块的相关度计算方法;对第二个问题,给出基于主题上下文和四种不同的粒度(即站点级、页面级、块级和链接级)的优先级计算方法。在此基础上,提出基于上述方法的主题爬取算法。实验证明,新算法在不增加时间复杂度的前提下,在查准率和信息量总和方面明显优于其他三种经典的爬取算法。 展开更多
关键词 计算机应用 中文信息处理 主题爬取 优先级计算 网页分块 相关度计算
在线阅读 下载PDF
一种结合推荐对象间关联关系的社会化推荐算法 被引量:73
4
作者 郭磊 马军 +1 位作者 陈竹敏 姜浩然 《计算机学报》 EI CSCD 北大核心 2014年第1期219-228,共10页
随着社会化媒体的兴起,信息资源的数量呈现爆炸式增长,如何在海量的信息中帮助用户发现有用的知识成为亟需解决的问题.社会化推荐方法作为一种有效的信息过滤技术,由于能够结合社会网络的特点,模拟现实社会中的推荐过程,在分析用户历史... 随着社会化媒体的兴起,信息资源的数量呈现爆炸式增长,如何在海量的信息中帮助用户发现有用的知识成为亟需解决的问题.社会化推荐方法作为一种有效的信息过滤技术,由于能够结合社会网络的特点,模拟现实社会中的推荐过程,在分析用户历史行为的基础上,主动向用户推荐满足他们兴趣和需求的信息,受到了研究者们的广泛关注.但目前已有的方法大都只从用户间社会关系的角度出发,仅认为相互信任的朋友间具有相似的兴趣爱好,而忽略了推荐对象间的关联关系对推荐结果产生的影响.针对以上存在的问题,文中从推荐对象间关联关系的角度出发,假设具有关联关系的推荐对象更容易受到同一用户的关注,并进而在已有的社会化推荐算法的基础上,提出了一种结合推荐对象间关联关系进行推荐的算法.算法使用共享的潜在特征空间对目标函数的求解过程进行约束,使其在考虑用户间社会关系的同时,也考虑到推荐对象间关联关系所起到的重要作用.实验结果表明,与主流的推荐算法相比,文中所提出的方法在分类准确率和评分误差等多种评价指标上都取得了更好的结果. 展开更多
关键词 社会网络 矩阵分解 推荐系统 协同过滤 社会化推荐
在线阅读 下载PDF
一种基于协同矩阵分解的用户冷启动推荐算法 被引量:26
5
作者 高玉凯 王新华 +1 位作者 郭磊 陈竹敏 《计算机研究与发展》 EI CSCD 北大核心 2017年第8期1813-1823,共11页
位置服务作为一种信息共享平台,在方便人们交流和共享信息的同时,也因为用户数量的不断增加,而面临着严重的信息过载问题.如何利用推荐技术对信息进行过滤和筛选,帮助用户在位置服务中发现有价值的信息成为近年来研究的热点.但目前已有... 位置服务作为一种信息共享平台,在方便人们交流和共享信息的同时,也因为用户数量的不断增加,而面临着严重的信息过载问题.如何利用推荐技术对信息进行过滤和筛选,帮助用户在位置服务中发现有价值的信息成为近年来研究的热点.但目前已有的推荐算法,在只有消费记录这种隐性数据情况下,针对用户较少活动区域或新用户的推荐效率较低,无法最大化挖掘隐性数据所带的信息.针对以上问题,结合位置服务平台的特点,针对用户冷启动问题,提出了一种结合协同概率矩阵分解与迭代决策树(gradient boosting decision tree,GBDT)的推荐算法.该方法首先使用多层协同概率矩阵分解在多个维度上得到用户潜在特征,然后使用GBDT学习算法对特征和标签进行训练得到用户对项目的偏好,最后使用考虑约束问题的top-N推荐产生推荐列表.在真实数据集上的实验结果表明,与目前较为流行的方法相比,提出的方法能在准确率、F1值上取得较好的结果,能更好地缓解位置服务中的冷启动问题. 展开更多
关键词 推荐系统 位置服务 概率矩阵分解 冷启动问题 约束
在线阅读 下载PDF
一种信任关系强度敏感的社会化推荐算法 被引量:40
6
作者 郭磊 马军 陈竹敏 《计算机研究与发展》 EI CSCD 北大核心 2013年第9期1805-1813,共9页
为了进一步提高推荐算法的准确率,更好地对用户间的信任关系进行建模,首先提出了一种信任关系强度敏感的社会化推荐算法(StrengthMF).与以往的算法相比,该算法假设建立信任关系的两个用户之间并不一定存在着相似的兴趣爱好.在推荐过程中... 为了进一步提高推荐算法的准确率,更好地对用户间的信任关系进行建模,首先提出了一种信任关系强度敏感的社会化推荐算法(StrengthMF).与以往的算法相比,该算法假设建立信任关系的两个用户之间并不一定存在着相似的兴趣爱好.在推荐过程中,StrengthMF算法通过共享的潜在用户特征空间来对信任关系强度和用户兴趣进行建模,通过进一步识别出那些与目标用户有着共同爱好的朋友来对求解的过程进行优化.为了验证算法所估计出的信任关系强度的准确性,接着又在SocialMF算法的基础上,提出了一种使用所估计的信任关系对其重新训练和学习的InfluenceMF算法.实验结果表明,与目前较为流行的方法相比,新方法能在RMSE和MAE上取得更好的推荐结果,其所推导出的信任关系强度能进一步提高已有推荐算法的性能. 展开更多
关键词 推荐系统 概率矩阵分解 信任强度 社会化推荐 协同过滤
在线阅读 下载PDF
一种综合语义和时效性意图的检索结果多样化方法 被引量:7
7
作者 任鹏杰 陈竹敏 +2 位作者 马军 隋雪芹 吴凯 《计算机学报》 EI CSCD 北大核心 2015年第10期2076-2091,共16页
当前,检索结果多样化作为一种提升用户满意度的有效方法已成为Web和数据库检索、文本摘要及推荐系统等领域的研究热点之一.但已有研究工作大都只考虑语义多样化策略.而实际上,多样化是一个非常复杂的优化问题,还需考虑许多其他的策略,... 当前,检索结果多样化作为一种提升用户满意度的有效方法已成为Web和数据库检索、文本摘要及推荐系统等领域的研究热点之一.但已有研究工作大都只考虑语义多样化策略.而实际上,多样化是一个非常复杂的优化问题,还需考虑许多其他的策略,如新颖性、质量、价值等.众所周知,Web是一个动态的信息空间,用户的查询需求也随时间不断演化,只有在一个特定的时间模式下,检索系统才能返回满意的结果.故该文提出一种新的结合语义和时效性两个维度的查询结果多样化方法.该文首先给出了多维度查询结果多样化框架的通用定义.然后,对于给定的查询,探讨了如何基于文档、词和查询频率来计算其时效性意图的概率分布.之后,提出一种新的针对时效性多样化的评价方法.最后,构建了针对多维度多样化问题的真实数据集,并通过实验证明该文提出的方法,不管是在传统的多样化评价指标上,还是在该文提出的时效性多样化指标上,性能都超过了当前主流的基准方法. 展开更多
关键词 多维度多样化 时效性意图 子主题 语义 时间 社交网络 社会计算
在线阅读 下载PDF
多PCA模型及SVM-DS融合决策的服务机器人故障诊断 被引量:10
8
作者 袁宪锋 宋沐民 +1 位作者 周风余 陈竹敏 《振动.测试与诊断》 EI CSCD 北大核心 2015年第3期434-440,587,共7页
针对轮式服务机器人驱动系统故障诊断问题,提出一种基于多主成分分析(principal component analysis,简称PCA)模型及支持向量机和DS证据理论(support vector machine and dempster-shafer,简称SVM-DS)融合决策的故障诊断方法,分别利用... 针对轮式服务机器人驱动系统故障诊断问题,提出一种基于多主成分分析(principal component analysis,简称PCA)模型及支持向量机和DS证据理论(support vector machine and dempster-shafer,简称SVM-DS)融合决策的故障诊断方法,分别利用正常状态和故障状态下的传感器数据建立多个PCA模型。利用正常状态下的PCA模型实现故障的检测。传感器数据经多PCA模型特征提取后作为SVM的输入向量,实现故障的初步分离。基于混淆矩阵定义SVM的全局及局部可信度,并依据可信度值和故障初步分离结果完成基本概率分配函数的赋值,以实现SVM和DS证据理论在故障分离中的有效结合。实验结果表明,本研究方法能灵敏检测到机器人驱动系统故障的发生,故障分离平均正确率达92.6%,与传统单PCA模型的方法相比有更高的正确率和稳定性。 展开更多
关键词 服务机器人 故障诊断 主成分分析 支持向量机 DS证据理论
在线阅读 下载PDF
基于XML网络管理中多协议转换网关的研究 被引量:5
9
作者 陈竹敏 熊齐邦 《计算机工程与应用》 CSCD 北大核心 2005年第13期154-156,179,共4页
论文介绍了多协议转换网关的转换算法及系统模型,并利用转换网关对基于XML的网络管理通信模型进行了改进。改进后的基于XML的网络管理系统不但可以管理基于Web代理的网络设备,而且可以管理传统的基于SNMP代理的网络设备及基于Telnet(SSH... 论文介绍了多协议转换网关的转换算法及系统模型,并利用转换网关对基于XML的网络管理通信模型进行了改进。改进后的基于XML的网络管理系统不但可以管理基于Web代理的网络设备,而且可以管理传统的基于SNMP代理的网络设备及基于Telnet(SSH,SSL)代理的网络设备。 展开更多
关键词 基于XML网络管理 多协议转换网关 可扩展标记语言
在线阅读 下载PDF
基于动态主题建模的Web论坛文档摘要 被引量:8
10
作者 任昭春 马军 陈竹敏 《计算机研究与发展》 EI CSCD 北大核心 2012年第11期2359-2367,共9页
针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖... 针对论坛文档由于自身特点缺乏有效的文档摘要方法的现状,提出一种基于LDA主题模型的论坛文档摘要方法.在主题建模中考虑了Web论坛文档中帖子和帖子之间的回复关系,并把主题的分布变为随文档变化而变化的一个动态过程,来解决主题的依赖和偏移问题.在使用GibbsEM采样算法来确定动态主题模型的参数后,通过计算句子中主题权重之和来确定各个主题的重要程度;最后根据动态主题模型中主题的概率分布计算各句子的权重并得到文档的摘要.实验结果表明,新方法在各个ROUGE评测标准上均优于其他各种对比的摘要方法. 展开更多
关键词 WEB论坛 论坛文档摘要 主题建模 Gibbs EM采样 文档摘要
在线阅读 下载PDF
GeoPMF:距离敏感的旅游推荐模型 被引量:6
11
作者 张伟 韩林玉 +3 位作者 张佃磊 任鹏杰 马军 陈竹敏 《计算机研究与发展》 EI CSCD 北大核心 2017年第2期405-414,共10页
虽然目前旅游者可以利用Web搜索引擎来选择旅游景点,但往往难以获得较好符合自身需要的旅游规划.而旅游推荐系统是解决上述问题的有效方式.一个好的旅游推荐模型应具有个性化并能考虑用户时间和费用的限制.调研表明,用户在选择旅游景点... 虽然目前旅游者可以利用Web搜索引擎来选择旅游景点,但往往难以获得较好符合自身需要的旅游规划.而旅游推荐系统是解决上述问题的有效方式.一个好的旅游推荐模型应具有个性化并能考虑用户时间和费用的限制.调研表明,用户在选择旅游景点时,目的地与用户常居地的距离常常是一个需要考虑的问题.因为旅行距离往往可以间接地反映了时间和费用的影响.于是,在贝叶斯模型和概率矩阵分解模型的基础上,提出一个旅行距离敏感的旅游推荐模型(geographical probabilistic matrix factorization,GeoPMF).主要思想是基于每个用户的旅游历史,推算出一个最偏好的旅游距离,并作为一种权重,添加到传统的基于概率矩阵分解的推荐模型中.在携程网站的旅游数据集上的实验表明,与基准方法相比,GeoPMF的RMSE(root mean square error)可以降低近10%;与传统概率矩阵分解模型(PMF)相比,通过考虑距离因子,RMSE平均降幅近3.5%. 展开更多
关键词 旅游推荐 推荐系统 概率矩阵分解模型 距离敏感 GeoPMF算法
在线阅读 下载PDF
一种基于HITS算法的Blog文摘方法 被引量:7
12
作者 苗家 马军 陈竹敏 《中文信息学报》 CSCD 北大核心 2011年第1期104-109,共6页
Blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合Blog评论获取Blog文章的主要内容是许多基于Blog的应用所要面临的难题。以往提出的文摘方法大多是针对多文档文摘的通用方法,并未考虑Blog文章的特殊性,无法有效地结合... Blog文章对应了大量评论信息,评论中又包含大量的噪声,因此如何结合Blog评论获取Blog文章的主要内容是许多基于Blog的应用所要面临的难题。以往提出的文摘方法大多是针对多文档文摘的通用方法,并未考虑Blog文章的特殊性,无法有效地结合评论来处理文章。该文通过分析Blog的特点提出了一种新的结合评论信息的Blog文摘方法。该方法首先基于特征计算出评论的权重,然后结合图模型使用HITS算法得到正文句子权重,进而得到文摘句。通过在凤凰博客数据集上的实验表明,该文方法在ROUGE测度上优于以往方法。 展开更多
关键词 文档自动摘要 BLOG 评论 HITS
在线阅读 下载PDF
基于记忆网络的知识感知医疗对话生成 被引量:1
13
作者 张晓宇 李冬冬 +3 位作者 任鹏杰 陈竹敏 马军 任昭春 《计算机研究与发展》 EI CSCD 北大核心 2022年第12期2889-2900,共12页
为了解决就医过程中医疗资源短缺和患者时间不充裕、行程不便的问题,提出了结合外部知识的基于记忆网络的知识感知医疗对话生成模型(memory networks based knowledge-aware medical dialogue generation model,MKMed).该模型首先通过... 为了解决就医过程中医疗资源短缺和患者时间不充裕、行程不便的问题,提出了结合外部知识的基于记忆网络的知识感知医疗对话生成模型(memory networks based knowledge-aware medical dialogue generation model,MKMed).该模型首先通过利用精确字匹配的方法在对话历史中进行实体追踪;随后在外部实体知识数据库里设计2阶段的实体预测,筛选出可能出现在回复中的医疗实体及对应知识,其中2阶段实体预测分别利用计算共现矩阵和余弦相似度的方法;模型接着用记忆网络来存储知识和对话历史的信息;最后整合记忆网络存储的信息,并使用注意力机制以及循环神经网络生成回复.在带有外部知识的大规模医疗对话数据集KaMed上进行了相关实验,该数据集为收集自在线平台的真实数据.实验结果表明提出的模型生成的回复在流畅性、多样性、正确性和专业性等方面均显著优于大部分基准模型.证明了合理引入外部知识的医疗对话模型能产生成更有医疗价值的回复. 展开更多
关键词 医疗对话 知识感知 记忆网络 循环神经网络 注意力机制
在线阅读 下载PDF
基于衰退理论的Flickr热点事件检测方法
14
作者 薛冉 马军 +1 位作者 韩晓晖 陈竹敏 《中文信息学报》 CSCD 北大核心 2012年第6期98-108,共11页
该文提出了一种基于衰退理论对Flickr数据进行热点事件检测的方法。该方法首先将从Flickr图像中提取的视觉词汇(Visual Words)与图像的文本信息加权合并成文档。然后训练LDA模型获得文档的主题分布作为其最终向量表示。在此基础上提出... 该文提出了一种基于衰退理论对Flickr数据进行热点事件检测的方法。该方法首先将从Flickr图像中提取的视觉词汇(Visual Words)与图像的文本信息加权合并成文档。然后训练LDA模型获得文档的主题分布作为其最终向量表示。在此基础上提出了一种改进的Single-Pass算法进行事件检测,该算法不仅考虑了图片的地理位置信息,而且基于衰退理论(Aging Theory)对检测到的事件进行生命周期建模,以便计算事件在每个时间段的能量值。最后,根据能量值进行事件排序,获得给定时间段内的热点事件。在真实Flickr数据集上的实验结果表明所提出的方法在精确率、召回率和F1测度上优于传统事件检测方法。 展开更多
关键词 事件检测 视觉词汇 地理信息 LDA 衰退理论
在线阅读 下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部